Dữ liệu dọc (Longitudinal data) là gì? Đặc điểm
Mục Lục
Dữ liệu dọc
Dữ liệu dọc trong tiếng Anh là Longitudinal data.
Dữ liệu dọc, đôi khi được gọi là dữ liệu bảng, là dữ liệu được thu thập thông qua một loạt các quan sát lặp đi lặp lại của cùng một đối tượng trong một số khung thời gian kéo dài, và rất hữu ích để đo lường sự thay đổi.
Dữ liệu dọc theo dõi hiệu quả một mẫu dữ liệu theo thời gian. Về cơ bản, dữ liệu dọc khác với dữ liệu ngang (cross-sectional data) ở chỗ nó theo dõi cùng một đối tượng theo thời gian, trong khi dữ liệu ngang lấy mẫu các đối tượng khác nhau (có thể là cá nhân, công ty, quốc gia hoặc khu vực) tại cùng một thời điểm. Một bộ dữ liệu ngang sẽ luôn tạo ra những mẫu ngẫu nhiên mới.
Dữ liệu dọc được sử dụng rộng rãi trong các ngành khoa học xã hội, bao gồm cả các kinh tế, khoa học chính trị và xã hội.
Đặc điểm của Dữ liệu dọc
Dữ liệu dọc thường được sử dụng trong các nghiên cứu kinh tế và tài chính vì nó có một số lợi thế so với dữ liệu ngang lặp đi lặp lại. Ví dụ, vì dữ liệu dọc đo lường các sự kiện kéo dài trong bao lâu, nên có thể sử dụng để xem liệu cùng một nhóm các cá nhân có thất nghiệp trong thời kì suy thoái hay không, hoặc các cá nhân khác nhau có tìm được việc làm hay không. Điều này có thể giúp xác định các yếu tố ảnh hưởng nhất đến thất nghiệp.
Phân tích theo chiều dọc cũng có thể được sử dụng để tính toán giá trị danh mục đầu tư rủi ro, sử dụng phương pháp mô phỏng lịch sử. Phương pháp này mô phỏng hướng mà giá trị của danh mục đầu tư hiện tại dao động trong khoảng thời gian trước đó, thông qua sử dụng biến động lịch sử quan sát được của tài sản trong danh mục đầu tư trong khoảng thời gian đó. Nó cung cấp một ước tính về tổn thất tối đa có thể trong khoảng thời gian tiếp theo.
Dữ liệu dọc cũng được sử dụng trong các nghiên cứu sự kiện để phân tích yếu tố nào thúc đẩy lợi nhuận cổ phiếu bất thường theo thời gian, hoặc cách giá cổ phiếu phản ứng với thông báo sáp nhập và thu nhập. Nó cũng có thể được sử dụng để đo lường sự đói kém và bất bình đẳng thu nhập bằng cách theo dõi từng hộ gia đình.
Ngoài ra, trong giáo dục, do điểm chuẩn của các trường học là dữ liệu dọc, chúng có thể được sử dụng để đánh giá hiệu quả của giáo viên và các yếu tố khác ảnh hưởng đến kết quả học tập của học sinh.
Các nhà khoa học xã hội cũng sử dụng dữ liệu dọc để cố gắng tìm hiểu nguyên nhân của các sự kiện có thể xảy ra trong quá khứ và cách chúng dẫn đến kết quả quan sát được trong các đợt dữ liệu sau này. Ví dụ, các nhà khoa học có thể quan sát hiệu lực của việc thông qua một đạo luật mới về thống kê tội phạm, hoặc một thảm họa tự nhiên nhiều năm sau.
(Theo Investopedia)