Các mô hình hồi quy biến phụ thuộc giới hạn Domadar N. Gujarati

21 212 0
Các mô hình hồi quy biến phụ thuộc giới hạn Domadar N. Gujarati

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 11 Các mơ hình hồi quy biến phụ thuộc giới hạn Domadar N Gujarati (Econometrics by example, 2011) Người dịch diễn giải: Phùng Thanh Bình, MB (29/12/2017) Trong mơ hình logit probit thảo luận trước đây, biến phụ thuộc giả định có giá trị 1, đại diện cho khơng có thuộc tính đại diện cho có thuộc tính đó, chẳng hạn hút thuốc không hút thuốc, sở hữu nhà hay không sở hữu nhà, thuộc khơng thuộc cơng đồn Như lưu ý, mơ hình logit sử dụng phân phối xác suất logistic mơ hình probit sử dụng phân phối chuẩn Chúng ta biết chương ước lượng giải thích mơ nào, thơng qua ví dụ minh họa hành vi hút thuốc Nhưng xem xét vấn đề này: người hút gói thuốc, cho trước biến kinh tế - xã hội người ấy? Bây câu hỏi có ý nghĩa người hút thuốc; người khơng hút thuốc khơng quan tâm đến câu hỏi Trong ví dụ người hút thuốc thảo luận chương 8, có mẫu gồm 1.196 người, khoảng 38% hút 62% khơng hút Vì thu thập thơng tin số gói thuốc hút cho 38% số người mẫu Giả sử xem xét mẫu gồm người hút thuốc cố gắng ước lượng hàm cầu số gói thuốc hút ngày dựa thông tin kinh tế - xã hội người hút thuốc Hàm cầu tin cậy bỏ qua 62% người mẫu 1.196 người? Như bạn hồi nghi, hàm cầu có lẽ khơng thể tin cậy Vấn đề có mẫu kiểm duyệt (censored sample), mẫu thơng tin biến phụ thuộc sẵn có cho số quan sát khơng sẵn có cho tất quan sát, có thơng tin biến giải thích cho tất đơn vị mẫu Có lẽ cần lưu ý biến phụ thuộc có bị kiểm duyệt phía trái (left-censored) [nghĩa khơng thể nhận giá trị ngưỡng định, điển hình, khơng phải ln ln, 0] bị kiểm duyệt phía phải (right-censored) [nghĩa khơng thể nhận giá trị ngưỡng định, ví dụ người ta kiếm triệu đơla thu nhập], bị kiểm duyệt hai phía trái phía phải Một mơ hình có quan hệ gần khác chút so với mơ hình có mẫu kiểm duyệt mơ hình mẫu bị xén (truncated sample model), thơng tin biến phụ thuộc biến giải thích khơng có sẵn cho số quan sát Điều thiết kế, thí nghiệm thuế thu nhập âm New Jersey liệu người với thu nhập cao 1.5 lần mức thu nhập ngưỡng nghèo đói năm 1967 không đưa vào reong mẫu1 Rồi ước lượng mơ nào, mơ hình gọi mơ hình hồi quy biến phụ thuộc giới hạn (limited dependent variable regression models) giới hạn gán lên giá trị nhận biến phụ thuộc? Trước hết thảo luận mơ hình hồi quy kiểm duyệt (censored regression model) sau thảo luận ngắn gọn mơ hình hồi quy bị xén (truncated regression model) Cũng nhiều mơ hình khác sách này, trọng tâm áp dụng thực tế Xem J A Hausman and D A Wise, Social Experimentation, NBER Economic Research Conference Report, University of Chicago Press, Chicago, 1985 11.1 Các mơ hình hồi quy kiểm duyệt Một mơ hình sử dụng phổ biến tình mơ hình Tobit (Tobit model), phát triển James Tobin, nhà kinh tế nhận giải Nobel2 Trước thảo luận mơ hình Tobit, trước hết thảo luận OLS áp dụng cho mẫu kiểm duyệt Xem Table 11.1, có sẵn trang web đồng hành sách Ước lượng OLS cho liệu kiểm duyệt Với mục đích này, sử dụng liệu thu thập Mroz3 Mẫu ông ta cung cấp liệu 753 phụ nữ có gia đình, có 428 người làm bên ngồi 325 người khơng làm bên ngồi, mà số làm việc họ Một số biến kinh tế - xã hội có ảnh hưởng đến định làm xem xét Mroz tuổi, giáo dục, kinh nghiệm, kinh nghiệm bình phương, thu nhập gia đình, số tuổi, tiền lương chồng Table 11.1 cung cấp liệu biến khác xem xét Mroz Áp dụng OLS số làm việc mối quan hệ với biến kinh tế xã hội tất quan sát, có kết Bảng 11.2 Các kết bảng giải thích theo khn khổ mơ hình hồi quy tuyến tính chuẩn Như bạn biết, mơ hình hồi quy tuyến tính hệ số dốc cho biết ảnh hưởng biên biến lên giá trị trung bình biến phụ thuộc, tất biến khác mơ hình giữ ngun khơng đổi Ví dụ, tiền lương chồng tăng thêm đôla, số làm việc trung bình phụ James Tobin (1958) Estimation of Relationship for Limited Dependent Variables, Econometrica, vol 26, pp 24 – 36 Xem T A Mroz, (1987) The sensitivity of an empirical model of married women’s hours of work to economic and statistical assumptions, Econometrica, vol 55, pp 765 – 99 Nhớ lại sử dụng liệu chương thảo luận đa cộng tuyến nữ có gia đình giảm khoảng 71 giờ, tất biến khác giữ nguyên không đổi Ngoại trừ hệ số biến giáo dục, tất hệ số khác dường có ý nghĩa thống kê cao Nhưng cẩn thận với kết này, mẫu có 325 người có làm việc Bảng 11.2: Ước lượng OLS hàm số làm việc Giả sử, thay sử dụng tất quan sát mẫu, sử dụng liệu 428 phụ nữ làm Kết OLS dựa vào mẫu (kiểm soát) cho Bảng 11.3 Nếu bạn so sánh kết Bảng 11.2 11.3, bạn thấy số khác biệt rõ rệt hai kết này4 Biến giáo dục dường có ý nghĩa cao, lại có dấu âm Nhưng nên cẩn thận kết Bảng 11.3: Ước lượng OLS hàm số làm việc phụ nữ làm Điều giá trị ước lượng OLS mơ hình hồi quy kiểm duyệt, dù có bao gồm tồn mẫu (Hình 11.1) hay tập mẫu (Hình 11.2), bị chệch khơng qn – nghĩa là, cho dù cỡ mẫu lớn bao nhiêu, tham số ước lượng khơng hội tụ giá trị trung bình Trong mơ hình hồi quy truyền thống, giá trị trung bình hạng nhiễu ui giả định 0, khơng có đảm bảo điều sử dụng tập giá trị mẫu, ví dụ chúng5 Lý điều thật mơ hình hồi quy kiểm duyệt mơ hình hồi quy bị xén, trung bình có điều kiện hạng nhiễu, ui, không hạng nhiễu có tương quan với biến giải thích Như biết, hạng nhiễu biến giải thích có tương quan, ước lượng OLS bị chệch khơng qn [Xem chương 19] Hình 11.1: Số làm việc thu nhập, mẫu đầy đủ [ Để hiểu sơ qua lý giá trị ước lượng OLS bị chệch không quán, vẽ đồ thị số làm việc theo thu nhập gia đình Một chứng minh chặt chẽ, xem Jeffrey M Wooldridge, Introductory Econometrics: A Modern Approach, SouthWestern, USA, 4th edn, 2006, Ch.17 Cũng nên xem Christaan Heij, Paul de Boer, Philip Hans Franses, Teun Kloek, and Herman K van Dijk, Econometric Methods with Applications in Business and Economics, Oxford University Press, Oxford, UK, 2004, Ch 6 Hình 11.1 số làm việc thu nhập gia đình cho phụ nữ làm Hình 11.2 Hình 11.2: Số làm việc thu nhập cho phụ nữ làm Trong Hình 11.1, có nhiều quan sát (thực 325 quan sát) nằm trục hồnh quan sát có số làm việc Trong Hình 11.2, khơng có quan sát nằm trục hồnh, quan sát cho 428 phụ nữ làm Các hệ số dốc đường hồi quy hai đồ thị dĩ nhiên khác Một phương pháp sử dụng phổ biến để giải mẫu kiểm duyệt mơ hình Tobit, thảo luận mơ hình 11.2 Ước lượng ML mơ hình hồi quy kiểm duyệt: mơ hình Tobit Một số mơ hình hồi quy mẫu kiểm duyệt sử dụng phổ biến mơ hình Tobit Có nhiều biến thể mơ hình Tobit, xem xét mơ hình đơn giản nhất, gọi mơ hình Tobit chuẩn (standard Tobit model)6 Chúng ta tiếp tục với liệu Mroz Để biết quan sát kiểm duyệt xử lý nào, thực sau: Cho Trong đó, Yi* số làm việc mong muốn (desired hours of work) Bây Trong đó, ui ~ N(0, 2) Yi số làm việc thực tế7 Các biến giải thích tuổi tính theo năm, giáo dục tính theo số năm học, kinh nghiệm làm việc tính theo năm, số tuổi, thu nhập gia đình tính theo ngàn đơla, tiền lương theo chồng Biến Yi* gọi biến tiềm ẩn (latent variable), biến quan tâm Dĩ nhiên, thực khơng quan sát biến cho tất quan sát Chúng ta quan sát quan sát có số làm việc Một thảo luận chi tiết, nâng cao tìm thấy A Colin Cameron and Pravin K Trivedi, Microeconometrics: Methods and Applications, Cambridge University Press, New York, 2005, Chapter 16 Bạn sử dụng phân phối xác suất giá trị cực đại logistic thay phân phối chuẩn dương kiểm duyệt Nhớ lại thảo luận khái niệm biến tiềm ẩn chương trước8 Lưu ý giả định hạng nhiễu theo phân phối chuẩn với trung bình phương sai cố định (phương sai khơng đổi) Chúng ta phải nói nhiều giả định sau Trước tiếp, điều hữu ích cần lưu ý khác biệt mơ hình probit mơ hình Tobit Trong mơ hình probit, Yi = Yi* lớn 0, biến tiềm ẩm Trong mơ hình Tobit, Yi nhận giá trị miễn biến tiềm ẩn lớn Đó lý mơ hình Tobit gọi probit Tobin Để ước lượng mơ hình mà số quan sát biến phụ thuộc bị kiểm duyệt (bởi chúng khơng quan sát), mơ hình Tobit sử dụng phương pháp hợp lý tối đa (ML), mà gặp nhiều trường hợp9 Các chế thực phương pháp ML cho mơ hình Tobit phức tạp, Stata, Eviews phần mềm khác ước lượng hình dễ dàng10 Sử dụng Eviews 6, có kết Bảng 11.4 cho ví dụ số làm việc phụ nữ có gia đình Giải thích giá trị ước lượng mơ hình Tobit Chúng ta giải thích kết nào? Nếu bạn xem xét dấu biến giải thích khác nhau, bạn thấy chúng giống Bảng 11.2 11.3 Và mặc định tính, chúng có ý nghĩa Ví dụ, tiền lương chồng tăng lên, trung bình, phụ nữ làm việc thị trường lao động, tất yếu tố khác giữ nguyên không đổi Biến giáo dục Trong ngữ cảnh tại, giải thích biến tiềm ẩn khuynh hướng mong muốn làm phụ nữ có gia đình Có số phương pháp thay ước lượng ML, số tìm thấy sách Greene, op cit 10 Chi tiết phương pháp ML Tobin tìm thấy Christiaan Heij, op cit khơng có ý nghĩa thống kê Bảng 11.2, có ý nghĩa Bảng 11.3, có dấu âm Trong Bảng 11.4, có ý nghĩa thống kê có dấu dương, điều có ý nghĩa Các hệ số dốc biến giải thích khác Bảng 11.4 cho biết tác động biên biến lên giá trị trung bình biến tiềm ẩn Yi*, thực tế quan tâm đến tác động biên biến giải thích lên giá trị trung bình Yi, tức giá trị thực quan sát mẫu Bảng 11.4: Ước lượng ML mơ hình hồi quy kiểm duyệt 10 Không may, không giống giá trị ước lượng OLS Bảng 11.2, giải thích hệ số Tobit biến giải thích tác động biên biến giải thích lên giá trị trung bình biến phụ thuộc quan sát Điều mơ hình hồi quy kiểm duyệt loại Tobit, thay đổi đơn vị giá trị biến giải thích có hai ảnh hưởng: (1) ảnh hưởng lên giá trị trung bình biến phụ thuộc quan sát, (2) ảnh hưởng lên xác suất mà Yi* thực quan sát11 Ví dụ, lấy tác động biến tuổi Hệ số biến tuổi khoảng -54 Bảng 11.4 có nghĩa rằng, biến khác giữ nguyên không đổi, tuổi tăng thêm năm, tác động trực tiếp lên số làm việc năm giảm khoảng 54 năm xác suất mà người phụ nữ tham gia lực lượng lao động giảm Vì thế, phải nhân -54 với xác suất mà điều xảy Trừ biết xác suất này, khơng thể tính tác động tổng gộp tăng thêm tuổi lên số làm việc Và việc tính tốn xác suất phụ thuộc vào tất biến giải thích mơ hình hệ số chúng Thật thú vị, hệ số dốc cho biết tác động biên cách trực tiếp biến giải thích lên biến tiềm ẩn, Yi*, lưu ý trước Vì thế, hệ số biến tuổi -54 có nghĩa tuổi tăng lên năm, số làm việc mong muốn giảm 54 giờ, yếu tố khác giữ nguyên không đổi Dĩ nhiên, thực không quan sát số làm việc mong muốn, cấu trúc trừu tượng (abstract contruct) Trong ví dụ chúng ta, có 753 quan sát Đó cơng việc thời gian để tính tốn tác động biên biến giải thích cho tất 753 quan Nghĩa là, [Y | Xi]/Xi = Bi*Pr(0 < Yi* < ) xác suất phụ thuộc vào tất biến giải thích mơ hình hệ số chúng 11 11 sát Trong thực tế, tính tốn tác động biên giá trị trung bình biến giải thích Vì xác suất Y* phải nằm 1, nên tích hệ số dốc nhân với xác suất nhỏ (theo giá trị tuyệt đối) thân hệ số dốc Vì thế, tác động biên biến giải thích lên giá trị trung bình biến phụ thuộc quan sát nhỏ (theo giá trị tuyệt đối) giá trị hệ số dốc Bảng 11.4 Dấu tác động biên phụ thuộc vào dấu hệ số dốc, xác suất để quan sát Yi* luôn dương Các phần mềm Stata Eviews tính tốn tác động biên biến giải thích Ý nghĩa thống kê hệ số ước lượng Bảng 11.4 trình bày sai số chuẩn, thống kê Z (các giá trị phân phối chuẩn hóa) giá trị xác suất p hệ số ước lượng12 Như bảng kết hồi quy cho thấy tất hệ số có ý nghĩa thống kê mức ý nghĩa 10% thấp Với mơ hình Tobit, khơng có thước đo thơng thường R2 Điều mơ hình hồi quy tuyến tính chuẩn ước lượng tham số cách tối thiểu hóa tổng bình phương phần dư (RSS), mơ hình Tobit tối đa hóa hàm hợp lý (likelihood function) Nhưng bạn muốn tính R2 tương đương với R2 thơng thường, bạn làm cách bình phương hệ số tương quan giá trị Y thực tế giá trị Y ước lượng từ mơ hình Tobit Kiểm định biến bị bỏ sót biến thừa thực khn khổ kiểm định với mẫu lớn thông thường, chẳng hạn tỷ số hợp lý (LR), Wald, nhân tử Lagrange (L) Thử điều cách đưa thêm biến kinh nghiệm bình phương vào mơ hình biến giáo dục cha biến giáo dục mẹ vào mơ hình 12 Bởi cỡ mẫu lớn, nên sử dụng phân phốn chuẩn phân phối t 12 Những cảnh báo trước Trong mơ hình Tobit, giả định hạng nhiễu theo phân phối chuẩn với trung bình phương sai cố định (tức phương sai không đổi) Sự không chuẩn hạng nhiễu Trong mơ hình hồi quy kiểm duyệt phân phối khơng chuẩn hạng nhiễu ước lượng không quán Một lần nữa, vài phương pháp khắc phục đề xuất lý thuyết Một cách khắc phục thay đổi giả định phân phối hạng nhiễu Ví dụ, Eviews ước lượng mơ giả định phân phối xác suất khác cho hạng nhiễu (chẳng hạn logistic extreme value) Một thảo luận chi tiết, bạn xem sách Maddala Wooldridge13 Phương sai thay đổi Trong mơ hình hồi quy tuyến tính thơng thường, hạng nhiễu có phương sai thay đổi, ước lượng OLS quán không hiệu Tuy nhiên, mơ hình kiểu Tobit, ước lượng khơng qn khơng hiệu Có vài phương pháp để xử lý vấn đề này, thảo luận chi tiết đưa xa14 Tuy nhiên, phần mềm thống kê Stata Eviews tính tốn sai số chuẩn cải thiện (robust standard errors), trình bày Bảng 11.5 Như bạn thấy, khơng có khác biệt lớn sai số chuẩn ước lượng hai bảng, điều luôn 13 Một thảo luận chi tiết nâng cao, xem G S Maddala, Limited Dependent and Qualitative Variables in Econometrics, Cambridge University Press, Cambridge, UK, 1983; Wooldridge, J M., Econometric Analysis of Cross and Panel Data, MIT Press, Cambridge, MA, 2002 14 Một thảo luận nâng cao, xem Maddala Wooldridge, op cit 13 Bảng 11.5: Ước lượng sai số chuẩn cải thiện mơ hình Tobit [ 11.3 Các mơ hình hồi quy mẫu bị xén Trước thảo luận khác biệt mơ hình hồi quy mẫu kiểm duyệt mẫu bị xén Sau thảo luận mơ hình hồi quy mẫu kiểm duyệt, tập trung vào mơ hình hồi quy mẫu bị xén Trong mẫu bị xén khơng có thơng tin biến phụ thuộc, không thu thập thông tin biến giải thích mà biến có quan hệ với biến phụ thuộc Trong ví dụ minh họa chúng ta, khơng có liệu số làm việc 325 phụ nữ Vì thế, 14 khơng xem xét đến thông tin biến kinh tế - xã hội quan sát này, có thơng tin biến ví dụ Bảng 11.6: Ước lượng ML mơ hình hồi quy bị xén Thì khơng ước lượng hàm số làm việc cho tập mẫu gồm 428 phụ nữ làm việc phương pháp OLS? Sự thật làm Bảng 11.2 Tuy nhiên, ước lượng OLS không quán trường hợp Vì mẫu bị xén, nên giả định hạng nhiễu mơ hình theo phân phối chuẩn với trung bình  phương sai 2 khơng thể thỏa mãn Vì thế, phải sử dụng phân phối chuẩn bị xén (truncated normal 15 distribution) Trong trường hợp đó, phải sử dụng phương pháp ước lượng phi tuyến, chẳng hạn phương pháp ML Sử dụng ML, có kết Bảng 11.6 Nếu bạn so sánh kết với kết OLS cho Bảng 11.2, bạn thấy khác biệt rõ ràng, dấu hệ số giống Nếu bạn so sánh kết hồi quy kiểm duyệt cho Bảng 11.5 với hồi quy bị xén cho Bảng 11.6, lần bạn thấy khác biệt độ lớn ý nghĩa hệ số Đặc biệt lưu ý hệ số biến giáo dục dương mơ hình hồi quy kiểm duyệt, âm mơ hình hồi quy bị xén Giải thích hệ số hồi quy bị xén Như mơ hình Tobit, hệ số hồi quy riêng lẻ đo lường ảnh hưởng biên biến lên giá trị trung bình biến phụ thuộc cho tất quan sát – nghĩa là, bao gồm quan sát không đưa vào Nhưng xem xét quan sát mẫu (bị xén), hệ số hồi quy (riêng) thích hợp phải nhân với thừa số nhỏ Vì thế, ảnh hưởng biên mẫu (within-sample) biến giải thích nhỏ (theo giá trị tuyệt đối) giá trị hệ số biến đó, trường hợp mơ hình Tobit Mơ hình hồi quy Tobit với mơ hình hồi quy bị xén Bây giờ, mơ hình hồi quy kiểm duyệt bị xén, mơ hình tốt hơn? Vì mơ hình hồi quy Tobit sử dụng nhiều thông tin (753 quan sát) mơ hìnhhồi quy bị xén (428 quan sát), nên giá trị ước lượng có từ mơ hình Tobit kỳ vọng hiệu hơn15 15 Về mặt kỹ thuật, kết từ thật hàm hợp lý Tobit tổng hàm hợp lý mơ hình hồi quy bị xén hàm hợp lý probit 16 11.4 Tóm tắt kết luận Trong chương thảo luận chất mơ hình hồi quy kiểm duyệt Mấu chốt khái niệm biến tiềm ẩn, biến mà, thực chất quan trọng, có lẽ khơng thể ln ln quan sát Điều dẫn đến mẫu kiểm duyệt liệu biến phụ thuộc khơng có sẵn cho nhiều quan sát, liệu biến giải thích có sẵn cho tất quan sát Trong nhiều trường hợp này, ước lượng OLS bị chệch không quán Giả định hạng nhiễu theo phân phối chuẩn với trung bình phương sai khơng đổi, ước lượng mơ hình hồi quy kiểm duyệt theo phương pháp hợp lý tối đa (ML) Vì ước lượng thu quán Các hệ số dốc ước lượng ML cần phải giải thích cách cẩn thận Mặc dù giải thích hệ số dốc tác động biên biến lên giá trị trung bình biến tiềm ẩn, giữ nguyên biến khác không đổi, giải thích theo giá trị quan sát biến tiềm ẩn Ở phải nhân hệ số dốc với xác suất quan sát biến tiềm ẩn Và xác suất phụ thuộc vào tất biến giải thích hệ số chúng Tuy nhiên, phần mềm thống kê đại làm điều cách tương đối dễ dàng Một cảnh báo quan trọng ước lượng ML quán giả định hạng nhiễu thích hợp Trong trường hợp phương sai thay đổi hạng nhiễu khơng theo phân phối chuẩn, ước lượng ML không quán Các phương pháp thay cần tham khảo trường hợp Vài giải pháp sẵn có lý thuyết Tuy nhiên, tính sai số chuẩn cải thiện, minh họa ví dụ cụ thể 17 Mơ hình hồi quy bị xén khác mơ hình hồi quy kiểm duyệt điểm mơ hình hồi quy bị xén quan sát giá trị biến giải thích có liệu biến phụ thuộc Trong mơ hình hồi quy kiểm duyệt, có liệu biến giải thích cho tất giá trị biến phụ thuộc kể giá trị biến phụ thuộc không quan sát bị gán giới hạn Trong thực tế, mơ hình hồi quy kiểm duyệt ưa thích mơ hình hồi quy bị xén mơ hình hồi quy kiểm duyệt sử dụng tất quan sát mẫu, trong mơ hình hồi quy bị xén sử dụng quan sát mẫu bị xén Cuối cùng, thật có phần mềm để ước lượng mơ hình hồi quy kiểm duyệt khơng có nghĩa mơ hình loại Tobit phù hợp tất tình Một số tình nhiều mơ khơng thể áp dụng thảo luận tài liệu tham khảo chương này./ 18 Hướng dẫn Stata (😊) use "D:\My Blog\Econometrics by example\Table11_1.dta", clear 19 tobit hours age educ exper expersq faminc kidsl6 hwage, ll(0) robust 20 marginsplot -60 -50 -40 -30 -20 Average Marginal Effects of age with 95% CIs 20 30 40 50 Wife's age quietly truncreg hours age educ exper expersq faminc kidsl6 hwage, ll(0) robust margins, dydx(age) predict(e(0, 4950)) at(age=(20 30 40 50)) ‘ marginsplot -30 -20 -10 Average Marginal Effects of age with 95% CIs 20 30 40 Wife's age 21 50

Ngày đăng: 12/05/2018, 11:51

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan