Phát hiện và khắc phục hiện tượng tự tương quan ở 1 bộ số liệu cụ thể.doc

22 9K 45
Phát hiện và khắc phục hiện tượng tự tương quan ở 1 bộ số liệu cụ thể.doc

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phát hiện và khắc phục hiện tượng tự tương quan ở 1 bộ số liệu cụ thể.

1. BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN1.1. Định nghĩaThuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu Ui nghĩa là:Cov(Ui , Uj ) = 0 (i≠j) (7.1)Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác.Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:Cov(Ui , Uj ) ≠ 0 (i≠j) (7.2)1.2. Nguyên nhân của tự tương quan1.2.1. Nguyên nhân khách quan- Quán tính:Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính. Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kỳ. Chẳng hạn nếu chúng ta đầu của thời kỳ khôi phục kinh tế tổng sản phẩm có xu hướng đi lên. Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau.- Hiện tượng mạng nhện: Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu hiện dưới dạng hàm:Yt = 1β + 2βPt – 1 + Ut (7.3)Giả sử cuối thời kỳ t giá lạc Pt < Pt – 1 , do đó trong thời kỳ t + 1 những người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t. Điều này sẽ dẫn đến mô hình mạng nhện.- Trễ:Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng thu nhập, chúng ta thấy rằng tiêu dùng thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng thời kỳ trước đó, nghĩa là:Yt = 1β + 2βXt + 3βYt – 1 + Ut (7.4)Trong đó: Yt: Tiêu dùng thời kỳ t. Xt: Thu nhập thời kỳ t. Yt – 1: Tiêu dùng thời kỳ t – 1. Ut: Nhiễu. 1β, 2β, 3β: Các hệ số.Chúng ta có thể lý giải mô hình (7.4) như sau: Người tiêu dùng thường không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễ trong (7.4), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùng thời kỳ trước lên tiêu dùng thời kỳ hiện tại.1.2.2. Nguyên nhân chủ quan- Xử lý số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu làm giảm sự dao động trong số liệu tháng. Chính sự làm trơn này gây ra tự tương quan.- Sai lệch do lập mô hình:Đây là nguyên nhân thuộc về lập mô hình. Có hai loại sai lầm có thể gây ra hiện tượng tự tương quan:Một là: không đưa đủ các biến vào trong mô hìnhHai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan.1.3. Ước lượng bình phương nhỏ nhất khi có tự tương quanTa xét mô hình:Yt = 1β + 2βXt + Ut (7.5)Trong đó: t ký hiệu quan sát thời điểm t (giả thiết ta đang nghiên cứu số liệu dạng chuỗi thời gian).Với giả thiết tổng quát cov(Ut, Ut + s) ≠ 0 (s ≠ 0). Ta có thể giả thiết nhiễu sản sinh ra theo cách sau:Ut = ρUt – 1 + tε (-1 < ρ < 1) (7.6)Trong đó: ρ gọi là hệ số tự tương quan, tε là nhiễu ngẫu nhiên thoả mãn các giả thiết thông thường của phương pháp bình phương nhỏ nhất:2)var()0(0),cov(0)(σεεεε=≠==+tstttsE(7.7)Lược đồ (7.7) gọi là lược đồ tự hồi quy bậc nhất Markov. Chúng ta ký hiệu lược đồ đó là AR(1). Nếu Ut có dạng:Ut = 1ρUt – 1 + 2ρUt – 2 + tε Là lược đồ tự hồi quy bậc 2 ký hiệu AR(2).Bằng phương pháp bình phương nhỏ nhất ta tính được:∑∑===niiniiixyx1212ˆβNhưng phương sai của nó trong lược đồ AR(1), bây giờ là:Nếu không có tự tương quan thì: Ta thấy: cộng với một số hạng phụ thuộc vào ρ . Nếu ρ = 0 thì: Nếu tiếp tục dùng phương pháp OLS điều chỉnh công thức phương sai thông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ước lượng không chệch tốt nhất nữa.1.4. Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quanGiả sử chúng ta tiếp tục xét mô hình 2 biến có quá trình AR(1) bằng phương pháp bình phương nhỏ nhất tổng quát đã xét từ chương trước ta thu được: CxxyyxxntttntttttG+−−−=∑∑=−=−221212)())((ρρρβ (7.8)Trong đó C là hiệu số điều chỉnh có thể bỏ qua trong thực tế.Và phương sai của nó được cho bởi công thức:Var(G2β) = Dxxnttt+−∑=−2212)(ρσ (7.9)Trong đó D cũng là hệ số điều chỉnh mà ta có thể bỏ qua trong thực hành.1.5. Hậu quả- Ước lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa.- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là chệch thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần.- Các kiểm định t F nói chung không đáng tin cậy.- 222ˆ)(ˆσσσkn−= cho ước lượng chệch của 2σthực, trong một số trường hợp, nó dường như ước lượng thấp 2σ.- R2 có thể là độ đo không đáng tin cậy cho R2 thực.- Các phương sai sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả.2,PHÁT HIỆNTỰ TƯƠNG QUAN2.1. Phương pháp đồ thị Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ điển gắn với các nhiễu Ut , nhưng không quan sát được, ta chỉ có thể quan sát các phần dư et. Mặc dù et không hoàn toàn giống như Ut nhưng quan sát các phần dư et có thể gợi ý cho ta những nhận xét về UtCó nhiều cách khác nhau để xem xét các phần dư. Chẳng hạn chúng ta có thể đơn thuần vẽ đồ thị của et theo thời gian như hình dưới:Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của chúng → Nó ủng hộ cho giả thiết không có sự tương quan trong mô hình hồi quy tuyến tính cổ điển.Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặc giảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển. Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian. 2.2. Phương pháp kiểm định số lượng2.2.1. Kiểm định các đoạn mạchKiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không.2.2.2. Kiểm định 2χ về tính độc lập của các phần dưĐể kiểm định 2χ về tính độc lập của các phần dư ta sử dụng bảng liên tiếp. Bảng liên tiếp mà chúng ta sử dụng đây gồm một số dòng một số cột, cụ thể là bảng liên tiếp 2 dòng 2 cột.2.2.3. Kiểm định d.Durbin – WatsonLà kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa như sau:d = ∑∑==−−nttnttteee12221)( (7.10)d ≈ 2(1 - ρˆ) (7.11)Trong đó:∑∑==−=nttnttteee1221ˆρ (7.12)Vì -1 ≤ ≤ρ 1 nên 0 ≤≤d 4.Nếu ρ = -1 thì d =4: tự tương quan ngược chiềuNếu ρ = 0 thì d = 2: không có tự tương quanNếu ρ = 1 thì d = 0: tồn tại tự tương quan thuận chiều (1) (2) (3) (4) (5) 0 dl du 2 4-du 4-dl 4d ∈ (1): tồn tại tự tương quan thuận chiềud ∈ (2): không xác địnhd ∈ (3): không có tự tương quand ∈ (4): không xác địnhd ∈ (5): tồn tại tự tương quan ngược chiềuKiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan chuỗi bậc 1. Đôi khi Kiểm định Durbin – Watson không cho kết luận.2.2.4. Kiểm định Breusch – Godfrey (BG)Để đơn giản ta xét mô hình giản đơn: Yt = ttUX++21ββTrong đó: Ut = tptpttUUUερρρ++++−−− .2211, tε thoả mãn các giả thiết của OLS.Giả thiết: H0 : 0 .21====pρρρKiểm định như sau:Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS. Từ đó thu được các phần dư et. Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:et = tptptttveeeX++++++−−−ρρρββ .221121Từ kết quả ước lượng mô hình này thu được R2Bước 3: Với n đủ lớn, (n - p)R2 có phân bố xấp xỉ 2χ(p).Nếu (n - p)R2 > 2αχ(p) thì H0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan một bậc nào đó. Trong trường hợp ngược lại không tồn tại tự tương quan.2.2.5. Kiểm định Durbin h Ta xét mô hình: Yt = tttuXX +++−1210αααThống kê kiểm định này được gọi là thống kê h được tính theo công thức sau:h = ρˆ)ˆ(12αnVarn− (7.13)Trong đó n là cỡ mẫu, Var(2ˆα) là phương sai của hệ số của biến trễ Yt-1.ρˆ là ước lượng của tương quan chuỗi bậc nhất ρ từ phương trình:∑∑==−=nttnttteee1221ˆρKhi n lớn, Durbin đã chỉ ra rằng nếu ρ = 0 thì thống kê h tuân theo phân phối chuẩn hoá – N(0,1).Trong thực hành không cần tính ρˆ vì ρˆ có thể tính được xấp xỉ bằng công thức:21ˆd−≈ρTrong đó d là thống kê d – thông thường. Thay biểu thức của ρˆ vào ta được công thức cho thống kê h như sau:h )21(d−≈)ˆ(12αnVarn− (7.14)Vậy để áp dụng thống kê h phải:- Ước lượng mô hình Yt = tttVYX+++−1210ααα bằng phương pháp bình phương bé nhất.- Tính Var(2ˆα).- Tính 21ˆd−=ρ. - Tính h theo công thức h )21(d−≈)ˆ(12αnVarn−.- Quy tắc quyết đinh: Vì h ≈ N(0,1) nên P(-1,96 ≤≤h 1,96) = 0,95.2.2.6. Phương pháp khác: Kiểm định Correlogram( trong tập bài giảng kinh tế lượng – biên soạn: ThS Hoàng Thị Hồng Vân).Một phương pháp khác giúp nhận dạng AR là kiểm định Q. Để thực hiện kiểm định này chúng ta cần xem xét một khái niệm “tự tương quan” (AutoCorrellation – AC)Giả thuyết kiểm định:Trị số thống kê kiểm định (Box-Lung):3. BIỆN PHÁP KHẮC PHỤC TỰ TƯƠNG QUAN3.1. Khi cấu trúc của tự tương quan là đã biếtVì các nhiễu tU không quan sát được nên tính chất của tương quan chuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn. Trong thực hành, người ta thường giả sử rằng tU theo mô hình tự hồi quy bậc nhất nghĩa là: [...]... 209000 217 000 2 410 00 418 000 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 15 269350 15 295950 15 252700 15 263650 15 2 617 50 15 259850 15 260800 15 257950 15 258900 15 256050 15 2 513 00 15 249400 15 247500 15 245600 15 244650 15 243700 15 2 418 00 15 242750 15 240850 15 238950 15 237050 15 238950 15 23 610 0 15 237050 15 234200 12 210 00 11 88000 12 69000 13 17000 12 69000 13 17000 14 78000 17 02000 18 79000 2040000 215 2000... 9523 416 9523299 952 211 3 9520926 9520689 9520096 9 518 553 9520 216 9 517 960 9 516 773 9 515 586 9 518 200 9 514 636 9 516 656 9 513 450 640073.4 6860 51. 8 823023 762575.6 762575.6 729575.6 822965.4 840554 774532.4 840554 983532.4 11 47085 12 39984 13 34529 13 86082 16 33032 16 04527 386490.6 928525.2 10 37482 14 00042 15 65479 16 85584 18 5 210 1 14 65 610 20084 91 2263545 2555607 2387030 12 1520.2 13 85 31 159527.4 327 516 .6 18 00 61. 9... 254448.2 267069 .1 2770 61. 9 319 054.7 3 410 33 .1 310 015 .1 324022.3 417 018 .7 637975.5 605484.9 590456 .1 -18 9923 211 8 01. 7 10 6502.2 14 65 31 317 523.8 11 4069 .1 77505.75 17 4545.4 86 516 .55 12 6545.4 18 4538.2 15 2509.4 Ước lượng mô hình với các biến Y1T, X1T, Z1T ta được chạy eview ta đc Ta có d=2.22554 K=3 K’=2, n=29 Nên DL =1. 270 và Du =1. 563 Ta thấy 2 . 3370007 15 295950 11 88000 3930008 15 252700 12 69000 4020009 15 263650 13 17000 418 00 010 15 2 617 50 12 69000 43400 011 15 259850 13 17000 48200 012 15 260800 14 78000. 52200 013 15 257950 17 02000 50600 014 15 258900 18 79000 514 00 015 15 256050 2040000 610 00 016 15 2 513 00 215 2000 86700 017 15 249400 24 410 00 9 310 0 018 15 247500 25 210 00

Ngày đăng: 29/10/2012, 16:35

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan