Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thiết - Lê Anh Đức

pdf 39 trang cucquyet12 8160
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thiết - Lê Anh Đức", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_2_mo_hinh_hoi_quy_hai_bien_uo.pdf

Nội dung text: Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thiết - Lê Anh Đức

  1. BÀI GIẢNG KINH TẾ LƯỢNG ECONOMETRICS Lê Anh Đức Khoa Toán kinh tế ĐH Kinh tế Quốc dân 1
  2. CHƯƠNG II: MÔ HÌNH HỒI QUY HAI BIẾN, ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THIẾT 2.1. Phương pháp bình phương nhỏ nhất (OLS) 2.2. Các giả thiết cơ bản của phương pháp OLS 2.3. Độ chính xác của các ước lượng OLS 2.4. Hệ số r2 đo độ phù hợp của hàm hồi quy mẫu 2.5. Phân bố xác suất của Ui 2.6. Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy 2.7. Kiểm định sự phù hợp của hàm hồi quy, phân tích hồi quy và phân tích phương sai 2.8. Phân tích hồi quy và dự báo 2.9. Trình bày kết quả phân tích hồi quy 2.10. Thí dụ 2
  3. 2.1. Phương pháp bình phương nhỏ nhất - OLS 1. Nội dung của phương pháp OLS • Xét mô hình hồi quy đơn dạng tuyến tính PRF: E(Y/Xi) = 1 + 2 Xi PRM: Yi = 1 + 2 Xi + Ui • Với mẫu W = {(Xi, Yi), i = 1÷ n} tìm được một ước lượng điểm của PRF ˆ ˆ ˆ SRF: Yi β1 β 2 X i ˆ ˆ SRM: Yi β1 β 2 X i e i 3
  4. • Đồ thị Y e4 SRF e1 e3 e2 X1 X2 X3 X4 X 4
  5. • Nội dung của phương pháp OLS là tìm các ˆ ˆ ước lượng điểm β1, β 2 sao cho tổng bình phương các phần dư là nhỏ nhất. Tức là sao cho ˆ càng gần với giá trị thực của Y có Yi i thể được. ˆ ˆ • Tìm β1, β 2 sao cho: n n 2 2 ˆ ei  Y i Y i min i 1 i 1 5
  6. • Ta có ˆ ˆ ˆ ei Y i Y i Y i 1  2 X i n n n 2ˆ 2ˆ ˆ 2 ˆ ˆ ei ()()(,) Y i Y i  Y i 1  2 X i f  1  2 i 1 i 1 i 1 ˆ ˆ ˆ ˆ • Ta cần tìm β 1 , β 2 sao cho f(,)1  2 Min ˆ ˆ • Các hệ số β 1 , β 2 là nghiệm của hệ phương trình sau ˆ ˆ n n n f (,)1  2 0 2 (Y ˆ  ˆ X ) 0  ˆ n  ˆ X Y ˆ i1 2 i 1 2  i  i 1 i 1 i 1 i 1 ()I ˆ ˆ n n n n f (,)1  2 ˆ ˆ ˆ ˆ 2 0 2XYXXXYXi ( i 1  2 i ) 0  1  i  2  i  i i ˆ i 1 i 1 i 1 i 1 2 6
  7. • Ký hiệu 1 n XX  i n i 1 1 n YY  i n i 1 • Khi đó ˆ YX  ˆ 1 2 n n n n. Y X X Y ()I i i  i  i ˆ i 1 i 1 i 1 2 n n (?) 2 2 n Xi ()  X i i 1 i 1 7
  8. • Ký hiệu xi X i X yi Y i Y • Khi đó n n n n n Xi Y i  X i.  Y i  x i y i ˆ i 1 i 1 i 1 i 1 2 n n n (?) 2 2 2 n Xi ()  X i  x i i 1 i 1 i 1 ˆ ˆ • Các hệ số 1,  2 là các ước lượng của 1 ,  2 được tính bằng phương pháp OLS - gọi là các ước lượng OLS 8
  9. 2. Các tính chất của các ước lượng OLS ˆ ˆ • Đối với 1,  2 ˆ ˆ Tính chất 1: với mỗi tệp số liệu mẫu thì 1,  2 xác định một duy nhất (?). ˆ ˆ Tính chất 2: 1,  2 là các ước lượng của 1,2 và là các đại lượng ngẫu nhiên, với mỗi mẫu khác nhau thì chúng có giá trị khác nhau. 9
  10. • Đối với SRF Tính chất 1: SRF đi qua điểm trung bình mẫu (,)XY ˆ ˆ YX 1  2 (?) Tính chất 2: Trung bình số học của các giá trị ước lượng bằng trung bình mẫu n 1 ˆ ˆ YYYi i (?) n i 1 Tính chất 3: Tổng các phần dư bằng không n ei 0(?) i 1 Tính chất 4: Các phần dư không tương quan với các giá trị ước lượng được n ˆ ˆ Cov( ei , Y i )  Y i e i 0(?) i 1 Tính chất 5: Các phần dư không tương quan với các giá trị của biến giải thích n Cov( ei , X i )  X i e i 0(?) i 1 10
  11. ˆ ˆ  ,  • Các hệ số  1 ,  2 là các ước lượng điểm của 1 2 được tìm bằng phương pháp OLS. Chất lượng của chúng phụ thuộc vào các yếu tố sau: - Dạng hàm của mô hình lựa chọn - Kích thước mẫu - Biến độc lập Xi và sai số ngẫu nhiên Ui 11
  12. 2.2. Các giả thiết cơ bản của phương pháp OLS • GT 1: Biến độc lập là phi ngẫu nhiên • GT 2: Kỳ vọng của các sai số ngẫu (SSNN) nhiên bằng 0 E(Ui) = 0  i • GT 3: Phương sai của các SSNN bằng nhau 2 Var(Ui) = Var(Uj) =   i ≠ j • GtT 4: Các SSNN không tuơng quan với nhau Cov(Ui ,Uj) = 0  i ≠ j • GT 5: Các SSNN và biến độc lập không tương quan với nhau Cov(Ui , Xi) = 0  i 12
  13. 2.3. Độ chính xác của các ước lượng OLS • Đối với ˆ 1 ˆ - Kỳ vọng toán E()1  1 - Phương sai n 2  X i ˆ 2i 1 2 Var();()()1 n Var Ui   i 2 n xi i 1 - Độ lệch chuẩn (Standard Deviation) n 2  X i ˆ i 1 SD()1  n 2 n xi i 1 13
  14. - Do không xác định được  2 nên nó được thay thế bằng một ước lượng điểm: n n 2 2 ei  e i ˆ2 i 1  ˆ i 1 (n 2) ( n 2) ˆ gọi là sai số chuẩn của đường hồi quy (Standard Error of Regression) - Khi đó n 2  X i ˆ ˆ i 1 SD()()1 Se  1 ˆ n 2 n xi i 1 ˆ Se()1 gọi là sai số chuẩn (Standard error) 14
  15. • Đối với ˆ 2 ˆ - Kỳ vọng toán E()2  2 - Phương sai 2 ˆ  Var()2 n 2  xi i 1 - Độ lệch chuẩn (Standard Deviation)  SD()ˆ 2 n 2  xi i 1 - Sai số tiêu chuẩn (Standard error) ˆ Se()ˆ 2 n 2  xi 15 i 1
  16. Định lý Gauss – Markov Với các giả thiết 1-5 của phương pháp OLS, các ước lượng OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch. ˆ ˆ β1, β 2 là BLUE của 1 , 2 (Best Linear Unbiased Estimates) 16
  17. 2.4. Hệ số r2 đo độ phù hợp của SRF • Ta có ˆ ˆ ˆ YYei i i YYYYeYYyi i i i; i ˆ i (  1 n ) yi yˆ i e i 2 2 2 yi yˆ i e i 2 e i y ˆ i n n n n 2ˆ 2 2 ˆ yi  y i  e i 2  e i y i i 1 i 1 i 1 i 1 n n n n ˆ2 ˆ 2 2 ei y i 0 (?)  y i  y i  e i i 1 i 1 i 1 i 1 17
  18. • Ký hiệu n n 2 2 TSS  yi  () Y i Y i 1 i 1 n n n n ˆ 2ˆ ˆ 2 ˆ 2ˆ 2 2 ESS  yi ()() Y i Y  Y i Y  2  x i i 1 i 1 i 1 i 1 n n 2ˆ 2 RSS  ei  () Y i Y i i 1 i 1 TSS = ESS + RSS TSS = Total Sum of Squares ESS = Explained Sum of Squares RSS = Residual sum of squares 18
  19. • Ta có ESS RSS TSS ESS RSS 1 TSS TSS • Đây là hệ thức cơ bản của phương pháp phân tích phương sai (Analys of variance – ANOVA). • ANOVA là phân tích toàn bộ sự biến thiên của biến ngẫu nhiên thành các bộ phận khác nhau mà có thể giải thích được và khảo sát từng bộ phận đó. • Toàn bộ sự biến thiên của biến phụ thuộc Y xung quanh giá trị trung bình của nó (TSS) có thể tách thành hai bộ phận: - Các biến thiên của Y được giải thích thông qua hàm hồi quy (ESS), tức là thông qua các biến giải thích có mặt trong hàm hồi quy. - Các biến thiên của Y được giải thích bên ngoài mô hình (RSS), tức là không thông qua các biến giải thích có mặt trong hàm hồi quy. 19
  20. • Ký hiệu ESS RSS r 2 1 TSS TSS gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares) • Ý nghĩa r2 đo tỷ lệ % sự biến thiên của Y được giải thích thông qua hàm hồi quy, tức là được giải thích thông qua biến độc lập của mô hình. Nó được sử dụng để đặc trưng cho mức độ thích hợp của hàm hồi quy 20
  21. • Ta có n 2  xi 2 2ˆ 2i 1 ˆ 2SX 2 r 2n  2 2 (0 r 1) 2 SY  yi i 1 - Nếu r2 = 0: Hàm hồi quy hoàn toàn không giải thích sự biến thiên của Y. - Nếu r2 = 1: Hàm hồi quy giải thích 100% sự biến thiên của Y. - Nếu r2 = 0,9: Hàm hồi quy giải thích 90% sự biến động của Y, tức là sự biến động của biến giải thích trong hàm hồi quy chi phối 90% sự biến động của Y. 21
  22. • Ta có r r 2 Gọi là hệ số tương quan của biến X và Y • Ý nghĩa: hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa biến X và Y. • Tính chất của hệ số tương quan: 1 r 1 - Nếu r > 0 tức là X và Y quan hệ cùng chiều; - Nếu r < 0 tức là X và Y quan hệ ngược chiều; - Nếu r = 0 tức là X và Y không phụ thuộc tương quan tuyến tính; - Nếu r 1 tức là X và Y có quan hệ phụ thuộc hàm số tuyến tính. 22
  23. 2.5. Phân phố xác suất của Ui • Để có thể phân tích về mặt thống kê đối với mô hình ta cần phải biết phân phối xác suất của các ước lượng thu được, các phân phối này tuỳ thuộc vào phân phối xác suất của các sai số ngẫu nhiên. • Giả thiết 6: Các sai số ngẫu nhiên có phân phối chuẩn Ui N( E ( U i ), v ar(Ui ))( i ) 2 UNi (0, ) 23
  24. • Các căn cứ để đưa ra giả thiết này: - Ui thường là tổng hợp của một số lớn các yếu tố ngẫu nhiên độc lập cùng tuân theo quy luật phân phối xác suất nào đó và mức độ ảnh hưởng đến Y là bé đều như nhau do đó Ui có phân phối chuẩn (định lý giới hạn trung tâm); - Quy luật phân phối chuẩn chỉ có hai tham số là kỳ vọng toán và phương sai nên dễ tính toán; - Quy luật phân phối chuẩn có tính chất là nếu Ui phân phối chuẩn thì một hàm tuyến tính của nó cũng có phân phối chuẩn. - Quy luật phân phối chuẩn có tính chất là tính độc lập và không tương quan là đồng nhất. 24
  25. • Với các giả thiết 1-6 ˆ   ˆ  ˆN(  , Var (  ˆ )) Z 1 1 N (0,1) T 1 1 T (n 2) 1 1 1 1ˆ 1 ˆ SD()()1 Se  1 ˆ   ˆ  ˆN(  , Var (  ˆ )) Z 2 2 N (0,1) T 2 2 T (n 2) 2 2 2 2 ˆ ˆ SD()()2 Se  2 (n 2)ˆ 2 2  2 (n 2)  2 2 Yi N(1  2 X i ,  )(  i ) 25
  26. ˆ ˆ 2 Nhận xét: 1,,  2 ˆ là các ước lượng điểm 2 của 1,,  2  nên tính đại diện không cao do đó cần phải tìm các ước lượng khoảng tin cậy và kiểm định các giả thuyết thống kê của chúng. 26
  27. 2.6. Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy 1. Đối với  j (j 1  2) Ước lượng khoảng tin cậy Kiểm định giả thiết 2. Đối với  2 Ước lượng khoảng tin cậy Kiểm định giả thiết 27
  28. Ước lượng khoảng tin cậy đối với  j ( j 1  2) ˆ  • Ta có TT j j ( n 2) do đó với độ tin cậy (1 - ) ta có ˆ Se() j - Khoảng tin cậy đối xứng ˆ ˆ(n 2) ˆ ˆ ( n 2) P j Se(  j ) T  j  j Se (  j ) T 1 2 2 - Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu. P  ˆ Se(  ˆ ) T (n 2) 1 j j j - Khoảng tin cậy bên trái dùng để ước lượng giá trị tối đa: ˆ ˆ (n 2) Pj  j Se(  j ) T 1 28
  29. Kiểm định giả thiết đối với  j ( j 1  2) • Kiểm định các cặp giả thiết HHH0:::j  j 0  j  j 0  j  j (1), (2), (3) HHH1:::j  j 1  j  j 1  j  j ˆ  * T j j • Tiêu chuẩn kiểm định ˆ Se() j • Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước của các cặp giả thiết  WTTT : (n 2) - Với cặp giả thiết (1)  2  - Với cặp giả thiết (2) (n 2) WTTT :  - Với cặp giả thiết (3) (n 2) WTTT :  29
  30. • Trường hợp đặc biệt HHH0:j 0 0 :  j 0 0 :  j 0 (1), (2), (3) HHH1:j 0 1 :  j 0 1 :  j 0 • Có thể sử dụng phương pháp kiểm định bằng giá trị P- value (P-value là mức xác suất nhỏ nhất để bác bỏ giả thiết H0), thường ký hiệu là P. • Quy tắc kết luận với mức ý nghĩa cho trước như sau: - Với cặp giả thiết (1) + Nếu > P thì bác bỏ giả thiết H0 + Nếu P/2 thì bác bỏ giả thiết H0 + Nếu < P/2 thì không có cơ ơở bác bỏ giả thiết H300
  31. • Xét mô hình hồi đơn có dạng tuyến tính PRF: E(Y/Xi) = 1 + 2 Xi PRM: Yi = 1 + 2 Xi + Ui • Cặp giả thiết cơ bản H 0 :  2 0 H1 :  2 0 • Nếu bác bỏ H0: hệ số hồi qui 2 có ý nghĩa thống kê (statistically significal), mô hình có ý nghĩa; ngược lại thì hệ số 2 gọi là không có ý nghĩa thống kê, mô hình không có ý nghĩa thống kê. 31
  32. Ước lượng khoảng tin cậy đối với  2 (n 2)ˆ 2 2  2 (n 2) • Ta có  2 do đó với độ tin cậy (1 - ) ta có - Khoảng tin cậy đối xứng: 2 2 (n 2)ˆ2 ( n 2)  ˆ P  1 2 2  (n 2)  ( n 2) 1 2 2 - Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu: 2 2 (n 2)ˆ P  2 1  (n 2) - Khoảng tin cậy bên trai dùng để ước lượng tối đa: 2 2 (n 2)ˆ P  2 1 32 1 (n 2)
  33. Kiểm định giả thiết đối với  2 • Kiểm định các cặp giả thiết 2 2 2 2 2 2 HHH0:::  0 0   0 0   0 (1), (2), (3) 2 2 2 2 2 2 HHH1:::  0 1   0 1   0 2 2 (n 2)ˆ • Tiêu chuẩn kiểm định  2  0 • Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước của các cặp giả thiết 2 2    (n 2) - Với cặp giả thiết (1) 2 W  2 : 2 2    (n 2) 1 - Với cặp giả thiết (2) 2  2 2 2 - Với cặp giả thiết (3) W :   ( n 2) 2 2 2 W :  1 ( n 2) 33
  34. 2.7. Kiểm định sự phù hợp của hàm hồi quy 2 • r tổng thể = 0 : hàm hồi qui không phù hợp • Kiểm định cặp giả thiết 2 H0: 2 0 H 0 : r 0 H : 0 2 1 2 H1 : r 0 • Ta có ESS/1 TSS * r2 /1 r 2 /1 F F(1, n 2) RSS/( n 2) (1 r2 ) TSS /( n 2) (1 r 2 )/( n 2) • Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước W F: F F (1, n 2) • Sử dụng giá trị P-value + Nếu > P thì bác bỏ giả thiết H0 + Nếu < P thì không có cơ ơở bác bỏ giả thiết H0 34
  35. 2.8. Phân tích hồi quy và dự báo • Vấn đề: sử dụng SRF ước lượng được để dự báo về biến phụ thuộc. - Dự báo giá trị trung bình của biến phụ thuộc (biết X = X0 cần dự báo giá trị E(Y/X0)). - Dự báo giá trị cá biệt của biến phụ thuộc (biết X = X0 cần dự báo giá trị (Y0 = Y/X0)) 35
  36. Dự báo giá trị trung bình của biến phụ thuộc • SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu ˆ ˆ ˆ YX0  1  2 0 • Để dự báo E(Y/X0) cho tổng thể ta ƯL khoảng tin cậy của nó. • Ta có YEYXˆ (/) TT 0 0 (n 2) ˆ Se() Y0 2 ˆ 1 ()XX0 Se() Y0 ˆ 2 n xi • Do đó với độ tin cậy (1- ) cho trước ˆ ˆ(n 2) ˆ ˆ ( n 2 ) Y0 SeYT()(/)() 0 EYX 0 Y 0 SeYT 0 2 2 ˆ ˆ (n 2 ) E(/)() Y X0 Y 0 Se Y 0 T (n 2 ) ˆ ˆ 36 E(/)() Y X0 Y 0 Se Y 0 T
  37. Dự báo giá trị cá biệt của biến phụ thuộc • SRF cho ta một ước lượng điểm của Y0 = (Y/X0) trên mẫu ˆ ˆ ˆ YX0  1  2 0 • Để dự báo Y0 của tổng thể ta ƯL khoảng tin cậy của nó. • Ta có YYˆ TT 0 0 (n 2 ) ˆ S e() Y0 Y 0 2 ˆ 1 ()XX0 Se( Y0 Y 0 ) ˆ 1 n n 2  x i i 1 • Do đó với độ tin cậy (1- ) cho trước ˆ ˆ(n 2) ˆ ˆ ( n 2) Y0 SeY()() 0 YT 0 Y 0 Y 0 SeY 0 YT 0 2 2 ˆ ˆ (n 2) Y0 Y 0 Se() Y 0 Y 0 T Y Yˆ Se() Y ˆ Y T (n 2) 0 0 0 0 37
  38. 2.9. Trình bày kết quả phân tích hồi quy Yˆ ˆ ˆ X i 1 2 i r2 Se()ˆ Se()ˆ 1 2 Bậc tự do n-2 ˆ/()Se  ˆ ˆ ˆ Thống kê T 1 1 2/()Se  2 r2 n 2 F Thống kê F (1 r 2 ) 1 38
  39. 2.10. Thí dụ • Thí dụ 2.2 – trang 41 • Thí dụ 2.3 – trang 46 39