Bài giảng Kinh tế lượng - Chương 1: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản - Lê Anh Đức
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 1: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản - Lê Anh Đức", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_kinh_te_luong_chuong_1_mo_hinh_hoi_quy_hai_bien_mo.pdf
Nội dung text: Bài giảng Kinh tế lượng - Chương 1: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản - Lê Anh Đức
- BÀI GIẢNG KINH TẾ LƯỢNG ECONOMETRICS Lê Anh Đức Khoa Toán kinh tế ĐH Kinh tế Quốc dân
- CHƯƠNG I: MÔ HÌNH HỒI QUY HAI BIẾN , MỘT VÀI TƯ TƯỞNG CƠ BẢN 1.1. Phân tích hồi quy a. Bản chất của phân tích hồi quy b. Phân tích hồi quy và các quan hệ khác 1.2. Bản chất nguồn số liệu cho phân tích hồi quy a. Các loại số liệu b. Nguồn gốc các số liệu c. Bản chất chung của số liệu kinh tế – xã hội 1.3. Mô hình hồi quy tổng thể 1.4. Sai số ngẫu nhiên và bản chất của nó 1.5. Hàm hồi quy mẫu
- 1.1. Phân tích hồi quy (regression analysis) a. Bản chất của phân tích hồi quy • Thuật ngữ “hồi quy” được Francis Galton sử dụng vào năm 1886. • Là phân tích mối liên hệ phụ thuộc giữa một biến gọi là biến phụ thuộc (dependent variable) vào một hoặc một số biến khác gọi là biến giải thích (explanatory variable) Biến phụ thuộc, ký hiệu là Y Biến giải thích, ký hiệu là X hoặc X1 , X2, • Hồi quy là một công cụ cơ bản của Kinh tế lượng
- Thí dụ: “Luật Francis Galton - Karl Pearson” • Vấn đề: nghiên cứu mối liên hệ phụ thuộc giữa chiều cao của các cháu trai vào chiều cao của các ông bố. Y = chiều cao của các cháu trai (inches) X = chiều cao của các ông bố (inches) • Đồ thị (tham khảo giáo trình trang 10). Đồ thị này được vẽ với một tổng thể giả định.
- • Kết quả nghiên cứu của F.Galton – K.Pearson : - Với chiều cao đã biết của người bố thì chiều cao của các cháu trai sẽ là một khoảng, dao động quanh giá trị trung bình; - Chiều cao của người bố tăng thì chiều cao của các cháu trai cũng tăng (hệ số góc lớn hơn 0); - Với nhóm các ông bố có chiều cao nhỏ (thấp) thì chiều cao trung bình của các cháu trai cao hơn bố. Ngược lại, với nhóm các ông bố có chiều cao lớn (cao) thì chiều cao trung bình của các cháu trai thấp hơn bố (hệ số góc nhỏ hơn 1).
- Các thí dụ khác • Chi cho tiêu dùng cá nhân – thu nhập khả dụng • Mức cầu – giá • Tỷ lệ thay đổi của tiền lương – tỷ lệ thất nghiệp • Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập – tỷ lệ lạm phát • Mức cầu – mức chi cho quảng cáo • Sản lượng của một loại nông sản – lượng phân bón, lượng mưa, nhiệt độ, v.v
- Mục đích của phân tích hồi qui • Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập, tức là phải ước lượng các tham số của mô hình. • Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế đưa ra. Trong trường hợp này phải trả lời hai câu hỏi: - Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không? - Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào? • Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập.
- b. Phân tích hồi quy và các quan hệ khác Phân tích hồi quy nghiên cứu quan hệ thống kê (statistical relationship) Ta phân biệt với các quan hệ sau: • Phân tích hồi quy và quan hệ hàm số (functional relationship) • Phân tích hồi quy và phân tích tương quan (correlation analysis) • Phân tích hồi quy và quan hệ nhân quả (causation relationship)
- • Phân tích hồi quy và quan hệ hàm số - Trong quan hệ hàm số: + Ứng với mỗi giá trị của biến độc lập cho duy nhất một giá trị của biến phụ thuộc. + Các biến không phải là các biến ngẫu nhiên. - Trong phân tích hồi quy + Ứng với mỗi giá trị cho trước của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc. + Các biến là các biến ngẫu nhiên.
- • Phân tích hồi quy và phân tích tương quan - Phân tích tương quan + Đo mức độ kết hợp tuyến tính giữa hai biến bằng hệ số tương quan. + Các biến có tính chất đối xứng. - Trong phân tích hồi quy + Ước lượng và dự báo một biến trên cơ sở giá trị đã cho của các biến khác. + Các biến không có tính chất đối xứng.
- • Phân tích hồi quy và quan hệ nhân quả - Quan hệ nhân quả là hệ hai chiều giữa hai đối tượng trong đó vai trò của các đối tượng được xác định rõ đâu là nguyên nhân và đâu là kết quả. - Trong phân tích hồi quy biến giải thích không nhất thiết là nguyên nhân gây lên biến phụ thuộc, mối quan hệ giữa các biến được xác lập tuỳ thuộc vào mục đích nghiên cứu.
- 1.2. Bản chất nguồn số liệu cho phân tích hồi quy a. Các loại số liệu • Số liệu theo thời gian (Time series data) Ví dụ: CPI, GDP, • Số liệu chéo (Undate – Cross section data) Ví dụ: Doanh thu, lợi nhuận (của các DN) • Số liệu kết hợp (Pooled data) • Số liệu bảng (Panel data)
- b. Nguồn gốc các số liệu • Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp chí, • Số liệu từ các cuộc điều tra thực tế hoặc đi mua.
- c. Bản chất chung của số liệu KT – XH • Phần lớn là các số liệu phi thực nghiệm, mang tính ngẫu nhiên, kém tin cậy. • Có sẵn để thu thập, tính toán phù hợp với mục đích nghiên cứu. Ghi nhớ: Kết quả của nghiên cứu sẽ không chỉ phụ thuộc vào mô hình được lựa chọn mà còn phụ thuộc rất nhiều vào chất lượng của số liệu.
- 1.3. Mô hình hồi qui tổng thể • Tổng thể (Population) là toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó . • Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y). • Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất. • Tham khảo thí dụ 1.3 trang 14, sách bài giảng
- • Bảng phân phối xác suất đồng thời của X và Y X1 X2 Xk Y1 P(Y1, X1) P(Y1, X2) P(Y1, Xk) Y2 P(Y2, X1) P(Y2, X2) . P(Y2, Xk) Yh P(Yh, X1) P(Yh, X2) P(Yh, Xk) h k PYX(j , i ) 1 j 1 i 1
- • Các bảng phân phối xác suất có điều kiện của Y theo Xi (i = 1, 2, , k) (Y/Xi) Y1 Y2 Yh P(Y/Xi) P(Y1, Xi) P(Y2, Xi) P(Yh, Xi) • Kỳ vọng toán của Y với điều kiện của Xi: h EYX(/)i YPYX j (/) j i EYX (/) i fXi ()(1) i k j 1 X = XXXi (Y/ i ) ! E(Y/ i ) • E(Y/Xi) là một hàm số và gọi là hàm hồi quy tổng thể của Y đối với Xi (Population Regression Function – PRF). Nó cho biết giá trị trung bình của Y thay đổi như thế nào theo Xi.
- • Nếu hàm hồi quy tổng thể có một biến độc lập thì gọi là hàm hồi quy đơn - Simple regression. E(Y/Xi) = f(Xi) • Nếu hàm hồi quy tổng thể có hơn một biến độc lập thì gọi là hàm) hồi quy bội - Multiple regression. E(Y/X1i, X2i, ) = f(X1i, X2i, )
- • Giả sử PRF có dạng tuyến tính: E( Y / Xi ) 1 2 X i ( i 1 k ) hoặc EYXX(/) 1 2 • Hàm này gọi là hàm hồi quy tuyến tính đơn • Trong đó: 1 EYX( /i 0) gọi là hệ số chặn (intercept coefficient) dE(/) Y X gọi là hệ số góc (slope coefficient) 2 dX
- • Tại một giá trị cá biệt của Yi ta có: Yi 1 2 X i U i ( i 1 N ) gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM) • Thuật ngữ “tuyến tính” được hiểu theo hai nghĩa + Tuyến tính đối với các tham số (,)1 2 + Tuyến tính đối với các biến số (X, Y) • Khi nói đến “hàm hồi quy tuyến tính” tức là hàm hồi quy tuyến tính đối với các tham số, nó có thể là tuyến tính hoặc phi tuyến đối với các biến số. 2 E(Y/X) = 1 + 2X E(Y/X) = 1 + 2lnX 2 E(Y/X) = 1X
- 1.4. Sai số ngẫu nhiên và bản chất của nó • Đặt Ui = Yi – E(Y/Xi) gọi là sai số ngẫu nhiên (random errors) • Sai số ngẫu nhiên đại diện cho tất cả những yếu tố không phải biến độc lập nhưng cũng tác động đến biến phụ thuộc. + Những yếu tố không biết + Những yếu tố không có số liệu + Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống • Sự tồn tại của SSNN là tất yếu khách quan và nó có vai trò đặc biệt quan trọng trong phân tích hồi quy, nó phải thoả mãn những điều kiện nhất định thì thì việc phân tích trên mô hình hồi quy mới có ý nghĩa.
- 1.5. Hàm hồi qui mẫu • Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thể (không cần thiết) nghiên cứu toàn bộ tổng thể vì vậy không thể tìm được PRF mặc dù dạng của PRF có thể biết. • Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra từ tổng thể theo những nguyên tắc nhất định. • Giả sử từ tổng thể lập một mẫu ngẫu nhiên (mẫu cụ thể) kích thước n: W = {(Xi ,Yi) ; i =1÷n}
- • Trong mẫu tồn tại một hàm số gọi là hàm hồi quy mẫu (Sample Regression Function - SRF) có dạng giống như PRF mô tả xu thế biến động của trung bình biến phụ thuộc theo biến độc lập. • Thực chất nó là một ước lượng điểm của PRF Nếu PRF có dạng: E(Y/Xi) = 1 + 2Xi ˆ ˆ ˆ SRF có dạng: YXi 1 2 i Trong đó: ˆ ˆ 1, 2 (Estimated regression coefficients) là các ước lượng điểm của 1, 2 . ˆ Yi (Fitted value) là ước điểm của E(Y/Xi).
- ˆ ˆ • Mẫu ngẫu nhiên β1, β 2 là ngẫu nhiên Ước lượng ngẫu nhiên (estimates) của tham số 1,2 ˆ ˆ • Với mẫu cụ thể, β1, β 2 là con số cụ thể Ước lượng cụ thể (estimators) của tham số 1,2
- • Tại một giá trị cá biệt của Y ta có ˆ ˆ Yi 1 2 X i e i ( i 1 n ) gọi là mô hình hồi quy mẫu (Sample Regression Model – SRM) • Đặt ˆ gọi là phần dư (Residual) ei Y i Y i • Phần dư ei là sai số ngẫu nhiên của mẫu, thực chất chúng là các ước lượng điểm của các sai số ngẫu nhiên Ui trong tổng thể. • Bản chất của ei giống như các sai số ngẫu nhiên Ui
- Tổng thể Mẫu (Population) (Sample) ˆ ˆ ˆ PRF:(/) E Y Xi 1 2 X i SRFYX: i 1 2 i ˆ ˆ PRM: Yi 1 2 X i U i SRM: Yi 1 2 X i e i (i 1 N ) (i 1 n ) Sai số ngẫu nhiên Ui Phần dư ei
- Các thuật ngữ cơ bản Tiếng Anh Tiếng Việt Regression analysis Phân tích hồi quy Dependent variable Biến phụ thuộc Explanatory variable/ Independent variable Biến giải thích/ biến độc lập Time series data Số liệu theo thời gian Cross section data Số liệu chéo Pooled data Số liệu kết hợp Panel data Số liệu bảng Population Tổng thể PRF – Population Regression Function Hàm hồi quy tổng thể PRM - Population Regression Model Mô hình hồi quy tổng thể 27
- Các thuật ngữ cơ bản Tiếng Anh Tiếng Việt Simple regression Hồi quy đơn Multiple regression Hồi quy bội Intercept coefficient Hệ số chặn hoặc hệ số tự do Slope coefficient Hệ số góc Random error Sai số ngẫu nhiên SRF – Sample Regression Function Hàm hồi quy mẫu SRM - Sample Regression Model Mô hình hồi quy mẫu Estimated regression coefficients Các hệ số hồi quy ước lượng được Residual Phần dư 28