Bài giảng Kinh tế lượng 1 - Trịnh Quang Thoại
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng 1 - Trịnh Quang Thoại", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_kinh_te_luong_1_trinh_quang_thoai.pdf
Nội dung text: Bài giảng Kinh tế lượng 1 - Trịnh Quang Thoại
- TS. TRỊNH QUANG THOẠI KINH TÕ Lîng 1 TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2019
- TS. TRỊNH QUANG THOẠI BÀI GIẢNG KINH TẾ LƯỢNG 1 TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2019
- MỤC LỤC MỤC LỤC i LỜI NÓI ĐẦU 1 Chương 1. GIỚI THIỆU CHUNG VỀ KINH TẾ LƯỢNG 3 1.1. Kinh tế lượng là gì? 3 1.2. Lịch sử hình thành và phát triển của kinh tế lượng 6 1.3. Mục tiêu và nhiệm vụ của kinh tế lượng 9 1.3.1. Mục tiêu của kinh tế lượng 9 1.3.2. Nhiệm vụ của kinh tế lượng 10 1.4. Vì sao phải nghiên cứu kinh tế lượng? 11 1.5. Phương pháp luận của kinh tế lượng 14 1.6. Số liệu sử dụng trong kinh tế lượng 18 Câu hỏi ôn tập chương 1 21 Chương 2. TỒNG QUAN VỀ MÔ HÌNH HỒI QUY 22 2.1. Giới thiệu về mô hình hồi quy 22 2.1.1. Khái niệm hồi quy, mô hình hồi quy 22 2.1.2. Mục tiêu của phân tích hồi quy 25 2.1.3. Phân biệt các mối quan hệ trong mô hình hồi quy 26 2.2. Hàm hồi quy tổng thể và hàm hồi quy mẫu 28 2.2.1. Khái niệm về tổng thể, mẫu nghiên cứu 28 2.2.2. Hàm hồi quy tổng thể (Population Regression Function, PRF) 30 2.2.3. Hàm hồi quy mẫu (Sample Regression Function - SRF) 33 2.3. Sai số ngẫu nhiên trong mô hình hồi quy 37 Câu hỏi ôn tập chương 2 40 Chương 3. MÔ HÌNH HỒI QUY TUYẾN TÍNH 41 3.1. Giới thiệu mô hình hồi quy tuyến tính 41 3.1.1. Bản chất của mô hình hồi quy tuyến tính trong kinh tế lượng 41 3.1.2. Phân loại mô hình hồi quy tuyến tính 43 3.2. Ước lượng các hệ số của mô hình hồi quy tuyến tính sử dụng phương pháp bình phương nhỏ nhất 45 3.2.1. Giới thiệu chung về phương pháp bình phương nhỏ nhất 45 3.2.2. Các giả định của phương pháp bình phương nhỏ nhất 45 3.2.3. Nội dung của phương pháp bình phương nhỏ nhất 49 3.3. Một số đặc tính của các hệ số ước lượng và mô hình hồi quy ước lượng 58 3.3.1. Một số đặc tính của các hệ số ước lượng 58 3.3.2. Một số đặc tính của mô hình hồi quy ước lượng 59 3.4. Một số kiểm định thống kê trong mô hình hồi quy 59 i
- 3.4.1. Các kiểm định thống kê đối với mô hình hồi quy tuyến tính đơn giản 60 3.4.2. Một số kiểm định trong mô hình hồi quy tuyến tính bội 68 3.5. Cách thức trình bày và phân tích kết quả mô hình hồi quy 72 3.5.1. Cách thức trình bày kết quả của mô hình hồi quy 72 3.5.2. Phân tích kết quả của mô hình hồi quy tuyến tính 73 3.5.3. Cách thức phân tích ý nghĩa của mô hình hồi quy tuyến tính 74 3.6. Sử dụng kết quả của mô hình hồi quy để dự báo và đề xuất chính sách 76 Câu hỏi ôn tập chương 3 78 Chương 4. MỘT SỐ MÔ HÌNH ỨNG DỤNG 82 4.1. Mô hình dạng Cobb-Douglas 82 4.1.1. Giới thiệu mô hình 82 4.1.2. Ước lượng các hệ số của mô hình Cobb-Douglas bằng phương pháp bình phương nhỏ nhất (OLS) 85 4.1.3. Kiểm định và phân tích kết quả mô hình 86 4.1.4. Ứng dụng của mô hình Cobb-Douglas trong nghiên cứu kinh tế, xã hội 89 4.2. Mô hình dạng logarit một phía (semi-log model) 93 4.2.1. Giới thiệu mô hình 93 4.2.2. Mô hình dạng log-lin 93 4.2.3. Mô hình dạng lin-log 101 4.3. Một số các dạng mô hình khác 106 4.3.1. Mô hình với dạng nghịch đảo của biến độc lập 106 4.3.2. Mô hình dạng đa thức phi tuyến 107 Câu hỏi ôn tập chương 4 110 Chương 5. HỒI QUY VỚI BIẾN GIẢ 113 5.1. Bản chất của biến giả trong mô hình kinh tế lượng 113 5.2. Biến giả đóng vai trò là biến độc lập trong mô hình kinh tế lượng 117 5.2.1. Mô hình ANOVA 118 5.2.2. Mô hình ANCOVA 119 5.2.3. Một số lưu ý đối với trường hợp biến giả là biến độc lập trong mô hình kinh tế lượng 121 5.3. Mô hình kinh tế lượng với biến phụ thuộc là biến giả 124 5.3.1. Giới thiệu mô hình kinh tế lượng có biến phụ thuộc là biến giả 124 5.3.2. Mô hình tuyến tính xác suất 125 5.3.3. Mô hình Logit nhị phân 126 Câu hỏi ôn tập chương 5 130 TÀI LIỆU THAM KHẢO 134 ii
- LỜI NÓI ĐẦU Nghiên cứu định lượng trong lĩnh vực kinh tế - xã hội đã được chú trọng ở rất nhiều nước trên thế giới từ những năm đầu của thế kỷ 20. Thông qua việc sử dụng các công cụ định lượng, các nhà hoạch định chính sách đã đề xuất được các chính sách phù hợp với thực tế phát triển kinh tế - xã hội. Kinh tế lượng ra đời từ những năm 1930 và cho đến nay vẫn là một công cụ hữu ích đối với các hoạt động nghiên cứu trong lĩnh vực kinh tế, xã hội. Kinh tế lượng ngày càng được sử dụng rộng rãi ở Việt Nam và trở thành một trong các công cụ quan trọng đối với các nhà hoạch định chính sách, các nhà quản lý trong lĩnh vực kinh tế-xã hội. Kinh tế lượng đã trở thành môn học bắt buộc đối với sinh viên thuộc lĩnh vực kinh tế của các trường đại học. Bài giảng Kinh tế lượng 1 nhằm cung cấp tài liệu học tập cho sinh viên thuộc khối ngành kinh tế của trường Đại học Lâm nghiệp. Bài giảng được kết cấu thành 5 chương để trang bị cho sinh viên thuộc khối ngành Kinh tế của trường Đại học Lâm nghiệp các kiến thức cơ bản về Kinh tế lượng, cách thức xây dựng, kiểm định và phân tích kết quả của các mô hình kinh tế lượng cũng như áp dụng các mô hình kinh tế lượng cơ bản trong nghiên cứu các vấn đề thuộc lĩnh vực kinh tế - xã hội. Mặc dù tác giả đã cố gắng sưu tầm và kế thừa rất nhiều tài liệu nhằm mang lại cho người đọc những kiến thức cơ bản và cập nhật nhất có thể về Kinh tế lượng, song cũng không tránh khỏi những sai sót trong quá trình biên soạn. Tác giả rất mong nhận được sự đóng góp của người đọc để cuốn Bài giảng Kinh tế lượng 1 ngày càng hoàn thiện hơn. Mọi ý kiến đóng góp xin vui lòng gửi về Bộ môn Kinh tế, phòng 105, nhà T10, trường Đại học Lâm nghiệp, Xuân Mai, Chương Mỹ, Hà Nội. Tác giả Trịnh Quang Thoại 1
- Chương 1 GIỚI THIỆU CHUNG VỀ KINH TẾ LƯỢNG Mục tiêu của Chương 1 nhằm cung cấp cho người học: Khái niệm cơ bản về Kinh tế lượng; Lịch sử hình thành và phát triển của Kinh tế lượng; Mục tiêu và nhiệm vụ của Kinh tế lượng; phương pháp luận áp dụng trong Kinh tế lượng; Số liệu sử dụng trong Kinh tế lượng. 1.1. Kinh tế lượng là gì? Thuật ngữ kinh tế lượng xuất hiện và được sử dụng lần đầu bởi Pawel Ciompa vào khoảng đầu năm 1910 (Geweke và cộng sự, 2006) và được tiếp tục phát triển bởi Ragnar Frisch, người được đồng giải thưởng Nobel kinh tế vào năm 1969 vào năm 1933 (Hansen, 2016). Kinh tế lượng được dịch từ thuật ngữ tiếng anh “Econometrics”, thuật ngữ này được ghép từ hai gốc từ latinh là “Econo” có nghĩa là “Kinh tế” và “Metrics” có nghĩa là “đo lường”. Có rất nhiều định nghĩa về kinh tế lượng và các định nghĩa này thay đổi theo từng thời kỳ khác nhau, cụ thể: - Kinh tế lượng là lý thuyết kinh tế liên quan đến thống kê, toán học, nhằm mục đích hợp nhất giữa tiếp cận lý thuyết và tiếp cận định lượng thực nghiệm đối với các vấn đề kinh tế (Ragnar Frisch, 1933 trích từ Hansen, 2016); - Kinh tế lượng là phương pháp nghiên cứu của kinh tế hướng tới một sự kết hợp giữa lý thuyết kinh tế và những sự đo lường thực tế, sử dụng lý thuyết và công cụ của suy luận thống kê như là cầu nối trụ cột (Trygve Haavelmo, 1944 trích từ Baltagi, 2008); - Kinh tế lượng là sự phân tích định lượng của các hiện tượng kinh tế thực tế dựa trên sự phát triển đồng thời của lý thuyết và quan sát, liên quan đến các phương pháp suy luận thích hợp (Samuelson, Koopmans và Stone, 1954 trích từ Coleman, 2006); - Kinh tế lượng là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được sử dụng để phân tích các hiện tượng kinh tế (Goldberger, 1964 trích từ Coleman, 2006); - Kinh tế lượng là sự áp dụng thống kê và toán học đối với số liệu kinh tế để cung cấp hỗ trợ thực nghiệm cho các mô hình được xây dựng bởi toán kinh tế và nhằm đạt được các kết quả định lượng (Gerhard Tintner, 1968 trích từ Coleman, 2006); 3
- - Kinh tế lượng liên quan đến việc xác định thực nghiệm các quy luật kinh tế (Theil, 1971 trích từ Coleman, 2006); - Kinh tế lượng liên quan đến việc nghiên cứu có hệ thống các hiện tượng kinh tế sử dụng các số liệu quan sát (Aris Apanos, 1986 trích từ Baltagi, 2008); - Kinh tế lượng có nghĩa là đo lường kinh tế (Gurajati, 1988 trích từ Coleman, 2006); - Kinh tế lượng là sự áp dụng các phương pháp thống kê và toán học để phân tích số liệu kinh tế nhằm mục đích cung cấp nội dung thực nghiệm để trên cơ sở đó xác nhận hoặc bác bỏ các lý thuyết kinh tế (Maddala, 1992 trích từ Coleman, 2006); - Kinh tế lượng đề cập đến việc làm thế nào để chúng ta có thể sử dụng lý thuyết và số liệu từ kinh tế, doanh nghiệp và khoa học xã hội cùng với công cụ từ thống kê để trả lời loại câu hỏi “bao nhiêu” (Hill, Griffiths và Judge, 2001 trích từ Coleman, 2006); - Kinh tế lượng dựa trên cơ sở phát triển của các phương pháp thống kê để ước lượng các mối quan hệ kinh tế, kiểm định lý thuyết kinh tế, đánh giá và thực hiện các chính sách của chính phủ và doanh nghiệp (Wooldridge, 2003 và 2012); - Kinh tế lượng là một phương pháp suy luận thống kê áp dụng trong kinh tế. Kinh tế lượng có nghĩa là đo lường các vấn đề trong kinh tế chẳng hạn nền kinh tế, hệ thống kinh tế, thị trường và các vấn đề liên quan (Coleman, 2006). Theo nghĩa rộng, kinh tế lượng hướng tới cung cấp các nội dung thực nghiệm về các mối quan hệ kinh tế để kiểm định lý thuyết kinh tế, dự báo, ra quyết định, và đánh giá sau quyết định/đánh giá chính sách (Geweke, Horowitz và Pesaran, 2008 trích từ Baltagi, 2008). Định nghĩa của Ragnar Frisch (1933) vẫn có giá trị đối với hiện tại. Về bản chất kinh tế lượng là sự nghiên cứu hợp nhất giữa các mô hình kinh tế, thống kê toán học và số liệu kinh tế (Hansen, 2016). Mặc dù có rất nhiều cách định nghĩa khác nhau về kinh tế lượng, nhưng theo cách hiểu chung nhất “Kinh tế lượng là sự áp dụng các mô hình toán học và thống kê để ước lượng các mối quan hệ kinh tế nhằm kiểm định các lý thuyết kinh tế hoặc đánh giá, chứng minh hiệu quả thi hành các chính sách của chính phủ và các chiến lược của doanh nghiệp”. 4
- Nói chung, kinh tế lượng nhằm mục đích cung cấp nội dung thực nghiệm cho các mối quan hệ kinh tế để kiểm định các lý thuyết kinh tế, dự báo, ra quyết định và đánh giá sự ra quyết định hoặc chính sách. Bằng việc nhấn mạnh khía cạnh định lượng của các mối quan hệ kinh tế, kinh tế lượng yêu cầu một sự hợp nhất giữa lý thuyết và đo lường trong kinh tế (Geweke và cộng sự, 2006). Căn cứ vào lĩnh vực, kinh tế lượng được chia thành kinh tế lượng lý thuyết (theorical econometrics) và kinh tế lượng ứng dụng (applied econometrics). Kinh tế lượng lý thuyết đề cập đến sự phát triển các công cụ và phương pháp để đo lường các mối quan hệ kinh tế, trong khi đó kinh tế lượng ứng dụng là thuật ngữ mô tả sự phát triển của các mô hình kinh tế lượng và sự áp dụng các mô hình này trong các lĩnh vực kinh tế cụ thể (Hansen, 2016). Theo Gurajati (2004), kinh tế lượng lý thuyết đề cập đến việc phát triển các mô hình kinh tế lượng thích hợp (dựa vào thống kê và toán học) để đo lường các mối quan hệ kinh tế cụ thể. Kinh tế lượng ứng dụng bao gồm sự áp dụng các phương pháp kinh tế lượng để chỉ rõ các nhánh của lý thuyết và các vấn đề của kinh tế chẳng hạn cung, cầu, đầu tư, tiêu dùng Kinh tế lượng ứng dụng sử dụng các công cụ của lý thuyết kinh tế lượng để phân tích các hiện tượng kinh tế và dự báo hành vi kinh tế trong các lĩnh vực cụ thể như tài chính, ngân hàng, đầu tư (hàm đầu tư), sản xuất (hàm sản xuất), tiêu dùng (hàm cung, hàm cầu) Về bản chất, kinh tế lượng là sự kết hợp giữa kinh tế, toán kinh tế và thống kê với mục đích nhằm cung cấp thông số định lượng cho mối quan hệ kinh tế, tuy nhiên kinh tế lượng là một môn học độc lập. Các mối quan hệ giữa kinh tế lượng với lý thuyết kinh tế, toán học, và thống kê được thể hiện cụ thể như sau: - Mối quan hệ giữa kinh tế lượng và lý thuyết kinh tế: Chúng ta có thể dựa vào lý thuyết kinh tế để: + Lựa chọn biến và dạng của mô hình kinh tế lượng: Tất cả các mô hình kinh tế lượng đều được xây dựng trên cơ sở của một lý thuyết, giả thuyết kinh tế, ví dụ: Mối quan hệ giữa lượng cầu và giá bán; mối quan hệ giữa chi tiêu và thu nhập; mối quan hệ giữa vốn đầu tư và thu nhập Vì vậy, dựa vào từng lý thuyết kinh tế cụ thể chúng ta sẽ xác định được yếu tố bị ảnh hưởng (biến phụ thuộc) và yếu tố ảnh hưởng (biến độc lập); + Kiểm tra mức độ phù hợp của mô hình kinh tế lượng với các lý thuyết kinh tế: Trên cơ sở của các lý thuyết kinh tế chúng ta sẽ xác định được mô hình kinh tế lượng xây dựng có phù hợp hay không. Ví dụ: Hệ số góc của mô hình 5
- phản ánh mối quan hệ giữa lượng cầu với giá bán phải là số âm, trong khi hệ số góc của mô hình phản ánh mối quan hệ giữa chi tiêu và thu nhập phải là số dương nằm trong khoảng [0, 1]. - Mối quan hệ giữa kinh tế lượng và toán: Mô hình kinh tế lượng được xây dựng trên cơ sở lý thuyết hàm số của toán học. Ngoài ra, các thuật toán như đạo hàm, vi phân, giải hệ phương trình được sử dụng để ước lượng và phân tích các hệ số của mô hình kinh tế lượng. - Mối quan hệ giữa kinh tế lượng và thống kê: Kinh tế lượng luôn sử dụng các số liệu thực nghiệm để lượng hóa các mối quan hệ kinh tế. Do đó, kinh tế lượng có liên hệ mật thiết với thống kê, bởi vì để có được số liệu chúng ta phải tiến hành chọn mẫu điều tra. Ngoài ra, kinh tế lượng còn sử dụng một số kiểm định thống kê để xác nhận sự tồn tại của các hệ số và mô hình kinh tế lượng. Cụ thể, kinh tế lượng sử dụng kiểm định T-Student để kiểm định ý nghĩa thống kê của các hệ số trong mô hình, và sử dụng kiểm định Fisher (kiểm định F) để kiểm định độ chặt chẽ của mô hình. Mặc dù kinh tế lượng áp dụng lý thuyết và công cụ của thống kê để kiểm định tính thực nghiệm các lý thuyết kinh tế, tuy nhiên kinh tế lượng luôn có điểm khác biệt với thống kê toán học và thống kê kinh tế. Trong thống kê kinh tế, số liệu thực nghiệm được thu thập, ghi chép, lập thành bảng biểu và được sử dụng để mô tả theo khuôn mẫu sự phát triển của chúng qua thời gian. Vì vậy, thống kê kinh tế được sử dụng để mô tả các hiện tượng kinh tế mà không cung cấp sự giải thích quá trình phát triển của các biến khác nhau hoặc sự đo lường các thông số của các mối quan hệ. Trong khí đó, kinh tế lượng sử dụng số liệu thống kê và các phương pháp thống kê để ước lượng và kiểm định các mối quan hệ cụ thể trong kinh tế - xã hội. Những phương pháp này được điều chỉnh và trở nên thích hợp cho việc đo lường các mối quan hệ trong kinh tế - xã hội. 1.2. Lịch sử hình thành và phát triển của kinh tế lượng Kinh tế lượng có nguồn gốc từ nghiên cứu định lượng trong kinh tế và được bắt đầu từ công việc nghiên cứu của các nhà số học chẳng hạn William Petty, Gregory King và Charles Davenant vào khoảng thế kỷ 16 (Geweke và cộng sự, 2006). Trong một báo cáo vào năm 1698, Charles Davenant đã chỉ ra rằng nghiên cứu định lượng đầu tiên trong kinh tế được tiến hành bởi Gregory King, người đã sử dụng phương trình tuyến tính để ước lượng sự thay đổi của giá ngô đến sự thiếu hụt ngô trong thời kỳ thu hoạch. Kết quả nghiên cứu thực 6
- nghiệm của King và các vấn đề khác trong giai đoạn này là việc phát hiện ra các quy luật kinh tế, cũng giống như các quy luật của vật lý và các khoa học tự nhiên khác. Cũng theo nghiên cứu của Geweke và cộng sự (2006), lý thuyết thống kê đã được áp dụng trong lĩnh vực kinh tế bởi Galton, Edgeworth và Pearson. Trong các năm từ 1895 đến 1896, Yule đã áp dụng lý thuyết tương quan cơ bản vào kinh tế để phân tích mối quan hệ giữa sự bần cùng và phương pháp cứu trợ. Hooker (1901) cũng áp dụng lý thuyết tương quan cơ bản để phân tích mối quan hệ giữa tỷ lệ kết hôn và mức độ thịnh vượng của nền kinh tế (được đo bằng sự thay đổi của một số biến kinh tế chẳng hạn xuất khẩu, nhập khẩu và sự thay đổi của giá ngô). Pollock (2014) đã chỉ ra rằng thuật ngữ “phương trình hồi quy” được xuất phát từ nghiên cứu của Francis Galton (1811 - 1911), người đã mô tả sự cải thiện của dân số dưới tác động của các chương trình nuôi dưỡng có điều chỉnh. Galton đã tiến hành điều tra số liệu thống kê chi tiết và phương pháp của ông đã được hoàn thiện vào năm 1886. Số liệu điều tra của Galton sau đó được bổ sung bởi Karl Pearson (1857 - 1936). Pearson đã thu thập số liệu và nghiên cứu về mối quan hệ giữa chiều cao của 1.078 ông bố và con trai đã trưởng thành của họ ở nước Anh vào cuối thế kỷ 19. Đến năm 1907, Benini (chuyên gia thống kê người Italia) đã lần đầu sử dụng lý thuyết hồi quy bội trong phân tích kinh tế (Geweke và cộng sự, 2006). Mô hình hồi quy được phát triển bởi Galton là mô hình hai biến và được phân loại thành hồi quy mô tả. Mô hình này được R. A. Fisher (1890 - 1962) áp dụng trong thí nghiệm nông nghiệp. Bắt đầu từ năm 1919, Fisher đã xây dựng mô hình hồi quy để mô tả mối quan hệ tuyến tính giữa năng suất cây trồng với một yếu tố ảnh hưởng chẳng hạn: khối lượng phân bón, nồng độ muối trong đất, lượng nước tưới cho cây trồng (Pollock, 2014). Vậy kinh tế lượng ra đời từ khi nào? Kinh tế lượng bắt đầu được đề cập trong khoảng thời gian trước chiến tranh thế giới thứ 2 và Pawel Ciompa là người đầu tiên sử dụng thuật ngữ “kinh tế lượng” vào khoảng đầu năm 1910 (Geweke và cộng sự, 2006; Baltagi, 2008). Kinh tế lượng được tiếp tục kế thừa và phát triển bởi Ragnar Frisch vào năm 1933 và bắt đầu từ giai đoạn 1930 - 1940 kinh tế lượng thực sự nổi lên và trở thành một nhánh của kinh tế học với 7
- sự thành lập Hiệp hội Kinh tế lượng ở Mỹ và Bộ môn Kinh tế ứng dụng ở Đại học Cambridge, Anh. Ban đầu, kinh tế lượng nhấn mạnh vào việc phát triển các phương pháp (Geweke và cộng sự, 2006). Những người tiên phong sử dụng kinh tế lượng trong nghiên cứu ở giai đoạn này bao gồm More với nghiên cứu về chu trình kinh tế năm 1914; Working với nghiên cứu về đường cầu năm 1927; Cobb và Douglas với nghiên cứu về lý thuyết sản xuất năm 1928; Schultz với nghiên cứu về lý thuyết và ước lượng về cầu năm 1938; và Tinbergen với nghiên cứu về chu kỳ kinh doanh năm 1939 (Klein, 1971 trích trong Baltagi, 2008). Công việc nghiên cứu trong giai đoạn này bắt đầu từ kinh tế lượng chính thống và là sự phân tích có hệ thống, trong đó, lý thuyết thống kê đã được kết hợp với lý thuyết kinh tế nhằm mục đích ước lượng hệ số co dãn của cầu, sản phẩm cận biên và các mức độ ổn định của kinh tế vĩ mô. Trong những năm từ 1920 đến 1930, rất nhiều các chuyên gia thống kê và kinh tế ở Mỹ đã sử dụng kinh tế lượng để ước lượng hàm cầu, đặc biệt là hàm cầu của các sản phẩm nông nghiệp. Một ví dụ điển hình là hàm cầu khoai tây được nghiên cứu bởi Working vào năm 1935 (Pollock, 2014). Kỷ nguyên hiện đại của kinh tế lượng được bắt đầu từ những năm 1940 (Baltagi, 2008). Sự hợp lý hóa theo xác suất của phân tích hồi quy, được thúc đẩy bởi Koopmans (1937) và Haavelmo (1944), đã tạo ra nền tảng cho kinh tế lượng hiện đại (Geweke và cộng sự, 2006). Đóng góp của Haavelmo đã đánh dấu sự bắt đầu một kỷ nguyên mới của kinh tế lượng và mở đường cho sự phát triển nhanh của kinh tế lượng với phương pháp hợp lý đã đạt được các vấn đề quan trọng như công cụ cho việc xác định, ước lượng và suy luận trong kinh tế lượng (Geweke và cộng sự, 2006). Với sự thay đổi của kinh tế thế giới vào những năm 1970, từ sau cuộc khủng hoảng giá dầu mỏ, kinh tế lượng đã bước vào một chu kỳ phát triển mới (Geweke và cộng sự, 2006). Những mô hình kinh tế lượng đề cập đến các vấn đề kinh tế vĩ mô được xây dựng trong những năm 1950 - 1960 không còn phù hợp để phản ánh chính xác các vấn đề kinh tế trong những năm 1970. Điều này dẫn đến sự ra đời của các kỹ thuật ước lượng mới; các mô hình kinh tế lượng lớn hơn, phức tạp hơn, trong đó có việc sử dụng các mô hình kinh tế lượng động (dynamic econometrics models). Các mô hình này đã thúc đẩy việc đánh giá lại việc sử dụng các mô hình định lượng như công cụ dự báo và phân tích chính sách. 8
- Mô hình kinh tế động ra đời bởi vì trong kinh tế chúng ta thường quan tâm đến sự phản ứng động của một hiện tượng kinh tế (Y) đối với sự thay đổi của một hiện tượng kinh tế khác (X) và với hiện tượng X thay đổi liên tục, hệ thống có thể không đạt được tới điểm cân bằng. Thêm vào đó, bản chất của các mối quan hệ kinh tế đó là sự điều chỉnh của y theo sự thay đổi của x được phân bổ rộng rãi theo thời gian (Pollock, 2014). 1.3. Mục tiêu và nhiệm vụ của kinh tế lượng 1.3.1. Mục tiêu của kinh tế lượng Kinh tế lượng có 3 mục tiêu chính sau đây: (1) Thiết lập và xác định mô hình Bản chất của kinh tế lượng là lượng hóa các mối quan hệ trong kinh tế - xã hội. Vì vậy, mô hình kinh tế lượng luôn được bắt nguồn từ một lý thuyết kinh tế hoặc một mối quan hệ trong kinh tế - xã hội. Tuy nhiên, các mô hình này có thể khác nhau ở hình thức, số biến tùy thuộc vào các mối quan hệ kinh tế cụ thể mà mô hình dự định ước lượng. Ví dụ: Mô hình phản ánh mối quan hệ giữa lượng cầu và giá bán của một loại hàng hóa dịch vụ nào đó trong ngắn hạn là mô hình tuyến tính đơn giản (là dạng đường thẳng và chỉ có một yếu tố ảnh hưởng). Tuy nhiên, mô hình phản ánh mối quan hệ giữa lượng cầu với giá bán và thu nhập trong dài hạn sẽ là mô hình có nhiều biến (2 yếu tố ảnh hưởng). (2) Ước lượng và kiểm định mô hình Các mô hình được ước lượng dựa trên nền tảng tập hợp các số liệu quan sát được bởi thống kê. Rất nhiều các chu trình ước lượng khác nhau được sử dụng để nhận biết các giá trị định lượng của các hệ số chưa biết của mô hình. Bên cạnh đó, các mô hình này cũng cần được kiểm định sự phù hợp. Trên cơ sở của rất nhiều các mô hình thống kê khác nhau, một mô hình phù hợp và thích hợp nhất sẽ được lựa chọn. (3) Sử dụng mô hình để lập và phân tích chính sách Sau khi kiểm định, những mô hình đạt yêu cầu sẽ được sử dụng để dự báo, phân tích và lập chính sách. Đây là cơ sở quan trọng cho bất cứ quyết định chính sách nào. Kết quả dự báo từ mô hình sẽ giúp các nhà hoạch định chính sách có cơ sở để đánh giá sự phù hợp của các mối quan hệ kinh tế - xã hội và đưa ra những biện pháp cần thiết để điều chỉnh lại chính sách cho phù hợp. Ví dụ: Sau khi nghiên cứu mô hình kinh tế lượng phản ánh mối quan hệ giữa thuế tiêu thụ thuốc lá và lượng cầu thuốc lá kết quả mô hình cho thấy khi thuế thuốc lá tăng 9
- thêm 1% lượng cầu tiêu thụ thuốc lá giảm 2%, khi đó Chính phủ có thể áp dụng hình thức tăng thuế tiêu thụ thuốc lá để giảm thiểu lượng cầu tiêu thụ thuốc lá nhằm bảo vệ sức khỏe người tiêu dùng. 1.3.2. Nhiệm vụ của kinh tế lượng Kinh tế lượng có 3 nhiệm vụ chủ yếu sau: (1) Phân tích kinh tế Phân tích kinh tế chính là nhận biết các vấn đề thực tế diễn ra trong nền kinh tế. Sử dụng kinh tế lượng để phân tích kinh tế được thể hiện ở các mặt sau: (i) Nghiên cứu mối quan hệ giữa các yếu tố, giữa các hiện tượng kinh tế, xã hội; (ii) phân tích chiều hướng phát triển của các hiện tượng kinh tế; (iii) phân tích mức độ ảnh hưởng của các yếu tố, của các hiện tượng kinh tế - xã hội tới một hiện tượng kinh tế - xã hội khác; (iv) phân tích hiệu quả kinh tế và tối ưu; (vi) kiểm tra, kiểm định các lý thuyết, giả thuyết kinh tế. Các mô hình kinh tế lượng cho phép chúng ta ước lượng các vấn đề kinh tế quan trọng chẳng hạn xu hướng tiêu dùng cận biên, độ co dãn của lao động theo sản phẩm tại không gian và thời gian xác định, ví dụ xu hướng tiêu dùng cận biên của người dân Việt Nam và quý IV năm 2010. Thêm vào đó, với các giá trị định lượng thu được, các phương pháp kinh tế lượng cho phép chúng ta kiểm định các lý thuyết kinh tế, chẳng hạn hiệu quả đầu tư theo quy mô trong hàm sản xuất, mối quan hệ giữa lượng cầu và giá bán hàng hóa, dịch vụ. (2) Phân tích hiệu quả của các chính sách kinh tế Các phương pháp kinh tế lượng có thể được sử dụng để phân tích ảnh hưởng của các chính sách khác nhau đến kinh tế - xã hội để trên cơ sở đó các nhà hoạch định chính sách có sự điều chỉnh cho phù hợp. Ví dụ: Bằng việc sử dụng một mô hình kinh tế lượng thích hợp, chúng ta có thể phân tích được chính sách thuế nhập khẩu ô tô sẽ ảnh hưởng đến lượng cầu tiêu dùng ô tô tại Việt Nam như thế nào và từ đó xác định xem liệu chính sách thuế nhập khẩu ô tô này có hiệu quả trong việc giảm thiểu ùn tắc giao thông hay không. (3) Dự báo và đề xuất chính sách Các mô hình kinh tế lượng thường được sử dụng để dự báo giá trị của các hiện tượng kinh tế trong tương lai. Thông qua việc dự báo này các nhà hoạch định chính sách, các nhà quản lý sẽ đưa ra các chính sách nhằm giảm thiểu các rủi ro và bất định của nền kinh tế trong tương lai. 10
- 1.4. Vì sao phải nghiên cứu kinh tế lượng? Theo Gurajati (2004) mặc dù bản chất của kinh tế lượng là áp dụng lý thuyết kinh tế và các công cụ của toán, thống kê kinh tế, thống kê toán học tuy nhiên kinh tế lượng vẫn xứng đáng là một môn học cần được nghiên cứu độc lập bởi các lý do sau đây: - Lý thuyết kinh tế đưa ra những phát biểu hoặc những giả thuyết thường ở dưới dạng định tính (ví dụ, lý thuyết kinh tế vi mô phát biểu rằng: giả định trong điều kiện các yếu tố khác không đổi, khi giá một loại hàng hóa nào đó tăng lên, lượng cầu về loại hàng hóa đó sẽ giảm). Nếu chỉ dựa vào kết luận định tính về lý thuyết kinh tế, các nhà hoạch định chính sách cũng như các nhà quản lý sẽ gặp khó khăn trong việc đề xuất ra các chính sách có tính sát thực để phát triển kinh tế - xã hội. Trong khi đó, kinh tế lượng sẽ cung cấp các con số định lượng cho hầu hết các lý thuyết kinh tế (các mối quan hệ kinh tế). Ví dụ: Từ số liệu thực nghiệm thu thập được, kinh tế lượng sẽ chỉ ra được khi giá tăng 1 đơn vị, lượng cầu giảm 100 đơn vị. Trên cơ sở của các con số định lượng này, các nhà hoạch định chính sách, các chủ doanh nghiệp sẽ đưa ra được các chính sách, quyết định đúng đắn hơn (ví dụ: Tăng giá bán sản phẩm; hay không tăng giá bán sản phẩm). - Vấn đề được quan tâm chính trong toán kinh tế là biểu diễn lý thuyết kinh tế dưới dạng toán học (sử dụng phương trình hoặc mô hình) mà không liên quan đến việc chứng minh thực nghiệm các lý thuyết này. Trong khi đó, kinh tế lượng chủ yếu quan tâm đến việc chứng minh thực nghiệm các lý thuyết kinh tế thông qua kiểm định. Những chuyên gia kinh tế lượng sẽ sử dụng các phương trình đã được đề xuất bởi các chuyên gia toán kinh tế, tuy nhiên họ sẽ đưa thêm vào phần kiểm định thực nghiệm. - Thống kê kinh tế chủ yếu quan tâm đến việc thu thập, xử lý và trình bày các loại số liệu kinh tế (ví dụ: GNP, GDP, lãi suất, tỷ lệ thất nghiệp ) dưới dạng bảng biểu, đồ thị. Tuy nhiên, những loại số liệu thống kê kinh tế này mới chỉ là số liệu thô của kinh tế lượng. Thêm vào đó những chuyên gia thống kê kinh tế sẽ không đi xa hơn và không quan tâm đến việc sử dụng các số liệu thu thập được để kiểm định hoặc chứng minh các lý thuyết hoặc các mối quan hệ kinh tế. 11
- - Mặc dù thống kê toán học cung cấp rất nhiều các công cụ phân tích, những chuyên gia kinh tế lượng thường cần những phương pháp đặc biệt bởi vì tính chất đặc biệt của số liệu kinh tế (số liệu phi thực nghiệm, số liệu được thí nghiệm bởi người khác). Ví dụ: Số liệu về tiêu dùng, thu nhập, đầu tư, giá cả được thu thập từ các cá nhân, tổ chức là số liệu phi thực nghiệm. Những số liệu này sẽ được thu thập bởi các chuyên gia kinh tế lượng tuy nhiên nó sẽ chứa đựng những sai số (cách đo lường, thiếu số liệu ). Các chuyên gia kinh tế lượng sẽ phát triển các phương pháp phân tích để giải quyết những sai số của số liệu. Để trả lời câu hỏi “vì sao phải nghiên cứu kinh tế lượng?” chúng ta bắt đầu từ việc trả lời câu hỏi “kinh tế lượng làm được những gì?”. Trọng tâm của khoa học xã hội, bao gồm kinh tế là mối quan hệ giữa các chứng cứ thực nghiệm và sự nhận biết về lý thuyết. Kinh tế lượng về bản chất dựa vào những mối quan hệ này. Bên cạnh đó, theo Hoover (2005) kinh tế lượng còn có 4 vai trò quan trọng đó là: - Kinh tế lượng được dùng để kiểm định hàm ý của một lý thuyết kinh tế; - Kinh tế lượng được dùng để đo lường giá trị chưa biết của các biến được định nghĩa theo lý thuyết hoặc những biến không thể quan sát được; - Kinh tế lượng được dùng để dự báo giá trị của các hiện tượng kinh tế; - Kinh tế lượng được sử dụng để mô tả đặc tính của một mối quan hệ kinh tế hoặc một hiện tượng kinh tế. Vì sao phải nghiên cứu kinh tế lượng? Bởi vì kinh tế lượng là một công cụ vô cùng quan trọng giúp cho các nhà kinh tế, các nhà hoạch định chính sách có thể lượng hóa được các quy luật kinh tế, có thể dự đoán, dự báo xu hướng biến động của các sự vật hiện tượng trong tương lai. Nếu như kinh tế vĩ mô mô tả sự vận động của toàn bộ nền kinh tế, kinh tế vi mô mô tả hành vi của người sản xuất và người tiêu dùng, thì kinh tế lượng trang bị cho các nhà kinh tế một phương pháp lượng hóa và phân tích sự vận động của các hành vi trên. Trên cơ sở đó các nhà kinh tế, các nhà hoạch định chính sách, các chủ doanh nghiệp có thể đề ra được các chính sách cho phù hợp với sự phát triển của doanh nghiệp và toàn bộ nền kinh tế. 12
- Nghiên cứu kinh tế lượng rất cần thiết đối với sinh viên và những người nghiên cứu trong lĩnh vực kinh tế, quản trị kinh doanh. Bởi vì, sau khi tốt nghiệp họ sẽ trở thành những nhà kinh tế, những nhà hoạch định chính sách. Thông thường, các nhà kinh tế xuất hiện như các chuyên gia làm chứng cho việc hoạch định chính sách của các cơ quan chính phủ. Ví dụ: Các nhà kinh tế có thể sử dụng kinh tế lượng để dự báo về quy mô, lãi suất, lượng cung, lượng cầu của thị trường tiền tệ và thị trường đối với các hàng hóa dịch vụ khác. Trên cơ sở dự báo này, chính phủ sẽ đưa ra các chính sách phù hợp để quản lý hiệu quả thị trường tiền tệ cũng như thị trường đối với các loại hàng hóa, dịch vụ khác. Có nguồn gốc từ nghiên cứu định lượng trong kinh tế, ra đời vào những năm 1930, phát triển mạnh mẽ trong giai đoạn 1940 - 1970, kinh tế lượng đã chứng minh được vai trò rất quan trọng trong nghiên cứu các vấn đề kinh tế, xã hội. Bằng việc áp dụng kinh tế lượng trong nghiên cứu các vấn đề kinh tế - xã hội đã có rất nhiều người đạt được giải Nobel kinh tế, chẳng hạn: Ragnar Frisch và Tinbergen năm 1969 (Hansen, 2016), James Heckman và Daniel McFadden năm 2000, Clive Grager và Robert Engle năm 2003 (Baltagi, 2008). Vào năm 1987, Pagan đã kết luận rằng kinh tế lượng là một sự “thành công vượt bậc” trong nghiên cứu kinh tế (Baltagi, 2008). Cũng theo kết luận của Baltagi (2008), nghiên cứu kinh tế sẽ rất khó khăn nếu như không áp dụng kinh tế lượng chuyên sâu vào các công việc thực nghiệm. Geweke và cộng sự (2006) cũng chỉ ra rằng lý thuyết và thực hành kinh tế lượng cung cấp thông tin cần thiết cho sự ra quyết định trong cả chính sách kinh tế công và chính sách kinh tế của lĩnh vực tư nhân. Thành công trong đề xuất chính sách phát triển kinh tế, xã hội đến từ việc kết hợp đồng thời sự cải tiến của kinh tế lượng, lý thuyết kinh tế, và số liệu. Sự kết hợp chính xác giữa những yếu tố này mang lại triển vọng to lớn cho sự đóng góp của khoa học kinh tế đối với phát triển của xã hội. Ngày nay, sự phát triển nhanh của các phần mềm máy tính đã giúp cho các phương pháp kinh tế lượng ngày càng được áp dụng rộng rãi trong nghiên cứu kinh tế, xã hội (Baltagi, 2008). 13
- 1.5. Phương pháp luận của kinh tế lượng Phân tích kinh tế lượng được thực hiện theo các bước sau (xem sơ đồ): Nêu ra giả thuyết kinh tế Thiết lập mô hình lý thuyết Thu thập số liệu Ước lượng mô hình thực nghiệm Kiểm định sự phù hợp của mô hình Phân tích kết quả của mô hình Sử dụng kết quả để dự báo, điều chỉnh, và đề xuất chính sách Bước 1: Nêu ra các giả thuyết (các vấn đề quan tâm) về các mối quan hệ giữa các biến kinh tế Đây là một bước đóng một vai trò vô cùng quan trọng đối với việc sử dụng kinh tế lượng để phân tích mối quan hệ giữa các hiện tượng kinh tế. Sai sót trong xác định vấn đề hoặc hiểu sai về bản chất của các mối quan hệ trong kinh tế dẫn đến sự suy luận sai và từ đó sẽ đưa ra các chính sách sai hoặc không phù hợp với thực tế. Để có được các giả thuyết phản ánh được đúng bản chất của các mối quan hệ kinh tế, xã hội trong quá trình xác định vấn đề nghiên cứu, chúng ta cần đặt ra một số câu hỏi như sau: - Vấn đề chúng ta nghiên cứu phát triển theo chiều hướng nào? 14
- - Hiện tượng kinh tế chúng ta nghiên cứu có quan hệ với yếu tố nào? - Bản chất của các mối quan hệ giữa các yếu tố là gì? - Mức ảnh hưởng của các yếu tố đến một hiện tượng kinh tế xã hội nào đó là nhiều hay ít? Dựa vào các giả thuyết để chúng ta lựa chọn dạng, lựa chọn biến và kiểm định ý nghĩa của mô hình. Giả sử khi nghiên cứu về mối quan hệ giữa thuế tiêu thụ thuốc lá và lượng cầu thuốc lá người ta đặt ra giả thiết là: “Trong điều kiện các yếu tố khác không thay đổi, khi thuế tiêu thụ thuốc lá tăng lên thì lượng cầu thuốc lá sẽ giảm”. Bước 2: Thiết lập mô hình lý thuyết Mô hình kinh tế lượng được thiết lập để mô tả mối quan hệ giữa các yếu tố được nêu ra trong giả thuyết. Để thiết lập được mô hình kinh tế lượng ở dạng lý thuyết chúng ta phải: (1) Căn cứ vào quy luật phát triển của các hiện tượng kinh tế; và (2) dựa vào sự phân bố của số liệu. Bên cạnh đó, trước khi xây dựng mô hình kinh tế lượng đòi hỏi chúng ta phải xác định được các biến (yếu tố) sẽ đưa vào mô hình. Sự lựa chọn các biến của mô hình phụ thuộc vào mục tiêu nghiên cứu và sự hiểu biết về vấn đề nghiên cứu. Sự lựa chọn đúng các biến sẽ giúp cho việc suy luận thống kê càng chính xác, trên cơ sở đó các chính sách phát triển kinh tế, xã hội đưa ra càng chính xác. Mô hình kinh tế lượng lý thuyết phản ánh giả thuyết nghiên cứu được dựa trên mô hình toán. Mô hình được thiết lập để mô tả mối quan hệ giữa các yếu tố được nêu ra trong giả thuyết phải đơn giản, dễ tính toán kết quả dễ giải thích và sai số của mô hình phải là ít nhất. Ví dụ: Giả sử ta nghiên cứu mối quan hệ giữa lượng cầu thuốc lá và thuế tiêu thụ thuốc lá tại một vùng nào đó, ta có thể thiết lập một mô hình kinh tế lượng để mô tả mối quan hệ này như sau: D Q = β1 + β2T + ui Trong đó: + QD: là lượng cầu thuốc lá (bao/người/tháng); + T: là thuế tiêu thụ thuốc lá (%); + β1: là hệ số tự do (hệ số chặn) của mô hình; + β2: là hệ số góc của mô hình (hệ số ảnh hưởng của thuế tiêu thụ tới lượng cầu thuốc lá); + ui: là sai số ngẫu nhiên (sẽ được giải thích chi tiết ở chương sau). 15
- Bước 3: Thu thập số liệu Để ước lượng được các hệ số của mô hình, góp phần kiểm định được các giả thuyết kinh tế thì cần phải tiến hành thu thập số liệu. Số liệu là thức đo cần thiết để phản ánh mối quan hệ giữa các hiện tượng kinh tế, xã hội mà đã được phát biểu trong bước 1. Số liệu trong phân tích kinh tế lượng có thể là số liệu đã được công bố hoặc các số liệu thu thập thông qua điều tra phỏng vấn trực tiếp. Bên cạnh đó, người nghiên cứu cũng phải quyết định xem số liệu sử dụng cho mô hình kinh tế lượng sẽ là số liệu định lượng hay số liệu định tính. Kinh tế lượng đòi hỏi mẫu số liệu khá lớn, số mẫu càng lớn thì mô hình xây dựng càng chính xác và có tính thực tế cao. Ngoài ra, chọn mẫu đại diện cũng được quan tâm trong nghiên cứu kinh tế nói chung và áp dụng kinh tế lượng trong nghiên cứu các vấn đề kinh tế, xã hội nói riêng. Bước 4: Ước lượng mô hình thực nghiệm Ước lượng các hệ số của mô hình nhằm xác định được số đo về mức độ ảnh hưởng của các biến với số liệu hiện có. Các ước lượng này về bản chất là các kiểm định thực nghiệm cho lý thuyết kinh tế. Trong mô hình ở ví dụ nêu trên, khi ta ước lượng được hệ số β2 ta sẽ xác định được mức độ thay đổi lượng cầu thuốc lá khi thuế tiêu thụ thuốc lá thay đổi. Việc ước lượng các hệ số của mô hình kinh tế lượng được dựa trên các lý thuyết, các phương pháp đặc thù (chủ yếu là phương pháp bình phương nhỏ nhất). Bên cạnh đó, do sự phát triển của khoa học máy tính ngày nay có rất nhiều các phần mềm được phát triển nhằm hỗ trợ cho việc ước lượng các hệ số của mô hình kinh tế lượng. Có rất nhiều các phần mềm máy tính hỗ trợ cho việc ước lượng các mô hình kinh tế lượng như: Limdep, SPSS, Eview, Stata Bước 5: Kiểm định sự phù hợp mô hình Kiểm định sự phù hợp của mô hình được tiến hành nhằm cung cấp cơ sở cho việc sử dụng mô hình kinh tế lượng trong dự báo phân tích chính sách. Sau khi kiểm định nếu mô hình tồn tại thì các nhà hoạch định chính sách, các chuyên gia phân tích có thể sử dụng mô hình này vào việc dự báo và phân tích chính sách. Việc kiểm tra, kiểm định mô hình được căn cứ vào các yếu tố: Dấu của các hệ số trong mô hình, độ lớn của các tham số trong mô hình, độ tin cậy của các hệ số trong mô hình và độ chặt chẽ của mô hình. Bước 6: Phân tích kết quả của mô hình Căn cứ vào mô hình đã được ước lượng, kiểm định và dựa trên lý thuyết 16
- kinh tế các nhà hoạch định chính sách sẽ phân tích và đánh giá kết quả ước lượng được về mối quan hệ giữa các hiện tượng kinh tế, xã hội. Bên cạnh đó, các kết quả ước lượng cũng được xem xét có phù hợp với lý thuyết kinh tế hay không. Việc phân tích kết quả của mô hình được thể hiện qua các mặt sau: - Phân tích chiều hướng biến động của các hiện tượng kinh tế xã hội; - Phân tích mối quan hệ giữa các yếu tố; - Phân tích mức độ ảnh hưởng của các yếu tố tới một hiện tượng kinh tế xã hội nào đó; - Phân tích tối ưu. Sau khi phân tích kết quả, các nhà hoạch định chính sách có thể dựa vào kết quả của mô hình để dự báo và điều chỉnh chính sách cho phù hợp. Ví dụ: Trong mô hình phản ánh mối quan hệ giữa thuế tiêu thụ thuốc lá và lượng cầu thuốc lá nêu trên, nếu hệ số β2 < 0 thì ước lượng này phù hợp với lý thuyết kinh tế. Căn cứ vào mô hình này chúng ta có thể dự báo (tính toán) được lượng cầu tiêu thụ thuốc lá tại một mức thuế cụ thể. Bước 7: Sử dụng kết quả của mô hình để dự báo, điều chỉnh, đề xuất chính sách Sau khi kiểm định sự phù hợp nếu như mô hình phù hợp với lý thuyết kinh tế thì chúng ta có thể sử dụng mô hình đó để dự báo. Nếu như ta xây dựng được mô hình đúng và tìm ra được quy luật của sự biến động thì ta có thể sử dụng kết quả đó để đề ra chính sách. Tuy nhiên, tìm ra bản chất của một vấn đề kinh tế là một việc không đơn giản. Vì vậy, đòi hỏi phải tiến hành phân tích, kiểm định các vấn đề kinh tế nhiều lần như là các phép lặp cho đến khi chúng ta thu được một mô hình đúng và phải thực hiện đúng theo quy trình phân tích kinh tế lượng đã nêu ở trên. Ví dụ: Căn cứ vào mô hình phản ánh mối quan hệ giữa thuế tiêu thụ và lượng cầu thuốc lá giả sử kết quả mô hình chỉ ra rằng khi thuế tiêu thụ thuốc lá tăng 1% thì lượng cầu thuốc lá giảm 5%. Khi đó căn cứ vào kết quả này, các nhà phân tích có thể dự báo được chính xác lượng cầu thuốc lá sẽ giảm đi bao nhiêu % khi chính phủ áp dụng mức thuế tiêu thụ thuốc lá 10%. Trên cơ sở đó, các nhà hoạch định chính sách sẽ đề xuất với chính phủ mức thuế tiêu thụ thuốc lá hợp lý nhằm mục tiêu giảm lượng cầu tiêu thụ thuốc lá và từ đó giảm thiểu tỷ lệ người hút thuốc lá nhằm mục tiêu bảo vệ sức khỏe cho cộng đồng. 17
- 1.6. Số liệu sử dụng trong kinh tế lượng Một câu hỏi chung nhất của kinh tế lượng đó là “làm thế nào để lượng hóa được tác động của một hay một tập hợp các hiện tượng kinh tế, xã hội (các yếu tố) tới một hiện tượng kinh tế, xã hội khác”. Về mặt ý tưởng, để trả lời được câu hỏi này chúng ta sẽ phải tiến hành thí nghiệm và thu thập số liệu thực nghiệm. Ví dụ: Để đánh giá tác động của học vấn (số năm đi học) đến thu nhập của con người, chúng ta phải tiến hành một thí nghiệm bao gồm các bước: (1) Chia ngẫu nhiên một số lượng người từ lúc còn trẻ thành các nhóm khác nhau theo các bậc học khác nhau; (2) theo dõi những nhóm người này để đo đếm mức thu nhập của họ khi họ tham gia vào lực lượng lao động; (3) đo lường sự khác biệt về thu nhập của những nhóm người này căn cứ vào trình độ học vấn của họ. Tuy nhiên, thí nghiệm kiểu này trong thực tế thường khó thực hiện vì nó thường bị chỉ trích và trái với đạo đức do liên quan đến vấn đề riêng tư của con người (Hansen, 2016). Vì vậy, số liệu sử dụng trong kinh tế lượng chủ yếu số liệu phi thực nghiệm (non-experimental data) hay còn được gọi là số liệu quan sát (observational data). Số liệu phi thực nghiệm là số liệu thu thập không phải bằng cách xây dựng các thí nghiệm trực tiếp và sau đó ghi chép lại kết quả của mà được thu thập bằng cách phỏng vấn những những người tiến hành thí nghiệm hoặc tham gia thí nghiệm. Trong ví dụ về đánh giá tác động của học vấn đến thu nhập, số liệu được sử dụng trong nghiên cứu sẽ được thu thập thông qua phỏng vấn các đối tượng với trình độ học vấn và thu nhập khác nhau. Số liệu sử dụng trong kinh tế lượng (số liệu phi thực nghiệm) được phân chia thành các loại khác nhau tùy thuộc vào tiêu chí. Nếu chia theo hình thức thu thập, số liệu được phân loại thành số liệu thứ cấp và số liệu sơ cấp. Số liệu thứ cấp là số liệu đã được thu thập, tính toán và công bố bởi những người nghiên cứu trước đó. Số liệu thứ cấp có thể được thu thập thông qua báo cáo, kết quả nghiên cứu của các cá nhân, tổ chức. Trong khi đó, số liệu sơ cấp là số liệu do bản thân người nghiên cứu tiến hành thu thập trực tiếp thông qua quan sát, phỏng vấn hoặc điều tra chọn mẫu. Nếu căn cứ vào cấu trúc, số liệu kinh tế được phân chia thành ba loại chính bao gồm: số liệu thời điểm (cross-section data), số liệu theo chuỗi thời gian (time series data), số liệu kết hợp (Panel/Pooled/Longitudinal data). 18
- Số liệu thời điểm là số liệu điều tra về một vấn đề của một tập hợp các cá nhân, tổ chức tại cùng một mốc thời gian. Ví dụ: Tập hợp số liệu về thu nhập và chi tiêu của 500 người dân Hà Nội tại thời điểm năm 2019 được gọi là số liệu thời điểm. Số liệu theo chuỗi thời gian là số liệu về một vấn đề của một cá nhân, tổ chức và được theo dõi ở nhiều mốc thời gian khác nhau. Mốc thời gian có thể là ngày, tuần, tháng, quý, hoặc năm. Số liệu theo chuỗi thời gian thời gian thường có mối quan hệ trực tiếp với các vấn đề kinh tế vĩ mô (GNP, GDP, tỷ lệ lạm phát, tỷ lệ thất nghiệp, mức đầu tư ). Ví dụ: Một tập hợp số liệu về GDP của Việt Nam trong giai đoạn 1990 - 2019 được gọi là số liệu theo chuỗi thời gian. Số liệu kết hợp (số liệu gộp) là số liệu về một hay nhiều vấn đề của nhiều cá nhân, tổ chức khác nhau và được theo dõi ở hai mốc thời gian trở lên. Số liệu gộp là tập hợp các cá nhân, tổ chức, doanh nghiệp được điều tra lặp lại theo thời gian. Ví dụ: Tập hợp số liệu về vốn đầu tư trực tiếp nước ngoài (FDI) của 63 tỉnh, thành phố trên toàn lãnh thổ Việt Nam trong giai đoạn 1990 - 2019 được gọi là số liệu gộp (hoặc số liệu kết hợp). Như đã đề cập ở trên, số liệu sử dụng trong kinh tế nói chung và trong phân tích kinh tế lượng nói riêng là số liệu quan sát hay số liệu phi thực nghiệm (số liệu về GNP, số người thất nghiệp, tỷ lệ lạm phát ). Vì vậy, nhược điểm lớn nhất của số liệu kinh tế đó là thiếu chính xác. Nguyên nhân là do: - Hầu hết số liệu dùng trong khoa học xã hội đều là các số liệu phi thực nghiệm (số liệu không phải do người nghiên cứu tiến hành thí nghiệm trực tiếp). Do vậy, số liệu trong nghiên cứu kinh tế - xã hội thường xảy ra các sai sót (thiếu chính xác) bởi một số nguyên nhân sau đây: - Trong các cuộc điều tra bằng câu hỏi, có nhiều vấn đề không nhận được câu trả lời hoặc nếu có trả lời thì người trả lời cung cấp thiếu hoặc không trả lời hết các câu hỏi; - Các mẫu thu thập trong các cuộc điều tra rất khác nhau về kích cỡ cho nên rất khó khăn trong việc so sánh kết quả giữa các đợt điều tra; - Các số liệu kinh tế thường có sẵn ở mức tổng hợp cao, không cho phép đi sâu vào các đơn vị nhỏ; - Ngoài ra, còn có các số liệu mà ta cần phân tích lại thuộc phạm vi bí mật quốc gia mà không phải ai cũng có thể sử dụng được. 19
- Do vậy, kết quả nghiên cứu trong kinh tế lượng sẽ phụ thuộc vào chất lượng của các số liệu được sử dụng và phụ thuộc vào dạng mô hình được lựa chọn (chúng ta sẽ nghiên cứu sâu vấn đề này ở các chương sau). Xuất phát từ một số nguyên nhân dẫn đến sự thiếu chính xác của các số liệu thường được sử dụng trong phân tích kinh tế lượng, có một câu hỏi đặt ra là: Số liệu dùng trong phân tích kinh tế lượng có các nguyên tắc gì? Biện pháp khắc phục các nhược điểm của số lịêu đã được nêu ở trên là gì? Câu trả lời ở đây là: Số liệu sử dụng cho phân tích kinh tế lượng phải đảm bảo các nguyên tắc sau: đầy đủ, chính xác, hợp lệ và phù hợp với mục đích nghiên cứu. Và để đạt được các nguyên tắc trên và khắc phục các nhược điểm của số liệu trong phân tích kinh tế lượng cần phải chú ý các vấn đề sau: - Chuẩn bị tốt biểu mẫu điều tra bao gồm biểu điều tra, chỉ tiêu điều tra và các câu hỏi trong điều tra đảm bảo tính đơn giản, khoa học và thuận lợi cho cả người điều tra và người được điều tra; - Chọn số mẫu điều tra: Số mẫu điều tra phải đủ lớn và đại diện cho tổng thể, mẫu phải miêu tả được các nội dung chủ yếu của tổng thể, tránh sai số lớn trong chọn mẫu. Trong nghiên cứu kinh tế - xã hội số liệu được thu thập chủ yếu dựa trên điều tra chọn mẫu. Trên thực tế có rất nhiều các phương pháp chọn mẫu khác nhau: chọn mẫu ngẫu nhiên đơn giản, chọn mẫu ngẫu nhiên theo bước lặp, chọn mẫu ngẫu nhiên phân tầng, chọn mẫu phi ngẫu nhiên Để đảm bảo độ chính xác của số liệu sử dụng trong nghiên cứu kinh tế - xã hội, người nghiên cứu phải chú ý đến tính chất “đại diện” của mẫu nghiên cứu theo nguyên tắc của thống kê. Bên cạnh đó để hạn chế sai sót của số liệu sử dụng trong kinh tế lượng, người nghiên cứu cũng cần thực hiện tốt các nguyên tắc sau đây: - Tổ chức công tác điều tra tốt: Chọn thời điểm điều tra, trình độ chuyên môn của người làm công tác điều tra, đảm bảo tính khách quan và chính xác khi thu thập số liệu; - Kiểm tra và chỉnh lý số liệu điều tra: Số liệu điều tra phải được kiểm tra lại để phát hiện những điều bất hợp lý trong quá trình điều tra để chỉnh lý kịp thời; - Số liệu phải được tổng hợp tốt tránh sai sót khi tính toán. 20
- Câu hỏi ôn tập chương 1 1. Kinh tế lượng là gì? Trình bày tóm tắt lịch sử hình thành và phát triển của kinh tế lượng? 2. Trình bày tóm tắt các bước trong phương pháp luận của kinh tế lượng? 3. Hãy cho biết vai trò của kinh tế lượng trong việc ra quyết định của các doanh nghiệp và của cả nền kinh tế? 4. Để giảm thiểu ô nhiễm môi trường Chính phủ tăng thuế xăng, dầu nhằm mục đích hạn chế phương tiện cá nhân tham gia giao thông. Giả sử bạn được Công ty ô tô Toyota thuê để đánh giá tác động của việc tăng thuế xăng, dầu đến lượng cầu tiêu thụ ô tô tại thị trường Việt Nam, bạn sẽ vận dụng lý thuyết kinh tế lượng như thế nào để tư vấn cho công ty này? 21
- Chương 2 TỒNG QUAN VỀ MÔ HÌNH HỒI QUY Mục tiêu của Chương 2 nhằm cung cấp cho người học các lý thuyết cơ bản về: hồi quy, mô hình hồi quy; mục tiêu của phân tích hồi quy; mô hình hồi quy tổng thể; mô hình hồi quy mẫu và sai số trong mô hình hồi quy. 2.1. Giới thiệu về mô hình hồi quy Như đã đề cập trong chương 1, kinh tế lượng được hình thành dựa trên cơ sở của lý thuyết hồi quy. Vì vậy, khi nói đến kinh tế lượng thực tế là chúng ta tìm hiểu và phân tích các mô hình hồi quy. 2.1.1. Khái niệm hồi quy, mô hình hồi quy Theo Gurajati (2004) thuật ngữ hồi quy được giới thiệu và sử dụng lần đầu bởi Francis Galton vào năm 1886 để mô tả mối liên hệ giữa chiều cao của những đứa trẻ và chiều cao cha mẹ của chúng (Hình 2.1). Yi Giá trị bình quân Xi Hình 2.1. Mô phỏng mối quan hệ hồi quy giữa chiều cao của con và chiều cao của bố theo nghiên cứu của Galton Nguồn: Gujarati và Porter, 2009 Trong nghiên cứu này, Galton đã chỉ ra rằng mặc dù có một xu hướng đó là những cha mẹ cao thường có những đứa con cao và những cha mẹ thấp thường 22
- có những đứa con thấp. Tuy nhiên, chiều cao bình quân của những đứa trẻ được sinh ra của những cặp bố mẹ có chiều cao xác định thường có xu hướng chuyển dịch hoặc thoái lui hướng về chiều cao trung bình của toàn bộ dân số. Kết quả này được Galton gọi là “quy luật hồi quy chung” và quy luật này được khẳng định bởi Karl Pearson sau khi ông ta thu thập và phân tích số liệu về chiều cao của hàng nghìn đứa trẻ và cha mẹ của chúng ở Vương quốc Anh (Gurajati, 2004). Theo mô phỏng trong Hình 2.1 tại mỗi một mức chiều cao của người bố (đã được xác định trước) sẽ cho rất nhiều các kết quả khác nhau về chiều cao của những đứa con. Theo xu hướng chung (dựa vào biểu đồ phân tán) thì chiều cao trung bình của những đứa trẻ có xu hướng tăng lên khi chiều cao của những ông bố tăng. Như vậy, chiều cao của những đứa trẻ (Yi) là một biến số phụ thuộc vào chiều cao của các ông bố (Xi). Tại mỗi giá trị về chiều cao của ông bố, người ta sẽ xác định được chiều cao trung bình của những đứa con và đường thẳng nối các điểm giá trị trung bình về chiều cao của những đứa trẻ được gọi là đường hồi quy (Regression line). Cách giải thích về thuật ngữ hồi quy ngày nay có một sự khác biệt so với thuật ngữ hồi quy của Galton, theo cách hiểu chung nhất “Hồi quy hay phân tích hồi quy là sự nghiên cứu mối quan hệ phụ thuộc giữa một biến đã cho (gọi là là biến phụ thuộc hoặc biến được giải thích) và một hoặc nhiều biến khác (gọi là biến độc lập hoặc biến giải thích) nhằm ước lượng hoặc dự báo giá trị trung bình của biến phụ thuộc với các giá trị đã biết của các biến độc lập” (Gurajati, 2004). Trong nghiên cứu kinh tế - xã hội, phân tích hồi quy thường được dùng để nghiên cứu, đánh giá mức độ ảnh hưởng của một hoặc nhiều hiện tượng kinh tế, xã hội (nguyên nhân ảnh hưởng) đến một hiện tượng kinh tế, xã hội khác (vấn đề cần được nghiên cứu, điều chỉnh). Mô hình hồi quy: Mô hình toán học được xây dựng trên cơ sở lý thuyết của thống kê suy đoán để phản ánh mối quan hệ phụ thuộc giữa một biến phụ thuộc với một hoặc nhiều các biến độc lập (Từ điển Cambridge). Ví dụ: Khi nghiên cứu mức độ ảnh hưởng của thu nhập đến mức chi tiêu cá nhân, ta có thể sử dụng mô hình hồi quy như sau: C = β0 + β1I + ui (1) 23
- Trong đó: + C: là mức tiêu dùng cá nhân (biến phụ thuộc); + I: là thu nhập thực tế của cá nhân (biến độc lập); + β0, β1: là các hệ số của mô hình; + ui: là sai số ngẫu nhiên. Mô hình (1) mô tả mối quan hệ giữa chi phí tiêu dùng cá nhân (C) và mức thu nhập cá nhân (I). Việc xây dựng và phân tích mô hình trên sẽ giúp chúng ta trả lời được câu hỏi: Chi phí tiêu dùng cá nhân của một người nào đó sẽ thay đổi (tăng hay giảm) như thế nào và mức độ thay đổi sẽ là bao nhiêu khi thu nhập cá nhân của họ tăng thêm 1 đơn vị (ví dụ 1 triệu đồng/tháng)? Căn cứ vào kết quả của mô hình này, các nhà hoạch định chính sách có thể dự báo mức chi tiêu của người dân khi thu nhập họ đạt được một mức thu nhập cụ thể. Trên cơ sở đó, những người làm chính sách sẽ đưa ra được những chính sách phù hợp hơn với sự phát triển của xã hội trong thực tế. Một ví dụ khác, khi nghiên cứu mối quan hệ giữa giá cả một loại hàng hóa D nào đó (Pi) với lượng cầu của chúng (Q ), ta có thể sử dụng mô hình hồi quy: D Q = α0 + α1Pi + ui (2) Trong đó: + QD: là lượng cầu (biến phụ thuộc); + Pi: là giá bán (biến độc lập); + α0, α1: là các hệ số của mô hình; + ui: là sai số ngẫu nhiên. Thông qua mô hình (2) chúng ta sẽ biết được khi giá bán (Pi) tăng thêm 1 đơn vị thì lượng cầu (QD) sẽ giảm đi bao nhiêu đơn vị. Bên cạnh đó, cũng từ mô hình này chúng ta sẽ dự báo được khi giá bán (Pi) ở một mức xác định, lượng cầu (QD) khi đó sẽ là bao nhiêu. Dựa vào các phân tích này, các chủ doanh nghiệp sẽ có cơ sở để đưa ra quyết định có nên tăng giá bán sản phẩm hay không. Trong nghiên cứu mô hình hồi quy có một lưu ý rất quan trọng đó là cần xác định rõ biến nào là biến phụ thuộc và biến nào là biến độc lập. Thông thường biến phụ thuộc chính là một vấn đề kinh tế, xã hội mà chúng ta cần can thiệp hoặc điều chỉnh, trong khi đó biến độc lập là các yếu tố (nguyên nhân) ảnh hưởng đến vấn đề đó. 24
- 2.1.2. Mục tiêu của phân tích hồi quy Phân tích hồi quy có một số mục tiêu cơ bản đó là: a. Ước lượng giá trị trung bình của biến phụ thuộc với những giá trị của biến độc lập đã cho Trên cơ sở số liệu thu thập được về biến phụ thuộc, biến độc lập một mô hình hồi quy sẽ được ước lượng. Thông qua mô hình ước lượng này giá trị trung bình của biến phụ thuộc sẽ được xác định trên cơ sở mối quan hệ với các biến độc lập đã được xác định. Ví dụ, sau khi thu thập số liệu về thu nhập và chi tiêu của một nhóm người cụ thể, thông qua việc xây dựng mô hình kinh tế lượng giá trị trung bình về chi tiêu của mỗi người sẽ được xác định trên cơ sở của mối liên hệ phụ thuộc với thu nhập của họ. Tương tự như vậy, từ số liệu về giá bán và lượng cầu tiêu dùng một loại hàng hóa của được thu thập từ một nhóm người tiêu dùng cụ thể, thông qua mô hình hồi quy lượng cầu tiêu dùng bình quân loại hàng hóa đó của một người tiêu dùng sẽ được xác định trên cơ sở mối quan hệ phụ thuộc với giá bán của loại hàng hóa đó. b. Kiểm định giả thuyết về bản chất của sự phụ thuộc Đây chính là quá trình phân tích ảnh hưởng của biến độc lập đến sự thay đổi (tăng hoặc giảm) của biến phụ thuộc. Thông qua quá trình phân tích này chúng ta sẽ xác định được mối quan hệ giữa một hiện tượng kinh tế, xã hội với các yếu tố ảnh hưởng là quan hệ cùng chiều hay quan hệ ngược chiều. Trong các ví dụ trên, kiểm định giả thuyết về bản chất của sự phụ thuộc chính là phân tích ảnh hưởng của sự tăng thu nhập (hoặc giá cả hàng hóa) đến chi tiêu cá nhân (hoặc lượng cầu hàng hóa). Về bản chất chúng ta phải kiểm định các giả thuyết hoặc trả lời các câu hỏi: Thu nhập nhập cá nhân có thực sự ảnh hưởng đến chi tiêu cá nhân không? Nếu có, khi thu nhập tăng thêm một đơn vị, chi tiêu cá nhân sẽ tăng thêm bao nhiêu đơn vị? Hoặc, giá cả hàng hóa có ảnh hưởng đến lượng cầu hàng hóa đó hay không? Nếu có, khi giá hàng hóa tăng thêm một đơn vị, lượng cầu loại hàng hóa đó của người tiêu dùng sẽ giảm bao nhiêu đơn vị? c. Kiểm định các lý thuyết kinh tế Phân tích hồi quy còn giúp chúng ta kiểm định các lý thuyết kinh tế. Trong ví dụ về mối quan hệ giữa chi tiêu và thu nhập, lý thuyết kinh tế vĩ mô phát biểu rằng “thông thường mọi người sẽ chi tiêu một mức nhỏ hơn thu nhập của mình” (tức là hệ số β1 < 1). Sau khi thu thập số liệu về chi tiêu và thu nhập của một 25
- nhóm người thông qua ước lượng mô hình hồi quy chúng ta sẽ kiểm định được lý thuyết kinh tế này. Nếu hệ số góc của mô hình (β1) nhỏ hơn 1, khi đó lý thuyết kinh tế này đã được kiểm chứng và mối quan hệ giữa chi tiêu và thu nhập của nhóm người này đã thỏa mãn theo quy luật của kinh tế vĩ mô. Trong ví dụ về mối quan hệ giữa lượng cầu và giá bán một loại hàng hóa nào đó, lý thuyết kinh tế vi mô phát biểu rằng “thông thường khi giá bán một loại hàng hóa nào đó tăng lên, lượng cầu tiêu dùng loại hàng hóa đó sẽ giảm đi”. Theo lý thuyết, điều này có nghĩa là hệ số góc của mô hình hồi quy phản ánh mối quan hệ giữa lượng cầu và giá bán loại hàng hóa này sẽ mang dấu âm. Sau khi ước lượng nếu hệ số góc của mô hình này mang dấu âm, khi đó lý thuyết kinh tế về luật cầu đã được kiểm định. d. Dự báo giá trị của biến phụ thuộc trên cơ sở sự thay đổi của biến độc lập Thông qua mô hình hồi quy giá trị của biến phụ thuộc sẽ được dự báo với bất cứ giá trị nào đã biết của biến độc lập. Chúng ta có thể áp dụng dự báo này trong thực tế để phân tích tốc độ phát triển của một hiện tượng kinh tế xã hội nào đó trong tương lai (tốc độ tăng trưởng GDP ). Trong ví dụ về mối quan hệ giữa chi tiêu và thu nhập, thông qua mô hình hồi quy ước lượng chúng ta có thể dự đoán được mức tiêu dùng bình quân của một cá nhân tại các mức thu nhập đã biết. Trong mô hình hồi quy phản ánh mối quan hệ giữa lượng cầu và giá bán, chúng ta có thể dự báo được lượng cầu bình quân tại các mức giá cụ thể đã biết. 2.1.3. Phân biệt các mối quan hệ trong mô hình hồi quy a. Phân biệt giữa quan hệ toán học (chính xác) và quan hệ hồi quy Mặc dù mô hình hồi quy được xây dựng trên cơ sở lý thuyết hàm số của toán học, tuy nhiên mối quan hệ hàm số trong toán học lại có sự khác biệt rõ rệt so với mối quan hệ trong mô hình hồi quy. Vấn đề mấu chốt trong phân tích hồi quy là sự phụ thuộc thống kê của biến phụ thuộc vào một hay nhiều biến giải thích. Do đó, biến phụ thuộc trong phân tích hồi quy là biến ngẫu nhiên, bởi vì ứng với mỗi giá trị đã biết của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc. Trong quan hệ hàm số biến phụ thuộc không phải là biến ngẫu nhiên, tức là ứng với mỗi giá trị của biến độc lập chỉ có duy nhất một giá trị của biến phụ thuộc. Đây là điểm khác biệt quan trọng giữa quan hệ hàm số trong toán học và quan hệ thống kê trong phân tích hồi quy. 26
- Để hiểu rõ hơn về sự khác biệt giữa mối quan hệ hàm số trong toán học và mối quan hệ thống kê trong phân tích hồi quy, chúng ta xét ví dụ sau đây: Giả sử tại mức giá điện thoại Iphone X là 25 triệu đồng/chiếc thì nếu một người có thu nhập là 100 triệu đồng/năm thì số điện thoại Iphone X mà người đó có thể mua được là một con số chính xác (100 : 25 = 4 chiếc). Đây là con số duy nhất và là một số phi ngẫu nhiên vì ai cũng đoán được kết quả chính xác là 4 chiếc điện thoại Iphone X. Cũng tại mức giá Iphone X là 25 triệu đồng/chiếc, nếu chúng ta quan sát số lượng điện thoại Iphone X được mua bởi các khách hàng khác nhau (giả sử chúng ta theo dõi 4 khách hàng khác nhau có cùng mức thu nhập là 100 triệu đồng/năm) chắc chắn sẽ khác nhau. Hay nói cách khác, mặc dù có cùng mức thu nhập là 100 triệu đồng/năm và với giá Iphone X là 25 triệu đồng/chiếc thì số lượng điện thoại Iphone X của 4 khách hàng này chắc chắn là không giống nhau (khách hàng 1 có thể mua 1 chiếc, khách hàng 2 có thể mua 3 chiếc, khách hàng 3 có thể mua 1 chiếc, khách hàng 4 có thể mua 4 chiếc ). Một câu hỏi đặt ra là: Tại sao ở một mức giá giống nhau (25 triệu), khách hàng có thu nhập giống nhau (100 triệu) nhưng số lượng điện thoại Iphone X những khách hàng này mua lại có sự khác biệt? Câu trả lời ở đây là bởi vì: Trong thực tế còn rất nhiều các yếu tố khác cũng ảnh hưởng đến lượng cầu tiêu thụ điện thoại Iphone X trong ví dụ này nhưng chúng ta chưa đề cập. Các yếu tố này có thể là: độ tuổi, giới tính, nghề nghiệp, địa bàn sinh sống đây là các yếu tố cũng ảnh hưởng đến lượng cầu tiêu thụ điện thoại Iphone X chứ không phải chỉ có duy nhất giá điện thoại Iphone X là yếu tố ảnh hưởng. Điều này đã chứng minh điểm khác biệt giữa mối quan hệ trong mô hình hồi quy và mối quan hệ chính xác trong toán học. Sự khác biệt về số lượng điện thoại Iphone X trong ví dụ nêu trên sẽ được gải thích thông qua sai số ngẫu nhiên của mô hình hồi quy (chúng ta sẽ nghiên cứu sâu sai số ngẫu nhiên của mô hình hồi quy ở các phần tiếp theo). b. Phân biệt giữa quan hệ hồi quy và quan hệ nhân quả Mặc dù phân tích hồi quy đi sâu nghiên cứu sự phụ thuộc của một biến vào một hoặc nhiều các biến khác, nhưng nó không nhất thiết dẫn tới mối quan hệ nhân quả. Theo Kendall và Sturat, một tương quan thống kê dù mạnh tới đâu cũng không thể nào tạo ra một mối quan hệ nhân quả. Các mối quan hệ nhân quả thường được suy ra từ một lý thuyết riêng biệt nào đó ngoài thống kê. Điều này có nghĩa là từ một mối quan hệ hồi quy (thống kê) không thể logic thành mối quan hệ nhân quả. Nó đồng nghĩa với việc chúng ta không thể suy luận đảo ngược lại từ một mối quan hệ hồi quy do quan hệ hồi quy là quan hệ một chiều. 27
- Ví dụ: Từ mô hình hồi quy phản ánh mối quan hệ giữa chi tiêu và thu nhập cá nhân chúng ta có thể rút ra kết luận thu nhập của cá nhân tăng dẫn đến chi tiêu của họ tăng và thông thường mỗi chúng ta thường sử dụng thu thập để điều chỉnh chi tiêu. Tuy nhiên, từ mối quan hệ hồi quy này chúng ta không thể suy ngược lại đó là „chi tiêu tăng thì làm cho thu nhập tăng‟ bởi trong các yếu tố làm tăng thu nhập, chắc chắn sẽ không có chi tiêu. c. Phân biệt giữa hồi quy và tương quan Phân tích hồi quy và tương quan có mối quan hệ chặt chẽ với nhau, song có sự khác nhau về mục đích và kỹ thuật: - Về mục đích: Nếu như phân tích tương quan với mục đích nhằm đo cường độ liên kết giữa 2 biến bằng hệ số tương quan (ví dụ: Sự liên kết giữa hút thuốc lá và ung thư phổi; sự liên kết giữa điểm toán và điểm thống kê của sinh viên ), thì phân tích hồi quy lại ước lượng hoặc dự báo một biến (biến phụ thuộc) trên cơ sở giá trị đã cho của các biến khác (biến độc lập); - Về kỹ thuật: Trong phân tích hồi quy các biến không có tính chất đối xứng mà có sự phân biệt rõ ràng giữa biến phụ thuộc và biến độc lập. Trong đó, biến phụ thuộc là đại lượng ngẫu nhiên và có quy luật phân bố xác xuất, còn các biến độc lập là các biến phi ngẫu nhiên vì giá trị của chúng đã được xác định. Trong phân tích tương quan, không có sự phân biệt giữa biến phụ thuộc và biến độc lập, các biến có tính chất đối xứng và được giả sử là 2 biến ngẫu nhiên. Sự khác biệt cơ bản giữa hồi quy và tương quan đó là: Hầu hết lý thuyết tương quan đều dựa trên giả thiết ngẫu nhiên của các biến, trong khi đó hầu hết các lý thuyết hồi quy lại dựa vào giả thiết là biến phụ thuộc là biến ngẫu nhiên có đặc tính thống kê (có phân phối thống kê), còn các biến độc lập lại là các biến cố định. 2.2. Hàm hồi quy tổng thể và hàm hồi quy mẫu 2.2.1. Khái niệm về tổng thể, mẫu nghiên cứu - Tổng thể: Là toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó trong một phạm vi nhất định. Số lượng các phần tử của tổng thể được gọi là kích thước của tổng thể. Ví dụ: Tại một cộng đồng dân cư (khu phố) có 60 hộ gia đình. Giả sử có một nghiên cứu thu thập số liệu về thu nhập (Xi) và chi tiêu hàng tuần (Yi) của toàn bộ 60 hộ gia đình này, số liệu về chi tiêu và thu nhập hàng tuần của 60 hộ gia đình này được gọi là một tổng thể nghiên cứu, kích thước của tổng thể ở đây là 60 (Bảng 2.1). 28
- Bảng 2.1. Tổng thể nghiên cứu về thu nhập và chi tiêu của các hộ gia đình Thu nhập (triệu đồng) Số hộ Chi tiêu (triệu đồng) 80 5 55, 60, 65, 70, 75 100 6 65, 70, 74, 80, 85, 88 120 5 79, 84, 90, 94, 98 140 7 80, 93, 95, 103, 108, 113, 115 160 6 102, 107, 110, 116, 118, 125 180 6 110, 115, 120, 130, 135, 140 200 5 120, 136, 140, 144, 145 220 7 135, 137, 140, 152, 157, 160, 162 240 6 137, 145, 155, 165, 175, 189 260 7 150, 152, 175, 178, 180, 185, 191 Tổng 60 - - Mẫu nghiên cứu: Là tập con số liệu được rút ra ngẫu nhiên từ một tổng thể. Trong thực tế có rất nhiều cách rút mẫu khác nhau. Ví dụ: Từ số liệu ở Bảng 2.1, tại mỗi mức thu nhập trong tổng số 11 mức thu nhập khác nhau ta lựa chọn ra ngẫu nhiên một hộ gia đình với mức chi tiêu tương ứng thì bộ số liệu về chi tiêu và thu nhập của mỗi 11 hộ được gọi là một mẫu nghiên cứu. Giả sử chúng ta rút ra 2 mẫu nghiên cứu sau đây (Bảng 2.2): Bảng 2.2. Một số mẫu nghiên cứu ngẫu nhiên rút ra từ tổng thể 60 hộ gia đình Mẫu ngẫu nhiên số 1 Mẫu ngẫu nhiên số 2 Thu nhập Chi tiêu Thu nhập Chi tiêu 80 70 80 55 100 65 100 88 120 90 120 90 140 95 140 80 160 110 160 118 180 115 180 120 200 120 200 145 220 140 220 135 240 155 240 145 260 150 260 175 29
- 2.2.2. Hàm hồi quy tổng thể (Population Regression Function, PRF) Từ tổng thể nghiên cứu liên quan đến chi tiêu và thu nhập hàng tuần của 60 hộ gia đình ở Bảng 2.1, chúng ta có thể tính được mức chi tiêu bình quân của từng nhóm các hộ gia đình có cùng mức thu nhập như sau (Bảng 2.3): Bảng 2.3. Mức chi tiêu hàng tuần bình quân của các hộ gia đình Thu nhập Số hộ Mức chi tiêu bình quân 80 5 65 100 6 77 120 5 89 140 7 101 160 6 113 180 6 125 200 5 137 220 7 149 240 6 161 260 7 173 Mức chi tiêu bình quân tại mỗi một mức thu nhập đã biết được gọi là giá trị bình quân hay kỳ vọng có điều kiện (conditional expectation) của chi tiêu, E(Yi|Xi). Chúng ta có thể diễn tả một vài con số về chi tiêu bình quân của các hộ gia đình tại mỗi mức thu nhập đã biết như sau: E(Yi|Xi = 80) = 65 E(Yi|Xi = 100) = 77 E(Yi|Xi = 260) = 173 Đồ thị biểu diễn mối quan hệ giữa kỳ vọng có điều kiện của chi tiêu [E(Yi|Xi)] với thu nhập (Xi) được gọi là đường hồi quy tổng thể (Population Regression Line - PRL), Hình 2.2. PRL cho biết giá trị trung bình của biến phụ thuộc (chi tiêu của hộ gia đình) ứng với mỗi giá trị của biến độc lập (thu nhập của hộ gia đình) trong toàn bộ tổng thể. 30
- Kỳ vọng có điều kiện Phân phối của Y tại mức X = $220 Hình 2.2. Đường hồi quy tổng thể phản ánh mối quan hệ giữa chi tiêu bình quân có điều kiện và thu nhập của các hộ gia đình Nguồn: Gujarati và Porter, 2009 Như vậy, đường hồi quy tổng thể (PRL) cho ta biết giá trị trung bình của biến phụ thuộc (Yi) tương ứng với mỗi giá trị của biến độc lập (Xi), hay nói cách khác đường PRL cho ta biết mối quan hệ giữa trị trung bình của Yi với mỗi giá trị của Xi. Nếu sử dụng lý thuyết hàm số của toán học để mô tả mối quan hệ này thì chúng ta sẽ được hàm hồi quy tổng thể (Population Regression Function-PRF): E (Yi|Xi) = f (Xi) Về bản chất, hàm hồi quy tổng thể cho chúng ta biết giá trị trung của Yi sẽ thay đổi như thế nào khi giá trị của Xi thay đổi. Hàm f(Xi) có dạng như thế nào, là tuyến tính hay phi tuyến? Chúng ta chưa thể trả lời được câu hỏi này bởi vì, chúng ta chưa có sẵn tổng thể để kiểm tra. Xác định được dạng hàm hồi quy là vấn đề thực nghiệm. Để đơn giản trong nghiên cứu, giả sử rằng mối quan hệ giữa giá trị trung bình của Yi với Xi ở dạng tuyến tính (đường thẳng): 31
- E(Yi|Xi) = β0 + β1Xi (2.1) Trong đó: β0 là hệ số chặn (intercept); β1 là hệ số góc hay hệ số hồi quy (regression coefficient), nó là thước đo sự thay đổi của E(Yi|Xi) khi Xi tăng thêm 1 đơn vị. Do hàm hồi quy tổng thể chỉ mô tả mức độ phụ thuộc của giá trị trung bình của Yi vào các biến Xi. Trong ví dụ về chi tiêu và thu nhập của 60 hộ gia đình (Bảng 2.1), hàm hồi quy tổng thể cho chúng ta biết mối quan hệ phụ thuộc giữa mức chi tiêu trung bình [E(Yi|Xi)] của các nhóm hộ với các mức thu nhập (cố định) của họ. Vấn đề đặt ra là, mối quan hệ giữa mức chi tiêu cụ thể của một gia đình (Yi) và thu nhập (Xi) sẽ được thể hiện như thế nào? Để trả lời câu hỏi này chúng ta xem xét biểu đồ phân tán của chi tiêu (Yi) tại các mức thu nhập (Xi) của các hộ gia đình (Hình 2.3). Yi Xi Hình 2.3. Phân phối của chi tiêu theo sự thay đổi của thu nhập Nguồn: Gujarati và Porter, 2009 Hình 2.3 cho thấy mức chi tiêu của một hộ gia đình (Yi) trong nhóm hộ gia đình có cùng mức thu nhập (ví dụ: $80) có xu hướng tụm lại xoay quanh mức chi tiêu trung bình của nhóm, E(Yi|Xi). Vì vậy, đối với mỗi cá thể trong tổng thể, giá trị cá biệt Yi không phải bao giờ cũng trùng với giá trị trung bình mà chúng chỉ luôn xoay quay giá trị trung bình của tổng thể. Tức là giữa các giá trị cá biệt Yi và giá trung bình của tổng thể đã có một lượng chênh lệch nhất định. Lượng chênh lệch này được gọi là sai số ngẫu nhiên, ui (chúng ta sẽ nghiên cứu chi tiết về sai số ngẫu nhiên ở phần sau), cụ thể: 32
- ui = Yi – E(Yi|Xi) Hoặc: Yi = E(Yi|Xi) + ui (2.2) Giả sử mối quan hệ giữa E(Yi|Xi) và Xi được thể hiện dưới dạng đường thẳng, khi đó phương trình (2.2) được viết thành: Yi = β0 + β1Xi + ui (2.3) Phương trình (2.2) và được thể hiện chi tiết ở phương trình (2.3) được gọi là mô hình hồi quy tổng thể. Mô hình hồi quy tổng thể được xây dựng dựa trên cơ sở số liệu của toàn bộ tổng thể nghiên cứu. Mô hình hồi quy tổng thể được chia thành hai phần khác biệt bao gồm: phần xác định (giá trị trung bình của Yi) và phần chênh lệch ngẫu nhiên (ui). 2.2.3. Hàm hồi quy mẫu (Sample Regression Function - SRF) Ở phần trên ta đã xác định được hàm hồi quy tổng thể có dạng: E(Yi|Xi) = β0 + β1Xi Và mô hình hồi quy tổng thể có dạng: Yi = β0 + β1Xi + ui Có một câu hỏi đặt ra: Làm thế nào để ước lượng được hàm hồi quy tổng thể? Nghĩa là làm thế nào chúng ta ước lượng được các giá trị của β1 và β2 để phân tích mối quan hệ phụ thuộc giữa Yi và Xi? Điều này có thể thực hiện được nếu chúng ta có dữ liệu đầy đủ của toàn bộ tổng thể. Tuy nhiên, trong thực tế không phải lúc nào ta cũng có thể thu thập được số liệu cho toàn bộ tổng thể (do có nhiều khó khăn: về tài chính, về thời gian ) mà chúng ta chỉ có thể có số liệu của một mẫu đại diện cho tổng thể đó. Vì vậy, trong thực tế nghiên cứu chúng ta khó có thể xây dựng được hàm hồi quy tổng thể (PRF) mà chúng ta thường ước lượng hàm hồi quy trên cơ sở những thông tin từ mẫu nghiên cứu (hàm hồi quy mẫu). Như vậy, hàm hồi quy mẫu là hàm hồi quy được xây dựng trên cơ sở một mẫu ngẫu nhiên của tổng thể. Để hiểu rõ hơn về hàm hồi quy mẫu, chúng ta quay lại ví dụ về mẫu nghiên cứu ở Bảng 2.2. Câu hỏi đặt ra là, dựa vào số liệu về các mẫu ngẫu nhiên này, chúng ta có thể dự báo được xu hướng phụ thuộc của mức chi tiêu bình quân của các hộ gia đình vào các mức thu nhập đã được xác định hay không? Để trả lời câu hỏi này, trước hết chúng ta đi xác định biểu đồ phân tán thể hiện mối quan hệ giữa chi tiêu (Yi) và thu nhập (Xi) từ số liệu của 2 mẫu ngẫu nhiên (Bảng 2.2). Ứng với mỗi mẫu số liệu, ta có thể vẽ được một đường phản ánh xu hướng hay phụ thuộc của chi tiêu (Yi) vào thu nhập (Xi). Đường này người ta gọi là 33
- đường hồi quy mẫu (Sample Regression Line - SRL). Đường hồi quy mẫu là đường hồi quy phản ánh xu hướng của các thông tin thu được trên một mẫu số liệu của tổng thể (Hình 2.4). Tuy nhiên, chúng ta cũng chưa thể khẳng định chắc chắn là đường hồi quy mẫu (SRL) nào sẽ đại diện hoàn hảo cho đường hồi quy tổng thể (PRL) bởi vì các mẫu khác nhau thì có biến động và sai số khác nhau. Tương tự như vậy có một câu hỏi đặt ra là: đường hồi quy mẫu (SRL) nào sẽ được coi là thích hợp với hàm hồi quy tổng thể (PRF). Chúng ta chưa thể trả lời được câu hỏi này vì ta chưa biết hàm hồi quy tổng thể (PRF). Để giải quyết vấn đề này cũng giống như ước lượng hệ số, ta sẽ ước lượng hàm hồi quy tổng thể (PRF) thông qua hàm hồi quy mẫu (Sample Regression Function - SRF). Mẫu 1 Đường hồi quy dựa Mẫu 2 vào mẫu 1- SRL1 Đường hồi quy dựa vào mẫu 2- SRL2 Hình 2.4. Đường hồi quy dựa vào mẫu ngẫu nhiên Nguồn: Gujarati và Porter, 2009 Hàm hồi quy mẫu (SRF) được hiểu là một hàm số toán học phản ánh xu hướng biến động của đường hồi quy mẫu (SRL). Từ các đường hồi quy mẫu (SRL) trong Hình 2.4, chúng ta có thể mô phỏng dưới dạng hàm số toán học như sau: (2.4) Yi = b0 + b1Xi 34
- Trong đó: + Yi là ước lượng của E(Yi|Xi); + b0 là ước lượng của β0; + b1 là ước lượng của β1. Phương trình (2.4) được gọi là hàm hồi quy mẫu (Sample Regression Function - SRF). Trên cơ sở xem xét đường hồi quy mẫu (Hình 2.4), chúng ta thấy rằng không phải mọi số liệu xuất hiện trong mẫu nghiên cứu đều nằm chính xác trên đường hồi quy mẫu. Hay nói theo cách khác giữa các giá trị cụ thể về chi tiêu (Yi) và giá trị ước lượng của mức chi tiêu trung bình (Yi ) vẫn còn có sự sai lệch và sự sai lệch này chính sai số ngẫu nhiên. Vì vậy, từ một mẫu nghiên cứu mức chi tiêu thực tế (Yi) của một hộ gia đình sẽ được thể hiện cụ thể như sau: Yi = + ei hoặc: Yi = b0 + b1Xi + ei (2.5) Phương trình (2.5) được gọi là mô hình hồi quy mẫu, trong đó ei là ước lượng của ui và cũng được gọi là phần dư, đôi khi đơn giản người ta cũng gọi là sai số ngẫu nhiên. Như vậy, mục tiêu của phân tích hồi quy là ước lượng mô hình hồi quy tổng thể: Yi = β0 + β1Xi + ui Dựa trên cơ sở của mô hình hồi quy mẫu: Yi = b0 + b1Xi + ei Tuy nhiên, do sự thay đổi của các mẫu nghiên cứu, nên kết quả ước lượng của mô hình hồi quy tổng thể dựa trên cơ sở của mô hình hồi quy mẫu chỉ mang tính gần đúng (xem minh họa Hình 2.5). Từ một giá trị Xi đã cho trong một mẫu nghiên cứu, chúng ta sẽ có một giá trị quan sát của Yi. Dưới góc độ của mô hình hồi quy mẫu thì giá trị quan sát của Yi sẽ được thể hiện như sau: Yi = Yi + ei Và dưới góc độ của mô hình hồi quy tổng thể thì Yi được diễn tả: Yi = E(Yi|Xi) + ui Về phía trái điểm A, Yi vượt quá giá trị của E(Yi/Xi), tức là SRF ước lượng cao hơn PRF. Còn về phía phải điểm A, SRF ước lượng thấp hơn PRF. 35
- b0 + b1Xi ei β0 + β1Xi Hình 2.5. Đường hồi quy tổng thể và đường hồi quy mẫu Nguồn: Gujarati và Porter, 2009 Chúng ta biết rằng hàm hồi quy mẫu (SRF) chỉ là xấp xỉ hay gần đúng với hàm hồi quy tổng thể (PRF). Có một câu hỏi cần được giải quyết ở đây là: Liệu chúng ta có thể tìm được phương pháp hay có cách nào để làm cho sự "xấp xỉ" này nhỏ đi không? Hay nói cách khác có cách nào để hàm hồi quy mẫu càng gần với hàm hồi quy tổng thể hay không? Cụ thể hơn chúng ta phải xây dựng hàm hồi quy mẫu (SRF) như thế nào để các tham số ước lượng b1 và b2 càng gần với β1 và β2 càng tốt. Chúng ta sẽ xem xét và trả lời các vấn đề này trong chương sau. Để có thể ước lượng được mô hình hồi quy mẫu là đại diện tốt nhất của mô hình hồi quy tổng thể, công tác chọn mẫu cần phải được chú trọng hàng đầu. Nếu các mẫu ngẫu nhiên mà chúng ta lựa chọn có tính đại diện (mẫu đại diện) thì mô hình hồi quy mẫu sẽ phản ánh được đúng xu hướng của mô hình hồi quy tổng thể (Hình 2.6). Kết quả ở Hình 2.6 cho thấy, đường thể hiện số liệu của Mẫu 1 phản ánh xu hướng của tổng thể tốt hơn so với đường thể hiện từ số liệu của Mẫu 2. Như vậy, nếu chúng ta ước lượng mô hình hồi quy từ số liệu của Mẫu 1 sẽ phản ánh được chính xác hơn xu hướng vận động của cả tổng thể. 36
- Hình 2.6. Mối quan hệ giữa chi tiêu và thu nhập (số liệu Bảng 2.2 & 2.3) 2.3. Sai số ngẫu nhiên trong mô hình hồi quy Ở phần trên chúng ta xác định được sai số từ mô hình hồi quy tổng thể: ui = Yi – E(Yi|Xi) (2.6) Và từ mô hình hồi quy mẫu chúng ta cũng xác định được sai số: (2.7) ei = Yi - Yi Sai số trong hồi quy là gì? Dựa vào phương trình (2.6) và (2.7), sai số (sai số ngẫu nhiên) trong mô hình hồi quy được hiểu là phần chênh lệch ngẫu nhiên giữa giá trị quan sát thực tế của cá thể trong tổng thể so với giá trị trung bình (ước lượng của giá trị trung bình) của nó (Hình 2.7). Bản chất của sai số ngẫu nhiên trong mô hình hồi quy: + Sai số phản ánh ảnh hưởng của những biến khác không được đưa vào trong mô hình. Trong ví dụ nói trên, ngoài thu nhập thì chi tiêu của các hộ gia đình còn phụ thuộc vào các yếu tố khác như: địa bàn sinh sống, số lượng thành viên trong gia đình Do vậy, sai số ngẫu nhiên đã đại diện cho sự ảnh hưởng của các yếu tố này tới chi tiêu của các hộ gia đình; + Trong trường hợp chúng ta đã đưa tất cả các biến hợp lí vào trong mô hình thì một sai số ngẫu nhiên nào đó vẫn xảy ra và ta không giải thích được. 37
- Nguyên nhân là do trong các yếu tố ảnh hưởng đến một vấn đề có những yếu tố mà chúng ta không thể hoặc rất khó dự đoán được tác động của nó (các yếu tố thuộc về bản chất bên trong), ví dụ các yếu tố liên quan đến hành vi của con người (sở thích, thị hiếu ); + Sai số xuất hiện là do không có đủ thông tin, số liệu phục vụ cho nghiên cứu; + Khi xây dựng mô hình ta thường cố gắng làm sao càng đơn giản càng tốt, điều đó sẽ làm cho một số biến nằm ngoài mô hình. Mặc dù ta đã phán đoán được ảnh hưởng của các biến này, tuy nhiên ảnh hưởng của chúng có thể rất nhỏ và nó ở trong sai số. Hình 2.7. Sai số ngẫu nhiên trong mô hình hồi quy Nguồn: Gujarati và Porter, 2009 Trong phân tích hồi quy, chúng ta chỉ giải quyết mối quan hệ thống kê ngẫu nhiên. Bởi vì, mối quan hệ chính xác (toán học) không phải lúc nào cũng có trong thực tế. Vì vậy, trong nghiên cứu trong kinh tế luôn xuất hiện sai số trong các mô hình phản ánh mối quan hệ giữa các hiện tượng kinh tế, nguyên nhân là do: + Số mẫu điều tra không đủ để miêu tả toàn bộ tổng thể cần nghiên cứu; 38
- + Mô hình hồi quy được chọn không bao gồm đầy đủ các biến (các yếu tố) giải thích hiện tượng kinh tế cần nghiên cứu; + Sai số cũng xuất hiện là do chất lượng số liệu không đảm bảo (sai lệch trong đơn vị đo hoặc làm tròn số; trả lời thiếu chính xác từ người cung cấp thông tin ); + Dạng của mô hình bị lựa chọn sai: Trong thực tế có thể chúng ta biết chính xác được về mặt lý thuyết sự tác động của các yếu tố tới một vấn đề nghiên cứu. Tuy nhiên, trong nhiều tình huống chúng ta không thể xác định được chính xác mối quan hệ này được thể hiện dưới dạng nào (tuyến tính, phi tuyến ). Việc lựa chọn sai dạng của mô hình cũng dẫn đến sai số trong phân tích hồi quy. Trên đây là bản chất và lý do tồn tại của sai số, nó giữ vai trò đặc biệt trong phân tích hồi quy. Tuy nhiên, để việc phân tích mô hình hồi quy thực sự có ý nghĩa thì sai số phải thỏa mãn những điều kiện nhất định (chúng ta sẽ nghiên cứu các giả định này trong chương sau). 39
- Câu hỏi ôn tập chương 2 1. Trình bày khái niệm hồi quy, mô hình hồi quy? 2. Mục tiêu của phân tích hồi quy là gì? 3. Hãy phân biệt các mối quan hệ trong mô hình hồi quy? 4. Thế nào là mô hình hồi quy tổng thể, mô hình hồi quy mẫu? 5. Sai số ngẫu nhiên trong mô hình hồi quy là gì? Trình bày bản chất và nguyên nhân xuất hiện sai số trong mô hình hồi quy? 40
- Chương 3 MÔ HÌNH HỒI QUY TUYẾN TÍNH Mục tiêu của Chương 3 nhằm giúp sinh viên hiểu và phân biệt được: Mô hình hồi quy tuyến tính; mô hình hồi quy tuyến tính đơn giản; mô hình hồi quy tuyến tính bội. Bên cạnh đó, nội dung của Chương 3 sẽ giúp sinh viên biết cách: Áp dụng phương pháp bình phương nhỏ nhất để ước lượng các hệ số của mô hình hồi quy tuyến tính đơn giản và mô hình hồi quy tuyến tính bội; kiểm định, phân tích và ứng dụng mô hình hồi quy tuyến tính đơn giản, mô hình hồi quy tuyến tính bội trong phân tích các vấn đề kinh tế - xã hội. 3.1. Giới thiệu mô hình hồi quy tuyến tính 3.1.1. Bản chất của mô hình hồi quy tuyến tính trong kinh tế lượng Vấn đề được đề cập và quan tâm đầu tiên trong kinh tế lượng là ước lượng và phân tích các “mô hình hồi quy tuyến tính”. Vậy thuật ngữ “tuyến tính” có nghĩa là gì? Mô hình hồi quy tuyến tính được hiểu như thế nào? Trong kinh tế lượng, thuật ngữ “tuyến tính” được hiểu theo hai nghĩa: Tuyến tính đối với các biến và tuyến tính đối với các hệ số. - Tuyến tính theo các biến: Theo cách hiểu này, mô hình hồi quy tuyến tính đối với các biến phản ánh mối quan hệ giữa biến phụ thuộc và biến độc lập dưới dạng đường thẳng (tuyến tính hoàn hảo). Ví dụ: Mô hình sau đây được gọi là mô hình hồi quy tuyến tính đối với các biến: Yi = b0 + b1Xi + ei Những mô hình sau không phải là tuyến tính đối với các biến: 1 Y = β + β X 2 + u hoặc Y = β + β + u i 0 1 i i i 0 1 Xi i Trong mô hình hồi quy tuyến tính theo các biến, mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng thêm 1 đơn vị (hệ số hồi quy) luôn là hằng số, còn ở mô hình phi tuyến sẽ không có điều này. - Tuyến tính theo các hệ số của mô hình: Việc sử dụng các mô hình hồi quy tuyến tính theo các biến (mối quan hệ đường thẳng) để phân tích mối quan hệ giữa các hiện tượng kinh tế - xã hội trong dài hạn thường không phù hợp do một hiện tượng kinh tế - xã hội nào đó sẽ không luôn tăng lên hoặc không luôn giảm đi khi các yếu tố tác động đến nó 41
- tăng thêm 1 đơn vị. Vì vậy, mô hình hồi quy tuyến tính theo các hệ số được đề cập để khắc phục tình trạng này. Mô hình hồi quy tuyến tính theo các hệ số thì biến độc lập không nhất thiết phải là tuyến tính (bậc 1) mà nó có thể là phi tuyến (bậc 2, bậc 3 ), mà vấn đề cần quan tâm đó là các hệ số của mô hình phải luôn là tuyến tính (mũ 1). Chúng ta có thể xét một số vì dụ về mô hình hồi quy tuyến tính theo các hệ số như sau (Hình 3.1). Y Y = β1 + β2X X Hình 3.1. Một số mô hình hồi quy tuyến tính theo các hệ số Nguồn: Gurajati và Porter, 2009) Như vậy, mô hình hồi quy tuyến tính theo các hệ số có thể là mô hình tuyến tính hoặc phi tuyến theo các biến độc lập, nhưng các hệ số của mô hình thì luôn phải là tuyến tính (mũ 1). Do đó, mô hình sau không phải là mô hình tuyến tính theo các hệ số: 2 Yi = β0 + β1 Xi + ui Mô hình hồi quy tuyến tính theo các hệ số có liên quan đến sự phát triển của lý thuyết hồi quy. Trong kinh tế lượng cơ bản, khi nói đến “mô hình hồi quy tuyến tính” điều đó có nghĩa là chúng ta đề cập đến những mô hình tuyến 42
- tính theo các hệ số. Những mô hình phi tuyến theo các hệ số sẽ được nghiên cứu tại các chương trình kinh tế lượng nâng cao. 3.1.2. Phân loại mô hình hồi quy tuyến tính Theo cách phân loại chung, mô hình hồi quy tuyến tính gồm hai loại là mô hình hồi quy tuyến tính đơn giản (simple linear regression model) và mô hình hồi quy tuyến tính bội (multiple linear regression model). 3.1.2.1. Mô hình hồi quy tuyến tính đơn giản Mô hình hồi quy đơn giản (hay còn gọi là mô hình hồi quy 2 biến - bivariate/two-variable regression model) là mô hình phản ánh mối quan hệ phụ thuộc giữa một biến phụ thuộc với duy nhất một biến độc lập. Mô hình hồi quy tuyến tính đơn giản nhất (tuyến tính cả ở biến số và hệ số) được thiết lập từ một mẫu gồm n quan sát có dạng như sau: Yi = b0 + b1Xi + ui (3.1) Trong đó: + Yi là biến phụ thuộc; + Xi là biến độc lập (yếu tố ảnh hưởng đến Yi); + ui là sai số ngẫu nhiên của mô hình; + b0 là hệ số chặn, là giá trị gần đúng của biến phụ thuộc (Yi) trong trường hợp giả định biến độc lập (Xi) nhận giá trị bằng không; + b1 là hệ hồi quy (hệ số góc), bản chất của hệ số hồi quy (b1) chính là đạo hàm của của biến phụ thuộc (Yi) theo biến độc lập (Xi) ở phương trình (3.1). ( ) Căn cứ vào bản chất về định nghĩa của đạo hàm, b1 phản ánh mức độ thay đổi của biến phụ thuộc (Yi) dưới dạng con số tuyệt đối khi biến độc lập (Xi) tăng thêm 1 đơn vị. Vì vậy, nếu b1 > 0 có nghĩa là khi Xi tăng 1 đơn vị (của Xi) thì Yi sẽ tăng b1 đơn vị (của Yi). Nếu b1 < 0 có nghĩa là Xi tăng 1 đơn vị (của Xi) thì Yi sẽ giảm b1 đơn vị (của Yi). Mô hình hồi quy tuyến tính đơn giản được đề cập đầu tiên trong kinh tế lượng không phải bởi sự phù hợp của nó trong thực tế mà bởi mô hình này đại diện cho ý tưởng cơ bản và đơn giản nhất có thể trong phân tích hồi quy. Mô hình hồi quy tuyến tính đơn giản chỉ được sử dụng trong trường hợp khi chúng ta nghiên cứu ảnh hưởng của một yếu tố đến một hiện tượng kinh tế - xã hội nào đó và xem xét mối quan hệ này trong ngắn hạn. Tuy nhiên, trong thực tế nghiên 43
- cứu về kinh tế - xã hội trường hợp vừa nêu chỉ là cá biệt và không phải lúc nào cũng xảy ra. Do vậy, mô hình hồi quy tuyến tính đơn giản chỉ có nhiều ý nghĩa trong việc giúp người học tiếp cận một cách đơn giản nhất với kinh tế lượng. 3.1.2.2. Mô hình hồi quy tuyến tính bội Trong thực tế khi ứng dụng kinh tế lượng để phân tích ảnh hưởng của các yếu tố tới một vấn đề kinh tế xã hội, người ta đề cập nhiều hơn đến mô hình hồi quy tuyến tính bội (multiple linear regression model), là mô hình phản ánh mối quan hệ phụ thuộc giữa một biến phụ thuộc với nhiều hơn một biến độc lập. Mô hình hồi quy tuyến tính bội (tuyến tính cả ở các biến hệ số), có dạng tổng quát như sau: Yi = b0 + b1X1 + b2X2 + + bkXk + ei (3.2) Trong đó: + Yi là biến phụ thuộc; + Xi (i = 1, 2, , k) là các biến độc lập (các yếu tố ảnh hưởng đến Yi); + ui là sai số ngẫu nhiên của mô hình; + b0 là hệ số chặn, là giá trị gần đúng của Yi trong trường hợp giả định tất cả các Xi nhận giá trị bằng không; + bi (i = 1, 2, , k) là các hệ số hồi quy riêng, bản chất của bi là đạo hàm riêng của Yi theo các biến Xi ở phương trình (3.2). Vì Yi được thể hiện là một hàm đa biến theo các biến Xi nên khi lấy đạo hàm riêng của Yi theo một Xi nào đó thì theo toán học ta phải cố định (giả sử) các Xi còn lại là không thay đổi. Ví dụ, từ phương trình (3.2) nếu lấy đạo hàm của Yi theo X1 chúng ta sẽ được: ( ) Với giả định đi kèm là các Xi khác (i = 2, 3, , k) không đổi. Nếu các Xi khác (ví dụ X2, X3 ) thay đổi thì kết quả của phép lấy đạo hàm của Yi theo X1 từ phương trình (3.2) sẽ là một giá trị khác b1. Do đó, ý nghĩa của các hệ số hồi quy riêng (bi, với i = 1, 2, , k) trong mô hình hồi quy tuyến tính bội: Khi Xi tăng thêm 1 đơn vị (của Xi) thì Yi sẽ tăng thêm (bi > 0) hoặc giảm đi (bi < 0) bi đơn vị (của Yi) trong điều kiện giả định các Xi khác là không đổi. Mô hình hồi quy bội được xác định là phù hợp hơn trong thực tế nghiên cứu kinh tế - xã hội so với mô hình hồi quy tuyến tính đơn giản bởi vì một hiện tượng kinh tế - xã hội thường chịu ảnh hưởng bởi rất nhiều các yếu tố khác nhau. 44
- 3.2. Ước lượng các hệ số của mô hình hồi quy tuyến tính sử dụng phương pháp bình phương nhỏ nhất 3.2.1. Giới thiệu chung về phương pháp bình phương nhỏ nhất Mục tiêu đầu tiên của kinh tế lượng là ước lượng mô hình hồi quy tổng thể một cách chính xác nhất có thể trên cơ sở của mô hình hồi quy mẫu. Điều này có nghĩa là nhiệm vụ đầu tiên của kinh tế lượng là ước lượng được các hệ số của mô hình hồi quy mẫu. Có hai phương pháp được sử dụng phổ biến để ước lượng các hệ số của mô hình hồi quy mẫu trong kinh tế lượng bao gồm: (i) bình phương nhỏ nhất (Ordinary Least Square - OLS) và (ii) ước lượng khả năng tối đa (Maximum Likelihood Estimation - MLE). Phương pháp OLS dựa trên giả định trụ cột là tổng bình phương sai số của mô hình là nhỏ nhất, trong khi đó phương pháp MLE dựa trên giả định xác suất quan sát các giá trị của biến phụ thuộc (Yi) là lớn nhất. Thực tế đã chứng minh rằng hai phương pháp này có kết quả ước lượng các hệ số của mô hình hồi quy mẫu là tương đối giống nhau, tuy nhiên phương pháp OLS được sử dụng phổ biến trong kinh tế lượng. Nguyên nhân là do phương pháp OLS có sự lôi cuốn một cách trực quan và cách tiếp toán học cận đơn giản hơn so với phương pháp MLE. Phương pháp bình phương nhỏ nhất (OLS) được đề xuất và phát triển bởi Carl Friedrich Gauss, một nhà toán học người Đức. Với một số giả định xác định, phương pháp OLS có một số đặc tính thống kê hấp dẫn và trở thành một trong những phương pháp hữu hiệu và phổ biến nhất trong phân tích hồi quy. 3.2.2. Các giả định của phương pháp bình phương nhỏ nhất Kinh tế lượng hướng tới việc ước lượng các hệ số bi (i = 0, 1, 2, , k) của mô hình hồi quy mẫu (mô hình 3.2) sao cho các hệ số này là đại diện tốt nhất của các hệ số βi (i = 0, 1, 2, , k) của mô hình hồi quy tổng thể (mô hình 3.3). Yi = β0 + β1X1 + β2X2 + + βkXk + ui (3.3) Từ mô hình (3.3) chúng ta nhận thấy Yi phụ thuộc vào cả các yếu tố được đưa vào mô hình (Xi) và ui (đại diện cho các yếu tố nằm ngoài mô hình). Vì vậy, nếu chúng ta không chỉ cụ thể Xi và ui được tạo ra như thế nào thì chúng ta sẽ không thể có các suy đoán thống kê về Yi. Do đó, các giả định về các biến Xi và ui có tính chất quyết định đối với sự giải thích hợp lý các giá trị ước lượng của hồi quy. Mô hình hồi quy tuyến tính cổ điển được ước lượng bởi Gauss bằng phương pháp OLS (mô hình hồi quy tiêu chuẩn) là nền móng của hầu hết lý thuyết kinh tế lượng. Để ước lượng các hệ số của mô hình bằng phương pháp OLS, mô hình phải thỏa mãn một số giả định sau đây: 45
- 3.2.2.1. Giả định đối với mô hình hồi quy tuyến tính đơn giản - Giả định 1: Mô hình phải thỏa mãn là mô hình hồi quy tuyến tính đối với các hệ số, mà có thể không phải là tuyến tính đối với các biến. Ví dụ một dạng mô hình hồi quy tuyến tính đối với các hệ số: Yi = b0 + b1X1 + b2X2 + + bkXk + ei - Giả định 2: Số lượng quan sát của mẫu nghiên cứu phải lớn hơn số biến độc lập của mô hình. Giả định này là điều kiện cần để ước lượng các hệ số của mô hình. - Giả định 3: Các biến độc lập (Xi) là phi ngẫu nhiên (giá trị đã được xác định). Điều này có nghĩa, các biến độc lập (Xi) không có mối liên hệ với sai số (ui) của mô hình hay Xi và ui là độc lập với nhau, Cov (Xi, ui) = 0. Giá trị của biến độc lập (Xi) được giả định là phi ngẫu nhiên (giá trị đã được xác định trước), bởi các lý do sau đây: (1) để đơn giản hóa tính phức tạp trong phân tích các mô hình hồi quy; (2) việc cố định các biến độc lập (yếu tố ảnh hưởng) có thể được hiện thực hóa trong các tình huống phân tích (ví dụ: Doanh nghiệp có thể xác định các tỷ lệ chiết khấu khác nhau sau đó xem xét sự ảnh hưởng của các mức chiết khấu này đến lượng cầu về hàng hóa, dịch vụ mà doanh nghiệp đang cung cấp ra thị trường). - Giả định 4: Tất cả giá trị của các biến độc lập trong một mẫu nghiên cứu không được giống nhau. Thêm vào đó, các biến độc lập (Xi) phải mang giá trị dương và không có các giá trị ngoại lai (là các giá trị rất lớn hoặc rất nhỏ so với các giá trị còn lại trong mẫu nghiên cứu). - Giả định 5: Với các giá trị đã biết của biến độc lập (Xi), giá trị bình quân của sai số ngẫu nhiên trong mô hình nhận giá trị bằng không (0), E(ui|Xi) = 0. Giả định này có nghĩa là nếu tại mỗi giá trị cho trước của các biến độc lập (Xi) có rất nhiều các giá trị của biến phụ thuộc (Yi), tuy nhiên giá trị bình trung bình của các giá trị Yi này đều nằm trên đường hồi quy tổng thể. Hay nói theo cách khác các giá trị của biến độc lập (Yi) luôn có xu hướng xoay quanh giá trị trung bình của chúng (Hình 3.2). Điều này có nghĩa là các yếu tố nằm ngoài mô hình được thể hiện trong sai số (ui) không ảnh hưởng một cách có hệ thống đến giá trị bình quân của biến phụ thuộc (Yi). 46
- Giá trị trung bình Hình 3.2. Phân phối của sai số trong mô hình Nguồn: Gurajati và Porter, 2009 Khi giá trị Yi cao hơn giá trị trung bình của các giá trị Yi tại một mức Xi đã được xác định, giá trị sai số sẽ dương, ngược lại giá trị sai số sẽ âm. Tuy nhiên, các giá trị sai số dương sẽ triệt tiêu các giá trị sai số âm và vì vậy ảnh hưởng bình quân của các sai số đến biến phụ thuộc (Yi) mang giá trị 0. Giả định 5 mang hàm ý không có lỗi xác định (sai lệch xác định) trong mô hình được sử dụng trong phân tích thực nghiệm. Hay nói theo một cách khác, mô hình được xác định một cách chính xác. - Giả định 6: Phương sai của sai số bằng nhau và là một số không đổi. 2 Var (ui) = Var (uj) = δ Giả định này mang hàm ý tất cả các quan sát trong tổng thể nghiên cứu có mức độ tin cậy như nhau. Giả định 6 có nghĩa là khi phương sai của sai số bằng nhau thì sự thay đổi các giá trị của Yi xung quanh đường hồi quy có xu hướng giống nhau (không tăng cũng không giảm) khi Xi thay đổi (Hình 3.3). 47
- f(u): Mật độ xác suất của ui Hình 3.3. Sự tương đồng về phương sai của sai số ui Nguồn: Gujarati và Porter, 2009 - Giả định 7: Không có sự tương quan giữa các sai số, điều này có nghĩa là các quan sát được lựa chọn một cách độc lập. Cov (ui, uj) = 0, i ≠ j Nếu giả định này không được duy trì, biến phụ thuộc (Yi) trong mô hình không những chịu ảnh hưởng bởi các biến đưa vào mô hình (Xi) mà còn chịu ảnh hưởng bởi cả các yếu tố nằm trong sai số ui, khi đó, việc phân tích ảnh hưởng của các biến Xi đến Yi sẽ không chính xác. - Giả định 8: Sai số (ui) của mô hình tuân theo quy luật phân phối chuẩn tắc với giá trị trung bình bằng không (0) và phương sai bằng hằng số (δ2). 2 ui ∼ N (0, δ ) Giả định này có nghĩa là các sai số của mô hình không tương quan với nhau và phân phối độc lập. Nếu sai số ui tuân theo quy luật phân phối chuẩn tắc thì phân phối xác suất của các hệ số ước lượng trong mô hình sẽ được xác định một cách dễ dàng. Bên cạnh đó, các kiểm định giả thuyết về các hệ số ước lượng của mô hình cũng được thực hiện một cách dễ dàng khi sai số ui tuân theo quy luật phân phối chuẩn tắc. 3.2.2.2. Giả định đối với mô hình hồi quy tuyến tính bội Ngoài việc phải tuân thủ 8 giả định (ở phía trên) như mô hình hồi quy tuyến tính đơn giản, mô hình hồi quy tuyến tính bội còn có 2 giả định riêng biệt sau đây: 48
- - Giả định 9: Hiện tượng đa cộng tuyến (multicollinearity) không tồn tại hoặc tồn tại không rõ ràng giữa các biến độc lập trong mô hình. Giả định này có nghĩa là các biến độc lập đưa vào mô hình không có mối liên hệ với nhau. Về bản chất toán học, hiện tượng đa cộng tuyến xảy ra khi một yếu tố (biến số) có mối quan hệ tuyến tính với một hoặc nhiều các yếu tố khác. Trong mô hình hồi quy tuyến tính bội, hiện tượng đa quan cộng tuyến xảy ra khi một biến độc lập trong mô hình có mối quan hệ tuyến tính với một hoặc các biến độc lập còn lại. Tại sao phải loại bỏ hiện tượng đa cộng tuyến giữa các biến độc lập trong mô hình kinh tế lượng? Để trả lời câu hỏi này, chúng ta xét một ví dụ như sau: Giả sử có người xây dựng mô hình kinh tế lượng phản ánh mối quan hệ giữa chi tiêu cá nhân (Yi) với thu nhập (X1) và tổng tài sản (X2) như sau: Yi = b0 + b1X1 + b2X2 + ei (3.4) Mục tiêu của việc xây dựng mô hình (3.4) nhằm phân tích ảnh hưởng riêng biệt của thu nhập (X1) và tổng tài sản (X2) đến chi tiêu cá nhân (Yi). Tuy nhiên, trong thực tế thu nhập và tổng tài sản của người tiêu dùng có mối quan hệ với nhau vì thu nhập là một phần của tổng tài sản. Trong trường hợp này hiện tượng đa cộng tuyến đã xảy ra và giả sử: X2 = 2X1 khi đó mô hình (3.4) trở thành: Yi = b0 + b1X1 + b2(2X1) + ei = b0 + (b1 + 2b2)X1 + ei (3.5) Từ mô hình (3.5) chúng ta nhận thấy chúng ta không thể đánh giá được ảnh hưởng riêng biệt của thu nhập (X1) và tổng tài sản (X2) đến chi tiêu cá nhân (Yi). Do đó, mục tiêu ban đầu khi xây dựng mô hình (3.4) không thể đạt được nếu trong mô hình có hiện tượng đa cộng tuyến giữa các biến độc lập. Vì vậy, việc loại bỏ hiện tượng đa cộng tuyến ra khỏi mô hình hồi quy tuyến tính bội có ý nghĩa rất quan trọng trong việc sử dụng mô hình để phân tích các vấn đề. - Giả định 10: Không có sự xác định sai lệch về mô hình. Hay nói cách khác, mô hình được xác định một cách chính xác. Điều này có nghĩa là mô hình đã được xác định bao gồm đầy đủ các biến. 3.2.3. Nội dung của phương pháp bình phương nhỏ nhất Phương pháp bình phương nhỏ nhất (Ordinary Least Square - OLS) dựa trên nền tảng trụ cột là tổng bình phương sai số của mô hình phải là nhỏ nhất. Giả sử từ một mẫu gồm n quan sát của biến Yi và k các yếu tố ảnh hưởng (X1, X2, , Xk) chúng ta xây dựng được một mô hình hồi quy mẫu như sau: Yi = b0 + b1X1 + b2X2 + + bkXk + ei (3.6) 49
- Áp dụng phương pháp OLS để ước lượng mô hình (3.6) thực tế là chúng ta phải đi tìm các giá trị của bi (i = 0, 1, 2 , k) sao cho tổng bình phương sai số của mô hình là nhỏ nhất, ∑ . Từ mô hình (3.6) ta có: ei = Yi - b0 - b1X1 - b2X2 - - bkXk, khi đó: ∑ ∑( ) Trong kinh tế lượng, các số liệu về biến Yi và Xi đã được thu thập vì vậy Q trở thành một hàm số của các hệ số bi, Q(bi). Theo lý thuyết toán học, điều kiện để hàm số Q(bi) đạt giá trị cực tiểu (min): (3.7) { Hệ phương trình (3.7) được gọi là hệ phương trình chuẩn để xác định các hệ số của mô hình hồi quy. Giải hệ phương trình này chúng ta sẽ tìm được các nghiệm, chính là các hệ số (b0, b1, b2, , bk) của mô hình hồi quy mẫu mà chúng ta cần ước lượng. Trong thực tế chúng ta chỉ có thể giải được hệ phương trình (3.7) bằng phương pháp thủ công nếu như số phương trình trong hệ phương trình này là ít (2 hoặc 3), tương ứng với số biến độc lập trong mô hình hồi quy là ít (các mô hình hồi quy đơn giản). Khi số phương trình trong hệ phương trình này tăng lên (mô hình hồi quy có nhiều biến độc lập hơn) khi đó việc giải bằng phương pháp thủ công là rất khó khăn và cần phải có sự trợ giúp của các phần mềm chuyên dụng. Sau đây, chúng ta xét một vài trường hợp sử dụng phương pháp OLS để ước lượng các hệ số của mô hình hồi quy bằng phương pháp thủ công. 3.2.3.1. Áp dụng phương pháp bình phương nhỏ nhất để ước lượng các hệ số của mô hình hồi quy tuyến tính đơn giản Từ mô hình hồi quy: Yi = b0 + b1Xi + ei Giả định trụ cột của phương pháp OLS: 50
- ∑ ∑( ) Hệ phương trình chuẩn: ∑( ) ( ) ∑( ) ( ) { Biến đổi hệ phương trình ta được: ∑ ∑ ( ) ∑ ∑ ∑ ( ) { Chia cả 2 vế của phương trình (3.8) cho n ta được: ∑ ∑ ( ) Thay (3.10) vào (3.9) và biến đồi ta sẽ được: ∑ ∑ ∑ ( ) ∑ (∑ ) Kết hợp (3.10) với (3.11) ta được công thức tính các hệ số ước lượng của mô hình hồi quy tuyến tính đơn giản theo phương pháp OLS: ∑ ∑ ∑ ∑ ∑ { ∑ (∑ ) Các nghiệm số b0, b1 mới thỏa mãn điều kiện cần để cho Q(b0, b1) có cực tiểu. Bây giờ chúng ta đi xét điều kiện đủ để Q(b0, b1) có cực tiểu, ta xét định thực Hessian: 51
- ⁄ ⁄ | | ∑ D = = | | ∑ ∑ | ⁄ ⁄ | (∑ ) ∑ (∑ ) (∑ ) Vì D > 0 nên các biến b0 và b1 ước lượng bằng phương pháp bình phương nhỏ nhất chính là các giá trị thỏa mãn điều kiện đủ để tổng bình phương sai số của mô hình là nhỏ nhất. Để hiểu rõ hơn về cách thức ước lượng các hệ số của mô hình hồi quy bằng phương pháp OLS, chúng ta xét ví dụ: Hãy ước lượng mô hình hồi quy tuyến tính phản ánh mối quan hệ giữa lượng cầu thịt bò (Yi) của người tiêu dùng và giá thịt bò (Xi) tại một vùng như sau: Yi (kg) 26 24 27 30 31 29 33 Xi (nđ/kg) 115 110 106 101 100 105 98 Theo bài ra mối quan hệ giữa lượng cầu thịt bò (Yi) và giá thịt bò (Xi) được thể hiện qua mô hình hồi quy tuyến tính nên chúng ta có thể thiết lập được mô hình như sau: Yi = b0 + b1Xi + ei (3.12) Áp dụng phương pháp OLS cho mô hình (3.11) chúng ta có công thức xác định các hệ số b0 và b1 như sau: ∑ ∑ ∑ ∑ ∑ { ∑ (∑ ) Để ước lượng được các hệ số b0 và b1 của mô hình theo các công thức nêu trên chúng ta lập được bảng tính toán như phía dưới. Từ số liệu đã cho chúng ta có 7 quan sát (n = 7), thay giá trị của n và các giá trị tổng (∑) đã tính được ở trong bảng vào công thức xác định b0 và b1 chúng ta có: 52
- ( ) 2 Số quan sát Yi Xi Xi Yi*Xi 1 26 115 13.225 2.990 2 24 110 12.100 2.640 3 27 106 11.236 2.862 4 30 101 10.201 3.030 5 31 100 10.000 3.100 6 29 105 11.025 3.045 7 33 98 9.604 3.234 ∑ 200 735 77.391 20.901 Lúc này chúng ta có mô hình hồi quy phản ánh mối quan hệ giữa lượng cầu thịt bò (Yi) của người tiêu dùng và giá thịt bò (Xi) như sau: Yi = 76,6964 – 0,4583Xi + ei (3.13) hoặc: Ŷi = 76,6964 – 0,4583Xi Rõ ràng chúng ta thấy việc ước lượng các hệ số của mô hình hồi quy bằng phương pháp bình phương nhỏ nhất (OLS) theo cách tính thủ công chỉ có thể thực hiện được với những mô hình đơn giản, có ít biến độc lập, số dung lượng mẫu ít. Nếu mô hình có nhiều biến độc lập và dung lượng mẫu lớn thì việc tính toán các hệ số của mô hình theo cách tính thủ công gặp rất nhiều khó khăn. Để khắc phục được hiện tượng này, rất nhiều các phần mềm máy tính chuyên dụng đã được ra đời nhằm hỗ trợ cho việc ước lượng các hệ số của mô hình kinh tế lượng trên cơ sở của phương pháp OLS. Có rất nhiều các phần mềm máy tính có chức năng hỗ trợ cho việc ước lượng các hệ số của mô hình kinh tế lượng bao gồm: Excel, Limdep, Sharam, Minitab, Eview, SPSS, STATA Chúng ta có thể xem kết quả ước lượng mô hình hồi quy đơn giản phản ánh mối quan hệ giữa lượng cầu thịt bò (Yi) và giá thịt bò (Xi) từ bộ số liệu ở phần trên bằng phần mềm STATA dưới đây: 53
- . reg Yi Xi Source SS df MS Number of obs = 7 F( 1, 5) = 18.39 Model 45.375 1 45.375 Prob > F = 0.0078 Residual 12.3392857 5 2.46785714 R-squared = 0.7862 Adj R-squared = 0.7434 Total 57.7142857 6 9.61904762 Root MSE = 1.5709 Yi Coef. Std. Err. t P>|t| [95% Conf. Interval] Xi -.4583333 .106889 -4.29 0.008 -.7331003 -.1835663 _cons 76.69643 11.23904 6.82 0.001 47.80555 105.5873 Các hệ số của mô hình ở được xác định ở cột Coef., cụ thể như sau: Hệ số chặn (cons): b0 = 76,6964; Hệ số của biến Xi: b1 = - 0,4583. Mô hình ước lượng sẽ là: Yi = 76,6964 – 0,4583Xi + ei (3.14) Kết quả ước lượng mô hình bằng phương pháp thủ công (mô hình 3.13) cũng giống với kết quả ước lượng bằng phần mềm (mô hình 3.14). Tuy nhiên, việc áp dụng phần mềm sẽ đơn giản hơn và có thể áp dụng được với mẫu nghiên cứu với bất cứ số lượng quan sát là bao nhiêu. Do đó, các phần mềm chuyên dụng cho kinh tế lượng ngày càng được chú trọng và áp dụng rộng rãi. 3.2.3.2. Áp dụng phương pháp bình phương nhỏ nhất để áp dụng các hệ số của mô hình hồi quy tuyến tính bội Mô hình hồi quy bội có mức độ phù hợp hơn so với mô hình hồi quy đơn giản (một biến độc lập) trong nghiên cứu kinh tế xã hội bởi vì trong thực tế một hiện tượng kinh tế xã hội sẽ chịu ảnh hưởng bởi rất nhiều các yếu tố khác nhau (bội). Phương pháp OLS áp dụng cho mô hình hồi quy bội cũng giống như áp dụng cho mô hình hồi quy đơn giản, đó là dựa trên giả định tổng bình phương sai số của mô hình là nhỏ nhất. Từ mô hình hồi quy bội đơn giản nhất (mô hình có 2 biến độc lập): Yi = b0 + b1X1 + b2X2 + ei Áp dụng phương pháp OLS: ∑ ∑( ) 54
- Hệ phương trình chuẩn: ∑( ) ( ) ∑( ) ( ) ∑( ) ( ) { Biến đổi hệ phương trình trên chúng ta có: ∑ ∑ ∑ (3.15) ∑ ∑ ∑ ∑ (3.16) ∑ ∑ ∑ ∑ { (3.17) Chia cả 2 vế của phương trình (3.15) cho n, ta được: ∑ ∑ ∑ (3.18) Thay (3.18) vào (3.16) và (3.17) và biến đổi, ta sẽ được: ̅̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ∑ [∑ ( ) ] [∑ ] (3.19) (3.20) ∑ ̅ ̅̅ ̅ [∑ ̅̅ ̅ ̅̅ ̅] [∑ ( ̅̅ ̅) ] { Để đơn giản hệ phương trình gồm phương trình (3.19) và (3.20) chúng ta đặt: ̅̅̅̅ ̅̅̅̅ ∑ ∑ ̅̅̅ ̅̅̅ ̅̅̅ ∑ ( ) ∑ ̅̅̅ ∑ ( ) Trong đó: ∑ ̅ 55
- ∑ ̅̅̅ ∑ ̅̅̅ Khi đó hệ phương trình trở thành: { Giải hệ phương trình trên và kết hợp nghiệm với (3.18) ta được công thức ước lượng các hệ số của mô hình hồi quy bội đơn giản nhất như sau: ∑ ∑ ∑ { Để hiểu rõ hơn về cách thức ước lượng các hệ số của mô hình hồi quy bội đơn giản nhất (mô hình có 2 biến độc lập) bằng phương pháp bình phương nhỏ nhất (OLS), chúng ta xét ví dụ: Hãy ước lượng mô hình hồi quy tuyến tính phản ánh mối quan hệ giữa lượng cầu thịt bò (Yi) của người tiêu dùng và giá thịt bò (X1) và thu nhập của người tiêu dùng (X2) tại một vùng như sau: Yi (kg) 26 24 27 30 31 29 33 X1 (nghìn đồng/kg) 115 110 106 101 100 105 98 X2 (triệu đồng) 43 33 45 48 50 47 53 Để ước lượng được các hệ số b0, b1, b2 của mô hình theo các công thức nêu trên chúng ta lập bảng tính toán như sau: 2 2 Số quan sát Yi X1 X2 X1 X2 X1X2 Yi*X1 Yi*X2 1 26 115 43 13.225 1.849 4.945 2.990 1.118 2 24 110 33 12.100 1.089 3.630 2.640 792 3 27 106 45 11.236 2.025 4.770 2.862 1.215 4 30 101 48 10.201 2.304 4.848 3.030 1.440 5 31 100 50 10.000 2.500 5.000 3.100 1.550 6 29 105 47 11.025 2.209 4.935 3.045 1.363 7 33 98 53 9.604 2.809 5.194 3.234 1.749 ∑ 200 735 319 77.391 14.785 33.322 20.901 9.227 56