Bài giảng Học phần Lý thuyết thống kê (Phần I) - Chương VI: Kiểm định giả thuyết thống kê

pdf 25 trang Gia Huy 19/05/2022 1610
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Học phần Lý thuyết thống kê (Phần I) - Chương VI: Kiểm định giả thuyết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_hoc_phan_ly_thuyet_thong_ke_phan_i_chuong_vi_kiem.pdf

Nội dung text: Bài giảng Học phần Lý thuyết thống kê (Phần I) - Chương VI: Kiểm định giả thuyết thống kê

  1. CHƯƠNG VI: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ I II IV NHỮNG VẤN KIỂM ĐINH KIỂM ĐỊNH ĐỀ CHUNG VỀ TRUNG BÌNH TỶ LỆ KIỂM ĐỊNH 94
  2. I. Những vấn đề chung về kiểm định 1 Giả thuyết thống kê 2 Sai lầm và mức ý nghĩa trong kiểm định 3 Tiêu chuẩn kiểm định 4 Các bước tiến hành một kiểm định giả thuyết thống kê 1. Giả thuyết thống kê Là giả thuyết về một vấn đề nào đĩ của tổng thể chung (về các tham số như trung bình, tỷ lệ, phương sai, dạng phân phối, ) 95
  3. 1. Giả thuyết thống kê Giả thuyết mà ta muốn kiểm định (H0) Giả thuyết đối lập (Ha, H1, H) 2. Sai lầm và mức ý nghĩa trong kiểm định - Sai lầm loại I là bác bỏ H0 khi H0 đúng - Sai lầm loại II là chấp nhận H0 khi H0 sai 96
  4. 2. Sai lầm và mức ý nghĩa trong kiểm định Kết luận Thực tế Chấp nhận H0 Bác bỏ H0 H0 đúng Kết luận đúng Sai lầm loại I H0 sai Sai lầm loại II Kết luận đúng 2. Sai lầm và mức ý nghĩa trong kiểm định Mức ý nghĩa của kiểm định ( ) là xác suất mắc sai lầm loại I = P(Bác bỏ H0/H0 đúng) 97
  5. 3. Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định là quy luật phân phối xác suất nào đĩ dùng để kiểm định. Trong tập hợp các kiểm định thống kê cĩ cùng mức ý nghĩa , kiểm định nào cĩ xác suất mắc sai lầm loại 2 nhỏ nhất được xem là “tốt nhất”. 4. Các bước tiến hành kiểm định - Xây dựng giả thuyết H0 và giả thuyết đối H1 - Xác định mức ý nghĩa - Chọn tiêu chuẩn kiểm định - Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát - Kết luận 98
  6. Kết luận Quy tắc kiểm định giả thuyết thống kê - Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ (W ), kết luận H0 sai, cĩ cơ sở để bác bỏ H0 - Nếu giá trị của tiêu chuẩn kiểm định thuộc miền khơng bác bỏ, chưa khẳng định H0 đúng mà kết luận chưa đủ cơ sở để bác bỏ H0 II. Kiểm định trung bình 1 Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung 2 Kiểm định hai giá trị trung bình của hai tổng thể 3 Kiểm định trung bình thuộc nhiều tổng thể chung 99
  7. 1. Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung - Giả sử nghiên cứu X  N(, 2) - Chưa biết  song cĩ cơ sở để giả định nĩ bằng 0 (H0:  = 0) - Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đĩ tính trung bình mẫu x - Tiêu chuẩn kiểm định a. Trường hợp đã biết 2 Tiêu chuẩn kiểm định (x  ) Z 0 ~ N (0,1)  / n 100
  8. a. Trường hợp đã biết 2 Miền bác bỏ W - Hai phía: Zqs > z /2 - Vế phải: Zqs > z - Vế trái: Zqs < -z b. Trường hợp chưa biết 2 Tiêu chuẩn kiểm định (x  ) T 0 ~ t S / n (n 1) (x x) 2 f f Trong đĩ S 2 i i i x 2 (x)2 fi 1 fi 1 101
  9. b. Trường hợp chưa biết 2 Miền bác bỏ W - Hai phía: Tqs > t /2(n-1) - Vế phải: Tqs > t (n-1) - Vế trái: Tqs < -t (n-1) b. Trường hợp chưa biết 2 Trong trường hợp số quan sát (n) lớn, thống kê t cĩ phân phối xấp xỉ chuẩn, nên cĩ thể viết tiêu chuẩn kiểm định là: (x  ) Z 0 ~ N (0,1) S / n 102
  10. b. Trường hợp chưa biết 2 Miền bác bỏ W - Hai phía: Zqs > z /2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 2. Kiểm định hai giá trị trung bình của hai tổng thể a. Hai mẫu độc lập b. Hai mẫu phụ thuộc 103
  11. a. Hai mẫu độc lập 2 -Giả sử nghiên cứu 2 tổng thể X1  N(1, 1 ) và 2 X2  N(2, 2 ) - Chưa biết 1 và 2 song cĩ cơ sở để giả định nĩ bằng nhau (H0: 1 = 2) - Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên độc lập, với kích thước n1 và n2 từ đĩ tính được x1 và x 2 - Tiêu chuẩn kiểm định 2 2 Trường hợp đã biết 1 và 2 Tiêu chuẩn kiểm định (x x ) Z 1 2 ~ N (0,1)  2  2 1 2 n1 n2 104
  12. 2 2 Trường hợp đã biết 1 và 2 Miền bác bỏ W - Hai phía: Zqs > z /2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 2 2 Trường hợp chưa biết 1 và 2 Phương sai bằng nhau Phương sai khơng bằng nhau 105
  13. Kiểm định phương sai 2 S1 -Tiêu chuẩn kiểm định F 2 ~ f (n1 1;n2 1) S2 Miền bác bỏ giả thuyết H0: Fqs f /2, (n1-1)(n2-1) 2 2 Trường hợp chưa biết 1 và 2 và phương sai bằng nhau Tiêu chuẩn kiểm định (x1 x2 ) T ~ t ,(n n 2) S 2 S 2 1 2 n1 n2 (n 1)S 2 (n 1)S 2 Trong đĩ S 2 1 1 2 2 (n1 1) (n2 1) 106
  14. 2 2 Trường hợp chưa biết 1 và 2 và phương sai bằng nhau Miền bác bỏ W - Hai phía: Tqs > t /2 ,(n1+n2-2) - Vế phải: Tqs > t (n1+n2-2) - Vế trái: Tqs < -t (n1+n2-2) 2 2 Trường hợp chưa biết 1 và 2 và phương sai khơng bằng nhau Tiêu chuẩn kiểm định (x1 x2 ) T ~ t ,v S 2 S 2 1 2 n1 n2 2 S 2 S 2 1 2 n n 1 2 Nếu v lẻ thì làm trịn xuống v 2 2 2 2 1 S1 1 S2 n1 1 n1 n2 1 n2 107
  15. 2 2 Trường hợp chưa biết 1 và 2 và phương sai khơng bằng nhau Miền bác bỏ W - Hai phía: Tqs > t /2(v) - Vế phải: Tqs > t (v) - Vế trái: Tqs < -t (v) b. Hai mẫu phụ thuộc -Giả sử nghiên cứu 2 tổng thể phụ thuộc 2 2 X1  N(1, 1 ) và X2  N(2, 2 ) Muốn so sánh 1 và 2 ta xét độ lệch trung bình d (chưa biết) cĩ cơ sở để giả định độ lệch trung bình bằng 0 (H0: d = 0) - Để kiểm định giả thuyết trên, lấy mẫu ngẫu nhiên phụ thuộc được hình thành bởi n cặp quan sát của 2 mẫu, tính độ lệch giữa 2 mẫu (di), từ đĩ tính trung bình của các độ lệch giữa các cặp của 2 mẫu ( d ) - Tiêu chuẩn kiểm định 108
  16. b. Hai mẫu phụ thuộc Tiêu chuẩn kiểm định (d  0 ) T ~ t (n 1) S d / n b. Hai mẫu phụ thuộc Miền bác bỏ W - Hai phía: Tqs > t /2(n-1) - Vế phải: Tqs > t (n-1) - Vế trái: Tqs < -t (n-1) 109
  17. b. Hai mẫu phụ thuộc Ưu điểm: Thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai Hạn chế: Tiến hành thực hiện thu thập thơng tin phức tạp hơn 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) 2 - Giả sử cĩ k tổng thể đều cĩ cĩ phân phối Xj N(j,j ) - Chưa biết i song cĩ cơ sở để giả định nĩ bằng nhau (H0: 1 = 2 = . = k) - Để kiểm định giả thuyết trên, lấy k mẫu với cỡ mẫu tương ứng n1, n2, nk - Tiêu chuẩn kiểm định 110
  18. 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) MSF - Tiêu chuẩn kiểm định F ~ f MSE (k 1,n k ) SSF SSE MSF MSE k 1 n k 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) k n j 2 Total Sum of Squares) SST   xij x j 1 i 1 k 2 (Sum of Squares for Factor) SSF  x j x .n j j 1 k n j 2 SSE   xij x j (Sum of Squares for Error) j 1 i 1 SST SSF SSE 111
  19. 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) Miền bác bỏ W : Fqs > f (k-1; n-k) 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) Kết quả (chạy bằng phần mềm) được thể hiện trong bảng sau (ANOVA – Analysis of Variance): ANOVA Source of Variation SS df MS F Between Groups SSF k-1 MSF Within Groups SSE n-k MSE Total SST n-1 112
  20. III. Kiểm định tỷ lệ 1 Kiểm định giả thuyết về tỷ lệ của tổng thể chung 2 Kiểm định tỷ lệ của hai tổng thể chung 3 Kiểm định tỷ lệ của nhiều tổng thể chung 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung - Giả sử nghiên cứu tiêu thức A nào đĩ của một tổng thể chung - Chưa biết p song cĩ cơ sở để giả định nĩ bằng p0 (H0: p = p0) - Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đĩ tính tỷ lệ mẫu f - Tiêu chuẩn kiểm định 113
  21. 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung Khi n đủ lớn (n.f 5 hoặc n(1-f) 5) Tiêu chuẩn kiểm định ( f p ) Z 0 ~ N (0, 1) p0 (1 p0 ) / n 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung Miền bác bỏ W - Hai phía: Zqs > z /2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 114
  22. 2. Kiểm định tỷ lệ của hai tổng thể chung -Giả sử nghiên cứu 2 tổng thể , tỷ lệ chung theo tiêu thức A lần lượt là p1 và p2 - Chưa biết p1 và p1 song cĩ cơ sở để giả định nĩ bằng nhau (H0: p1 = p2) - Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên với kích thước n1 và n2 từ đĩ tính được f1 và f2 - Tiêu chuẩn kiểm định 2. Kiểm định tỷ lệ của hai tổng thể chung Khi n1 và n2 đủ lớn, tức là n1.f1 5 hoặc n1(1-f1) 5 Và n2.f2 5 hoặc n2(1-f2) 5 Tiêu chuẩn kiểm định f f Z 1 2 ~ N (0, 1) 1 1 f (1 f ) n1 n2 n1 f1 n2 f 2 Trong đĩ f n1 n2 115
  23. 2. Kiểm định tỷ lệ của hai tổng thể chung Miền bác bỏ W - Hai phía: Zqs > z /2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 3. Kiểm định tỷ lệ của nhiều tổng thể chung Cĩ ý kiến cho rằng tỷ lệ nghèo ở 3 địa phương (A, B và C) là khác nhau? Từ mỗi địa phương chọn ngẫu nhiên 1 số hộ gia đình và cĩ kết quả như sau: 116
  24. 3. Kiểm định tỷ lệ của nhiều tổng thể chung ĐP Loại hộ A B C Hộ nghèo 20 50 25 Hộ khơng nghèo 180 350 95 -Hãy đưa ra kết luận với mức ý nghĩa 5% -Bảng trên được gọi là bảng ngẫu nhiên 2 dịng (i=1,2) và 3 cột (j=1,3) 3. Kiểm định tỷ lệ của nhiều tổng thể chung Gọi tỷ lệ hộ nghèo của địa phương A, B và C lần lượt là p1, p2 và p3 Cặp giả thuyết cần kiểm định là H0: p1 = p2 = p3 H1:  pi pj (i j) 117
  25. 3. Kiểm định tỷ lệ của nhiều tổng thể chung Gọi nij là tần số thực nghiệm (số quan sát ở dịng thứ i và cột thứ j) Tính tần số lý thuyết (n ij ) tỉng dßng i tỉng cét j n ij n n nij Tổng số đơn vị điều tra i j 3. Kiểm định tỷ lệ của nhiều tổng thể chung Tiêu chuẩn kiểm định 2 2 nij nij 2   ~  ,df i j nij df (sè dßng 1).(sè cét 1) 118