Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Nguyễn Ngọc Lam

pdf 25 trang Gia Huy 2860
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Nguyễn Ngọc Lam", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_nguyen_ly_thong_ke_chuong_8_kiem_dinh_phi_tham_so.pdf

Nội dung text: Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Nguyễn Ngọc Lam

  1. Chương 8: KIỂM ĐỊNH PHI THAM SỐ www.nguyenngoclam.com
  2. I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN 1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có giống đồ thị hàm phân phối chuẩn. 1.2. Kiểm định Jarque-Bera: H0: X có phân phối chuẩn H1: X không có phân phối chuẩn S2 (K 3)2  (x x)3 / n JB n S i 3 6 24 sx (x x)4 /n K i 4 sx 2 Bác bỏ H0: JB >  2, 152
  3. I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN Ví dụ: Kiểm định tỷ lệ lãi trên vốn (%) trước và sau CPH có phân phối chuẩn với mức ý nghĩa 5%: DN Trước CPH Sau CPH DN Trước CPH Sau CPH 1 3,5 4,0 9 4,5 5,0 2 5,1 4,8 10 5,0 5,4 3 4,0 6 11 6,0 6,5 4 4,2 6,8 12 4,0 5,0 5 5,0 5,2 13 5,0 5,6 6 6,0 6,4 14 6,0 6,2 7 5,8 6,0 15 5,4 6,5 8 6,0 5,0 153
  4. I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN 1.3. Kolmogorov-Smirnov 154
  5. I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN 155
  6. II.KIỂM ĐỊNH WILLCOXON (T) 2.1.Giả thuyết: H0: x = y Mẫu phối hợp từng cặp 2.2.Mẫu nhỏ (n≤20): 1. Tính các chênh lệch giữa các cặp: di = xi - yi 2. Xếp hạng di theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp, bỏ qua trường hợp di = 0. + - 3. Tìm tổng các hạng di>0 (di<0). Ký hiệu: T , T 4. Giá trị kiểm định T=min(T+,T-) 5. Bác bỏ H0: T Tn’, , Tn’, có phân phối Wilcoxon n’: Số cặp quan sát khác 0 156
  7. II.KIỂM ĐỊNH WILLCOXON (T) Ví dụ: Để khảo sát xem khách hàng thích sản phẩm nào hơn, chọn ngẫu nhiên 10 khách hàng và yêu cầu họ cho biết sở thích về 2 sản phẩm cùng loại X, Y khác nhau thông qua thang điểm từ 1 đến 5 (điểm càng cao sở thích càng cao). Hãy cho biết khách thích sản phẩm nào nhiều hơn với = 5%. Khách hàng 1 2 3 4 5 6 7 8 9 10 X 4 5 2 4 3 1 3 2 1 5 Y 3 5 5 2 5 5 3 5 5 2 157
  8. II.KIỂM ĐỊNH WILLCOXON (T) Khách 1 2 3 4 5 6 7 8 9 10 Tổng hàng X 4 5 2 4 3 1 3 2 1 5 Y 3 5 5 2 5 5 3 5 5 2 Di 1 0 -3 2 -2 -4 0 -3 -4 3 T+ 1 2,5 5 8,5 T- 5 2,5 7,5 5 7,5 27,5 158
  9. II.KIỂM ĐỊNH WILLCOXON (T) 2.3. Mẫu lớn n>20: Ta có kiểm định Z T T n'(n' 1) 2 n'(n' 1)(2n' 1) z T T T 4 24 159
  10. II.KIỂM ĐỊNH WILLCOXON (T) 160
  11. II.KIỂM ĐỊNH WILLCOXON (T) 161
  12. III.KIỂM ĐỊNH MANN-WHITNEY (U) 3.1.Giả thuyết: H0: 1 = 2 Mẫu độc lập 3.2.Mẫu nhỏ (n1,n2≤20): 1. Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận hạng trung bình các hạng liên tiếp. 2. Tổng hạng mẫu 1 và mẫu 2. Ký hiệu: R1, R2 3. Giá trị kiểm định: U=min(U1,U2) n1(n1 1) U n .n R U2 n1.n2 U1 1 1 2 2 1 4. Bác bỏ H0: U Un1,n2, 162
  13. III.KIỂM ĐỊNH MANN-WHITNEY (U) Ví dụ: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3 tháng người ta thu thập số liệu về trọng lượng của heo (X). Trong khi đó 15 con lợn khác không dùng thuốc tăng trọng có trọng lượng, sau 3 tháng người ta thu thập số liệu (Y). Hãy kiểm tra xem trọng lượng có như nhau hay không khi thử nghiệm với =5%. X 60 61 62 62 63 63 68 64 64 65 Y 56 56 57 57 58 58 58 59 59 60 60 60 61 61 62 R(X) 11,5 15 18 18 20,5 20,5 25 22,5 22,5 24 197,5 R(Y) 1,5 1,5 3,5 3,5 6 6 6 8,5 8,5 11,5 11,5 11,5 15 15 18 127,5 163
  14. III.KIỂM ĐỊNH MANN-WHITNEY (U) 3.3.Mẫu lớn (n1,n2>20): Ta có kiểm định z U U n1n2 2 n1.n2(n1 n2 1) z U U U 2 12 164
  15. III.KIỂM ĐỊNH MANN-WHITNEY (U) 165
  16. III.KIỂM ĐỊNH MANN-WHITNEY (U) 166
  17. IV.KIỂM ĐỊNH KRUSKAL-WALLIS H0 : 1 2 k • Giả thuyết: H1 : i j(i j) • Giá trị kiểm định: Chọn k mẫu độc lập có n1 ,nk quan sát (ni 5), n=ni. Tổng hạng của k mẫu R1, ,Rk 12 k R2 W  i 3(n 1) n(n 1)i 1 ni 2 • Bác bỏ H0: W>  k-1, 167
  18. IV.KIỂM ĐỊNH KRUSKAL-WALLIS Ví dụ: Một nhà nghiên cứu muốn xem xét phải chăng ở 3 ngành công nghiệp A,B,C tổng giá trị sản phẩm trung bình của các xí nghiệp là như nhau với mức ý nghĩa 5%. Chọn một số xí nghiệp ở các ngành đó như sau: Ngành A 1,38 1,55 1,90 2,00 1,22 2,11 1,98 1,61 Tổng Ngành B 2,33 2,50 2,79 3,01 1,99 2,45 Ngành C 1,06 1,37 1,09 1,65 1,44 1,11 rank(A) 6 8 11 14 4 15 12 9 79 rank(B) 16 18 19 20 13 17 103 rank(C) 1 5 2 10 7 3 28 W=13,5416 168
  19. IV.KIỂM ĐỊNH KRUSKAL-WALLIS 169
  20. IV.KIỂM ĐỊNH KRUSKAL-WALLIS 170
  21. V.KIỂM ĐỊNH SỰ PHÙ HỢP Giả thuyết H0: Tổng thể được chia làm k nhóm, có phân phối xác suất pi (pi=1) để một quan sát rơi vào nhóm i. Chọn ngẫu nhiên n quan sát, ni là số quan sát rơi vào nhóm i. Nhóm 1 2 k Ho P1 P2 Pk 1 Quan sát n1 n2 nk n k 2 2 (ni Ei) Giá trị kiểm định:   , Ei npi 5 i 1 Ei 2 2 Bác bỏ Ho:  > k-1, 171
  22. V.KIỂM ĐỊNH SỰ PHÙ HỢP Ở một quán cafe, có 4 nhãn hiệu nước giải khát khác nhau. 160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau. Có thể kết luận sự ưa chuộng của khách hàng về 4 giải khát là như nhau được không ở mức ý nghĩa 2,5%. Nhãn hiệu A B C D Số khách hàng 34 46 29 51 160 GT Ho (pi) 0,25 0,25 0,25 0,25 1 Ei=n.pi 40 40 40 40 2 (ni-Ei) /Ei 0,90 0,90 3,03 3,03 7,85 172
  23. VI.KIỂM ĐỊNH SỰ ĐỘC LẬP Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp thành 2 tiêu thức: Phân nhóm theo tiêu Phân nhóm theo tiêu thức thứ nhất thức thứ hai 1 2 c  1 n11 n12 n1c R1 2 n21 n22 n2c R2 r nr1 nr2 nrc Rr  C1 C2 Cc n Giả thuyết H0: Tiêu thức 1 và tiêu thức 2 độc lập r c 2 2 (nij Eij ) RiC j Giá trị kiểm định:    , E ij i 1j 1 Eij n 2 2 Bác bỏ H0:  (r 1)(c 1), 173
  24. VI.KIỂM ĐỊNH SỰ ĐỘC LẬP Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau. Kiểm định giả thuyết không có mối liên hệ nào giữa giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa 0,5%. Giới tính Nhãn hiệu ưa thích Coca Pepsi 7Up Tổng (Ri) Nam 308 177 114 599 (200) (199) (200) Nữ 502 627 697 1826 (610) (605) (611) Tổng(Cj) 810 804 811 2425 2 = 129,83 174
  25. www.nguyenngoclam.com