Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định

ppt 43 trang haiha333 3730
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_xac_suat_thong_ke_chuong_7_ly_thuyet_kiem_dinh.ppt

Nội dung text: Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định

  1. Chương 7. Lý thuyết kiểm định §1: Khái niệm chung về kiểm định Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau: 1. Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm này là và gọi là mức ý nghĩa. 2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại nay là B và gọi 1-B là lực kiểm định. Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa là cho trước. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 1 @Copyright 2010
  2. Giả thiết :  = 0  0 (thiếu) Giả thiết đối lập:    0 (thừa)  0 (đối xứng-ta chỉ xét bài này) §2: Kiểm định giả thiết về tỉ lệ 1. Bài toán 1 mẫu: Bài toán: Ký hiệu tỉ lệ của 1 tổng thể là P(chưa biết). Từ tổng thể lấy 1 mẫu kích thước n, có tỉ lệ mẫu f. Với mức ý nghĩa hãy kiểm định giả thiết: Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 2 @Copyright 2010
  3. Giải: Bước 1: Tra  ( fn−0 ) Bước 2: Tính giá trị quan sát: Uqs = 00(1 −  ) Bước 3: Kết luận: U qs  H đúng  = 0 U qs  H sai  0 U −    0 qs 0 Uqs   0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 3 @Copyright 2010
  4. 2. Bài toán 2 mẫu Bài toán: kí hiệu tỉ lệ của tổng thể 1, 2 là  12 , (cả 2 chưa biết).Từ các tổng thể lấy các mẫu kích thước nn 12 , ,có tỉ lệ mm12 mẫu ff 12 == , . Với mức ý nghĩa , hãy kiểm định nn12 giả thiết: : 12 =  Bước 1:  mm 12− nn Bước 2: 12 U qs = m++ m m m 1 2 1− 1 2 n1. n 2 n 1+ n 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 4 @Copyright 2010
  5. • Bước 3: Kết luận: U  H đúng qs 12 =    U qs  H sai 12 Uqs − 12  12  Uqs  12  Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 5 @Copyright 2010
  6. Ví dụ 2.1:Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là 6%, còn nếu áp dụng phương pháp II thì trong 100 phế phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương pháp thứ I không? Hãy kết luận với mứa ý nghĩa 0,05. Giải: Ký hiệu là tỉ lệ phế phẩm của phương pháp I ; =0 0,06 P là tỉ lệ phế phẩm của phương pháp II ( chưa biết) :  = 0 = 0,06,f = 0,05 Bước 1: = 1,96 ( fn− 0 ) (0,05 − 0,06) .10 Bước 2: Uqs = = = −0,42 00(1 −  ) 0,06.0,94 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 6 @Copyright 2010
  7. Bước 3: U qs  0,05 = 1,96  =  0 .Vậy tỉ lệ phế phẩm của phương pháp II bằng với tỉ lệ của phương pháp I • Ví dụ 2.2.Thống kê số phế phẩm của 2 nhà máy cùng sản xuất một loại sản phẩm có bảng số liệu : Nhà máy Số sản phẩm Số phế phẩm I 1200 20 II 1400 60 Với mức ý nghĩa 0.05 ,hãy xét xem tỷ lệ phế phẩm ở 2 nhà máy trên có như nhau hay không ? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 7 @Copyright 2010
  8. 1 -tỷ lệ phế phẩm của nhà máy I  2 -tỷ lệ phế phẩm của nhà máy II H :12 =  Bước 1 =0,05 Z = 1,96 20 60 + Bước 2 Uqs =1200 1400 = −3,855 20+ 60 80 1− 1200.1400 2600 Bước 3 Uqs − Z = −1,96 12  Vậy tỷ lệ phẩm của nhà máy 1 thấp hơn nhà máy 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 8 @Copyright 2010
  9. § 3.Kiểm định giả thiết về giá trị trung bình 1.Bài toán 1 mẫu: Ký hiệu trung bình của 1 tổng thể là a (chưa biết).Từ tổng thể lấy 1 mẫu kích thước n có trung bình mẫu x , và phương sai điều chỉnh mẫu S 2 . Với mức ý nghĩa ,hãy kiểm định giả thiết: H == a a 0 Giải: 2 Trường hợp1: Đã biết phương sai tổng thể  B1: Z (x− a0 ) n B2: U = qs  Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 9 @Copyright 2010
  10. B3. H đúng: aa= 0 UZqs H sai : aa 0 UZqs Uqs − Z a a0 aa 0 : Uqs Z a a0 TH 2: Chưa biết phương sai tổng thể  2 ,n 30 B1: Z (x− a0 ) n B2: U = qs S UZqs B3: H đúng: aa= 0 UZqs H sai: aa 0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 10 @Copyright 2010
  11. Uqs − Z a a0 aa 0 . Uqs Z a a0 TH3: Chưa biết phương sai tổng thể  2 ,n 30 B1. (n−1) T (x− a0 ) n B2: T = qs S TT (n−1) B3:Kết luận qs H đúng aa= 0 (n−1) H sai aa 0 TTqs (n−1) Tqs − T a a0 aa 0 (n−1) Tqs T a a0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 11 @Copyright 2010
  12. .Ví dụ 3.1. Trọng lượng (X) của một loại sản phẩm do nhà máy sản xuất ra là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là  = 1 kg ,trọng lượng trung bình là 50kg. Nghi ngờ hoạt động không bình thường làm thay đổi trọng lượng trung bình của sản phẩm người ta cân thử 100 sản phẩm và thu được kết quả sau: Trọng lượng sản phẩm(kg) 48 49 50 51 52 Số lượng sản phẩm 10 60 20 5 5 Với mức ý nghĩa 0.05,hãy kết luận về nghi ngờ nói trên. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 12 @Copyright 2010
  13. . Giải. Vì  = 1 nên đây là trường hợp 1 x = 49,35 UZqs =(49,35 − 50) 100 = − 6,5 0,05 = − 1,96 aa 0 = 50 Vậy máy đã hoat động không bình thường làm giảm trọng lượng trung bình của sản phẩm. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 13 @Copyright 2010
  14. Ví dụ 3.2. .Mức hao phí xăng(X) cho một loại xe ô tô chay trên đoạn đường AB là một đại lượng ngẫu nhiên có phân phối chuẩn có kỳ vọng là 50 lít. Nay do đường được tu sửa lại, người ta cho rằng hao phí trung bình đã giảm xuống. Quan sát 55 chuyến xe chạy trên đường AB ta thu được bảng số liệu sau : Mức hao phí(lít) 48,5-49,0 49,0-49,5 49,5-500 500-505 505-510 10 11 10 4 20 Số chuyến xe ni Với mức ý nghĩa = 0,05 hãy cho kết luận về ý kiến trên. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 14 @Copyright 2010
  15. a mức hao phí xăng khi sửa lại đường a0 mức hao phí xăng khi chưa sửa lại đường H: a= a0 Z0,05 = 1,96 x = 49, 416 S = 0,573 (x− a0 ) n (49,416− 50) 36 U == qs S 0,573 = −6,115 −Z = − 1,96 aa0 Vậy mức hao phí xăng trung bình đã giảm . Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 15 @Copyright 2010
  16. .Ví dụ 3.3. Định mức để hòan thành 1 sản phẩm là 1,45 phút. Có nên thay đổi định mức không,nếu theo dõi thời gian hoàn thành của 25 công nhân,ta có bảng số liệu sau: Thời gian sản xuất 10-12 12-14 14-16 1-18 18-20 một sản phẩm(phút) Số công nhân 2 6 10 4 3 tương ứng (ni ) Hãy kết luận với mức ý nghĩa 0.05 biết rằng thời gian hoàn thành một sản phẩm (X) là một đại lượng ngẫu nhiên có phân phối chuẩn. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 16 @Copyright 2010
  17. . Giải H: a= a0 a0 =14,25 là định mức cũ ,a là năng suất trung bình mới (24) T0.05 = 2,064 (15− 14,5) 25 T= =1,118 2.046 a = a qs 2,226 0 Vậy không nên thay đổi định mức. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 17 @Copyright 2010
  18. 2. Bài toán 2 mẫu: Kí hiệu trung bình của tổng thể 1,2 là aa 1, 2 ( cả hai chưa biết. Từ các tổng thể lấy các mẫu kích thước nn 12 , có 22 trung bình mẫu xx 12 , và phương sai hiệu chỉnh mẫu SS 12 , Với mức ý nghĩa ,hãy kiểm định giả thiết: H: a12= a 22 Trường hợp1. Đã biết phương sai tổng thể 12, B1: Z xx12− B2: Uqs = 22 12− nn12 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 18 @Copyright 2010
  19. B3. Kết luận aa= . UZ qs H đúng: 12 H sai aa12 UZqs Uqs − Z a12 a Uqs Z a12 a 22 TH2: Chưa biết 1, 2 ,(nn 1 & 2 30) B1: Z xx− U = 12 B2: qs 22 SS 12+ nn12 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 19 @Copyright 2010
  20. 22 TH3: Chưa biết 1, 2 ,nn 1 2 30 B1. (nn12+−2) T xx− B2. 12 Tqs = SS22 12+ nn12 TTqs H đúng aa12= H sai aa12 TTqs ( ) Tqs − T a12 a ( ) Tqs T a12 a Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 20 @Copyright 2010
  21. (nn12+−2) Quy ước:Nếu n1+ n 2 −2 30 T 2 Z Ví dụ 3.4: Ngườì ta thí nghiệm 2 phương pháp chă nuôi gà khác nhau, sau 1 tháng kết quả tăng trọng như sau: Phương pháp Số gà được Mức tăng trọng Độ lệch tiêu chuẩn theo dõi trung bình (kg) I 100 1,2 0,2 II 150 1,3 0.3 Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu quả hơn phương pháp I không? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 21 @Copyright 2010
  22. . Giải: a1 - Mức tăng trong trung bình của phương pháp I a2 -Mức tăng trọng trung bình của phương pháp II H: a12= a z =1,96 1,2− 1,3 U= = −3,16 − Z a a qs 0,04 0,09 12 + 100 150 Vậy phương pháp 2 hiệu quả hơn phương pháp 1 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 22 @Copyright 2010
  23. .Ví dụ 3.5:Tương tự ví dụ trên nhưng thay bảng số liệu sau nn1=10, 2 = 15, 2 = 0,3 xx12==1,2, 1,3 1,2− 1,3 (23) TTqs = = −1 0,05 = 2,069 0,222 0,3 + 10 15 =aa12 Vậy hai phương pháp hiệu quả như nhau. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 23 @Copyright 2010
  24. §4. Kiểm định giả thiết về phương sai 2 Bài toán: kí hiệu phương sai cuả tổng thể là  ,từ tổng thể lấy 1 mẫu kích thước n có phương sai hiệu chỉnh mẫu 2 22 S , với mức ý nghĩa ,hãy kiểm định giả thiết: H := 0 22 B1:  (nn− 1) ( − 1) 1− 22 2 B2: 2 (nS−1.) qs = 2  0 2 2 2 2 2 B3:Kết luận:  (nn− 1) qs  ( − 1)  =  0 1− 22 2 2 2 2 qs  (n − 1)   0 1− 2 2 2 2 2 qs  (n − 1)   0 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 24 @Copyright 2010
  25. Ví dụ 4.1. Chọn ngẫu nhiên 27 vòng bi cùng loại thì thấy độ lệch trung bình S=0.003. Theo số liệu quy định thì độ lệch chuẩn cho phép không vượt quá 0.0025. Với mức ý nghĩa 0.05, hãy cho kết luận? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 25 @Copyright 2010
  26. .Giải : 26.0,0032 n =27,2 (26) = 13,84,  2( 26) = 41,92,  2 = = 37,44 0.975 0.025 qs 0,00252 2 2 2 13,84 qs 41,92   0 Vậy lô vòng bi này chưa vượt mức cho phép về độ phân tán Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 26 @Copyright 2010
  27. §5. Kiểm định giả thiết về quy luật phân phối. Bài toán:Giả sử đại lượng ngẫu nhiên gốc X của tổng thể chưa rõ phân phối. Từ tổng thể lấy một mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H: có X có phân phối F(x) 1.F(x) là phân phối rời rạc Giả sử bảng phân phối tần số mẫu có dạng X x1 x2 xk n ni n1 n2 k Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 27 @Copyright 2010
  28. B1:Ký hiệu r là số tham số chưa biết của phân phối F(x),ta thay các tham số đó bằng các ước lượng hợp lý tối đa . 2 B2: Tra  (kr−−1) B3: Tính pii= ( X = x), X F( x) , i = 1,2, k B4: Tính giá trị quan sát 2 k 2 (nii− np ) qs =  i=1 npi B5: Kết luận: 22 qs (kr − −1) H đúng: X có phân phối F(X) 22 qs (kr − −1) H sai : X không có phân phối F(X) Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 28 @Copyright 2010
  29. 1. Kiểm định giả thiết về phân phối đều rời rạc H:X có phân phối đều rời rạc B1. r = 0 (do phân phối đều không có tham số chưa biết) B2. 2  (k −1) 1 B3. pi ==, i 1, k k 2 n kk ni − 1 2 B4. 2 k qs= =(n i . k − n) ii==11 n nk k B5. Theo bài toán chung như trên Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 29 @Copyright 2010
  30. Ví dụ 5.1. Tung 1 con xúc xắc ta được bảng điểm sau đây: Số điểm 1 2 3 4 5 6 Số lần 3 7 6 5 6 4 Với mức ý nghĩa 0.05 ,hãy kết luận con xúc sắc trên có đều hay không? Giải: 1 2 2 2 2 2 =2 (3.6 −+−+− 31) ( 7.6 31) ( 6.6 31) .2 +−+−( 5.6 31) ( 4.6 31) qs 31.6 2 =2,1 0.05 (5) = 11,4 Vậy con xúc xắc đều Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 30 @Copyright 2010
  31. 2. Kiểm định giả thiết về phân phối Poison. . Ha: ( ) X 0 1 2 k-1 ni n0 n1 n2 nk −1 B1.r =1 (có 1 tham số chưa biết là a), ax= 2 B2.  (k − 2) B3. ai p= p(  = i) = e−a , i = 0, k − 1 i i! 2 B4. k −1 2 (nii− np ) qs =  i=0 npi B5. Như b5 ở bài trên Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 31 @Copyright 2010
  32. Ví dụ 5.2: Để kiểm tra công việc của 200 công nhân,người ta chọn ngẫu nhiên 1000 sản phẩm của mỗi người đem đi thử nghiệm để tìm ra phế phẩm. Kết quả như sau: Số phế phẩm trên1000 sản phẩm 0 1 2 3 4 Số công nhân 109 65 22 3 1 Với mức ý nghĩa 0.01, có thể coi mẫu trên phù hợp với phân phối Poisson Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 32 @Copyright 2010
  33. Giải: ax==0,61 0,61i np==200. e−0,61 . , i 0,4 i i! n i i npi 0 109 108,67 1 65 66,29 2 22 20,21 3 3 4,111 4 1 0,627 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 33 @Copyright 2010
  34. . (109− 108,67)2( 65 − 66,29) 2( 22 − 20,21) 2  2 = + + + qs 108,67 66,29 20,21 (3−− 4,11)22( 1 0,637) + =0,72  2 = 11,34 4,11 0,637 0.01 Vậy mẫu trên phù hợp với phân phối Poison. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 34 @Copyright 2010
  35. II. Trường hợp F(x) liên tục: H:  F( x) Giả sử bảng phân phối tần số mẫu có dạng: aa, aa, X (aa0, 1 ) ( 12) ( kk−1 ) ni n1 n2 nk B1. r là số tham số chưa biết.Thay các tham số đó bằng các ước lượng hợp lý tối đa của chúng. 2 B2.Tra  (kr−−1) B3. Tính pa11= ( −  ), p2= ( a 1  a 2 ), , pk−1= ( a k − 2  a k − 1 ) p =1 pa=   + Chú ý:  i kk( −1 ) i Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 35 @Copyright 2010
  36. 2 kk2 2 (nii− np ) ni 1 B4. qs = = . − n ii==11npii p n B5. Giống trường hợp F(x) rời rạc. Kiểm định về phân phối chuẩn. H:, N( a  2 )  (aa01, ) (aa12, ) (aakk−1, ) n ni n1 n2 k B1: r=2, a = x , = S = x n Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 36 @Copyright 2010
  37. 2 B2.  (k −3) B3. ax1 − p1 =  + 0,5  a21−− x a x p2 =  −  , ,  akk−−12−− x a x pk −1 =  −   axk −1 − pk =0,5 −   Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 37 @Copyright 2010
  38. 2 kk2 B4. 2 (nii− np ) ni 1 qs = = . − n ii==11npii p n B5. kết luận như b5 bài toán chung Ví dụ 5.3 : Bảng điểm của 1 lớp học như sau Số điểm 0-3 3-5 5-7 7-8 8-10 Số học sinh 6 24 43 16 11 Với = 0,05 hãy kết luận bảng này có phù hợp với phân phối chuẩn hay không? x=5,82, = x n = 1,8688 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 38 @Copyright 2010
  39. Bài giải: 3− 5,82 p1 = +=−0,5( 1,51) +=− 0,5 0,43448 += 0,5 0,06552 1,8688 . 5− 5,82 p2 =  +0,43448 = −( 0,44) + 0,43448 1,8688 = −0,17003 + 0,43448 = 0,26445 7− 5,82 p3 =  +0,17003 = ( 0,03) + 0,17003 = 0,40568 1,8688 8− 5,82 p4 = −0,23565 = ( 1,17) − 0,23565 = 0,14335 1,8688 p5 =0,5 − ( 1,17) = 0,12 2 2 2 2 2 2 6 24 43 16 11 qs = + + + +:100 − 100 0,06552 0,26445 0,40568 0,14335 0,121 2 =0,707 0.05 (2) = 6 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 39 @Copyright 2010
  40. §6.Bảng phân phối tần số đồng thời hay bảng tương quan mẫu Giả sử X,Y là 2 đại lượng ngẫu nhiên gốc của cùng 1 tổng thể. Bảng phân phối tần số mẫu đồng thời của X,Y là: Y y1 y X 2 yh ni x1 n11 n12 n1h n1 x n21 n n 2 22 2h n2 xk nk1 nk 2 nkh nk m j n m1 m2 mh Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 40 @Copyright 2010
  41. y xi i nij x1 y1 n11 x y n 1 2 12 xk yh nkh Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 41 @Copyright 2010
  42. §7. Kiểm định độc lập. Giả sử X,Y là 2 đại lượng ngẫu nhiên của cùng 1 tổng thể,từ tổng thể lấy 1 mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H:X,Y độc lập 2 B1.  (kh−−11)( ) B2. n − 2 ( ij ij ) nmij. qs = ,5ij = i,j  ij n n2  2 =− ij 1.n qs  nm. ij, ij B3. 22 độc lập qs ()  ,Y 22 phụ thuộc qs ()  ,Y Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 42 @Copyright 2010
  43. Ví dụ.7.1:Nghiên cứu ảnh hưởng của hoàn cảnh gia đình đối với tình trạng phạm tội của trẻ em có kết quả: Tình trạng phạm tội Bố mẹ Bố mẹ Còn cả đã mất ly hôn bố mẹ ni Không phạm tội 20 25 13 58 Có phạm tội 29 43 18 90 49 68 31 148 m j 2 2 2 22 20 25 11 qs = + + + − 1 = 0,32 0,05 (2) = 6 58.49 58.68 90.31 Vậy hoàn cảnh gia đình không ảnh hưởng tới tính trạng phạm tội Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 43 @Copyright 2010