Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_xac_suat_thong_ke_chuong_7_ly_thuyet_kiem_dinh.ppt
Nội dung text: Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định
- Chương 7. Lý thuyết kiểm định §1: Khái niệm chung về kiểm định Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau: 1. Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm này là và gọi là mức ý nghĩa. 2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại nay là B và gọi 1-B là lực kiểm định. Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa là cho trước. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 1 @Copyright 2010
- Giả thiết : = 0 0 (thiếu) Giả thiết đối lập: 0 (thừa) 0 (đối xứng-ta chỉ xét bài này) §2: Kiểm định giả thiết về tỉ lệ 1. Bài toán 1 mẫu: Bài toán: Ký hiệu tỉ lệ của 1 tổng thể là P(chưa biết). Từ tổng thể lấy 1 mẫu kích thước n, có tỉ lệ mẫu f. Với mức ý nghĩa hãy kiểm định giả thiết: Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 2 @Copyright 2010
- Giải: Bước 1: Tra ( fn−0 ) Bước 2: Tính giá trị quan sát: Uqs = 00(1 − ) Bước 3: Kết luận: U qs H đúng = 0 U qs H sai 0 U − 0 qs 0 Uqs 0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 3 @Copyright 2010
- 2. Bài toán 2 mẫu Bài toán: kí hiệu tỉ lệ của tổng thể 1, 2 là 12 , (cả 2 chưa biết).Từ các tổng thể lấy các mẫu kích thước nn 12 , ,có tỉ lệ mm12 mẫu ff 12 == , . Với mức ý nghĩa , hãy kiểm định nn12 giả thiết: : 12 = Bước 1: mm 12− nn Bước 2: 12 U qs = m++ m m m 1 2 1− 1 2 n1. n 2 n 1+ n 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 4 @Copyright 2010
- • Bước 3: Kết luận: U H đúng qs 12 = U qs H sai 12 Uqs − 12 12 Uqs 12 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 5 @Copyright 2010
- Ví dụ 2.1:Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là 6%, còn nếu áp dụng phương pháp II thì trong 100 phế phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương pháp thứ I không? Hãy kết luận với mứa ý nghĩa 0,05. Giải: Ký hiệu là tỉ lệ phế phẩm của phương pháp I ; =0 0,06 P là tỉ lệ phế phẩm của phương pháp II ( chưa biết) : = 0 = 0,06,f = 0,05 Bước 1: = 1,96 ( fn− 0 ) (0,05 − 0,06) .10 Bước 2: Uqs = = = −0,42 00(1 − ) 0,06.0,94 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 6 @Copyright 2010
- Bước 3: U qs 0,05 = 1,96 = 0 .Vậy tỉ lệ phế phẩm của phương pháp II bằng với tỉ lệ của phương pháp I • Ví dụ 2.2.Thống kê số phế phẩm của 2 nhà máy cùng sản xuất một loại sản phẩm có bảng số liệu : Nhà máy Số sản phẩm Số phế phẩm I 1200 20 II 1400 60 Với mức ý nghĩa 0.05 ,hãy xét xem tỷ lệ phế phẩm ở 2 nhà máy trên có như nhau hay không ? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 7 @Copyright 2010
- 1 -tỷ lệ phế phẩm của nhà máy I 2 -tỷ lệ phế phẩm của nhà máy II H :12 = Bước 1 =0,05 Z = 1,96 20 60 + Bước 2 Uqs =1200 1400 = −3,855 20+ 60 80 1− 1200.1400 2600 Bước 3 Uqs − Z = −1,96 12 Vậy tỷ lệ phẩm của nhà máy 1 thấp hơn nhà máy 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 8 @Copyright 2010
- § 3.Kiểm định giả thiết về giá trị trung bình 1.Bài toán 1 mẫu: Ký hiệu trung bình của 1 tổng thể là a (chưa biết).Từ tổng thể lấy 1 mẫu kích thước n có trung bình mẫu x , và phương sai điều chỉnh mẫu S 2 . Với mức ý nghĩa ,hãy kiểm định giả thiết: H == a a 0 Giải: 2 Trường hợp1: Đã biết phương sai tổng thể B1: Z (x− a0 ) n B2: U = qs Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 9 @Copyright 2010
- B3. H đúng: aa= 0 UZqs H sai : aa 0 UZqs Uqs − Z a a0 aa 0 : Uqs Z a a0 TH 2: Chưa biết phương sai tổng thể 2 ,n 30 B1: Z (x− a0 ) n B2: U = qs S UZqs B3: H đúng: aa= 0 UZqs H sai: aa 0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 10 @Copyright 2010
- Uqs − Z a a0 aa 0 . Uqs Z a a0 TH3: Chưa biết phương sai tổng thể 2 ,n 30 B1. (n−1) T (x− a0 ) n B2: T = qs S TT (n−1) B3:Kết luận qs H đúng aa= 0 (n−1) H sai aa 0 TTqs (n−1) Tqs − T a a0 aa 0 (n−1) Tqs T a a0 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 11 @Copyright 2010
- .Ví dụ 3.1. Trọng lượng (X) của một loại sản phẩm do nhà máy sản xuất ra là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là = 1 kg ,trọng lượng trung bình là 50kg. Nghi ngờ hoạt động không bình thường làm thay đổi trọng lượng trung bình của sản phẩm người ta cân thử 100 sản phẩm và thu được kết quả sau: Trọng lượng sản phẩm(kg) 48 49 50 51 52 Số lượng sản phẩm 10 60 20 5 5 Với mức ý nghĩa 0.05,hãy kết luận về nghi ngờ nói trên. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 12 @Copyright 2010
- . Giải. Vì = 1 nên đây là trường hợp 1 x = 49,35 UZqs =(49,35 − 50) 100 = − 6,5 0,05 = − 1,96 aa 0 = 50 Vậy máy đã hoat động không bình thường làm giảm trọng lượng trung bình của sản phẩm. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 13 @Copyright 2010
- Ví dụ 3.2. .Mức hao phí xăng(X) cho một loại xe ô tô chay trên đoạn đường AB là một đại lượng ngẫu nhiên có phân phối chuẩn có kỳ vọng là 50 lít. Nay do đường được tu sửa lại, người ta cho rằng hao phí trung bình đã giảm xuống. Quan sát 55 chuyến xe chạy trên đường AB ta thu được bảng số liệu sau : Mức hao phí(lít) 48,5-49,0 49,0-49,5 49,5-500 500-505 505-510 10 11 10 4 20 Số chuyến xe ni Với mức ý nghĩa = 0,05 hãy cho kết luận về ý kiến trên. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 14 @Copyright 2010
- a mức hao phí xăng khi sửa lại đường a0 mức hao phí xăng khi chưa sửa lại đường H: a= a0 Z0,05 = 1,96 x = 49, 416 S = 0,573 (x− a0 ) n (49,416− 50) 36 U == qs S 0,573 = −6,115 −Z = − 1,96 aa0 Vậy mức hao phí xăng trung bình đã giảm . Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 15 @Copyright 2010
- .Ví dụ 3.3. Định mức để hòan thành 1 sản phẩm là 1,45 phút. Có nên thay đổi định mức không,nếu theo dõi thời gian hoàn thành của 25 công nhân,ta có bảng số liệu sau: Thời gian sản xuất 10-12 12-14 14-16 1-18 18-20 một sản phẩm(phút) Số công nhân 2 6 10 4 3 tương ứng (ni ) Hãy kết luận với mức ý nghĩa 0.05 biết rằng thời gian hoàn thành một sản phẩm (X) là một đại lượng ngẫu nhiên có phân phối chuẩn. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 16 @Copyright 2010
- . Giải H: a= a0 a0 =14,25 là định mức cũ ,a là năng suất trung bình mới (24) T0.05 = 2,064 (15− 14,5) 25 T= =1,118 2.046 a = a qs 2,226 0 Vậy không nên thay đổi định mức. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 17 @Copyright 2010
- 2. Bài toán 2 mẫu: Kí hiệu trung bình của tổng thể 1,2 là aa 1, 2 ( cả hai chưa biết. Từ các tổng thể lấy các mẫu kích thước nn 12 , có 22 trung bình mẫu xx 12 , và phương sai hiệu chỉnh mẫu SS 12 , Với mức ý nghĩa ,hãy kiểm định giả thiết: H: a12= a 22 Trường hợp1. Đã biết phương sai tổng thể 12, B1: Z xx12− B2: Uqs = 22 12− nn12 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 18 @Copyright 2010
- B3. Kết luận aa= . UZ qs H đúng: 12 H sai aa12 UZqs Uqs − Z a12 a Uqs Z a12 a 22 TH2: Chưa biết 1, 2 ,(nn 1 & 2 30) B1: Z xx− U = 12 B2: qs 22 SS 12+ nn12 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 19 @Copyright 2010
- 22 TH3: Chưa biết 1, 2 ,nn 1 2 30 B1. (nn12+−2) T xx− B2. 12 Tqs = SS22 12+ nn12 TTqs H đúng aa12= H sai aa12 TTqs ( ) Tqs − T a12 a ( ) Tqs T a12 a Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 20 @Copyright 2010
- (nn12+−2) Quy ước:Nếu n1+ n 2 −2 30 T 2 Z Ví dụ 3.4: Ngườì ta thí nghiệm 2 phương pháp chă nuôi gà khác nhau, sau 1 tháng kết quả tăng trọng như sau: Phương pháp Số gà được Mức tăng trọng Độ lệch tiêu chuẩn theo dõi trung bình (kg) I 100 1,2 0,2 II 150 1,3 0.3 Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu quả hơn phương pháp I không? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 21 @Copyright 2010
- . Giải: a1 - Mức tăng trong trung bình của phương pháp I a2 -Mức tăng trọng trung bình của phương pháp II H: a12= a z =1,96 1,2− 1,3 U= = −3,16 − Z a a qs 0,04 0,09 12 + 100 150 Vậy phương pháp 2 hiệu quả hơn phương pháp 1 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 22 @Copyright 2010
- .Ví dụ 3.5:Tương tự ví dụ trên nhưng thay bảng số liệu sau nn1=10, 2 = 15, 2 = 0,3 xx12==1,2, 1,3 1,2− 1,3 (23) TTqs = = −1 0,05 = 2,069 0,222 0,3 + 10 15 =aa12 Vậy hai phương pháp hiệu quả như nhau. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 23 @Copyright 2010
- §4. Kiểm định giả thiết về phương sai 2 Bài toán: kí hiệu phương sai cuả tổng thể là ,từ tổng thể lấy 1 mẫu kích thước n có phương sai hiệu chỉnh mẫu 2 22 S , với mức ý nghĩa ,hãy kiểm định giả thiết: H := 0 22 B1: (nn− 1) ( − 1) 1− 22 2 B2: 2 (nS−1.) qs = 2 0 2 2 2 2 2 B3:Kết luận: (nn− 1) qs ( − 1) = 0 1− 22 2 2 2 2 qs (n − 1) 0 1− 2 2 2 2 2 qs (n − 1) 0 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 24 @Copyright 2010
- Ví dụ 4.1. Chọn ngẫu nhiên 27 vòng bi cùng loại thì thấy độ lệch trung bình S=0.003. Theo số liệu quy định thì độ lệch chuẩn cho phép không vượt quá 0.0025. Với mức ý nghĩa 0.05, hãy cho kết luận? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 25 @Copyright 2010
- .Giải : 26.0,0032 n =27,2 (26) = 13,84, 2( 26) = 41,92, 2 = = 37,44 0.975 0.025 qs 0,00252 2 2 2 13,84 qs 41,92 0 Vậy lô vòng bi này chưa vượt mức cho phép về độ phân tán Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 26 @Copyright 2010
- §5. Kiểm định giả thiết về quy luật phân phối. Bài toán:Giả sử đại lượng ngẫu nhiên gốc X của tổng thể chưa rõ phân phối. Từ tổng thể lấy một mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H: có X có phân phối F(x) 1.F(x) là phân phối rời rạc Giả sử bảng phân phối tần số mẫu có dạng X x1 x2 xk n ni n1 n2 k Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 27 @Copyright 2010
- B1:Ký hiệu r là số tham số chưa biết của phân phối F(x),ta thay các tham số đó bằng các ước lượng hợp lý tối đa . 2 B2: Tra (kr−−1) B3: Tính pii= ( X = x), X F( x) , i = 1,2, k B4: Tính giá trị quan sát 2 k 2 (nii− np ) qs = i=1 npi B5: Kết luận: 22 qs (kr − −1) H đúng: X có phân phối F(X) 22 qs (kr − −1) H sai : X không có phân phối F(X) Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 28 @Copyright 2010
- 1. Kiểm định giả thiết về phân phối đều rời rạc H:X có phân phối đều rời rạc B1. r = 0 (do phân phối đều không có tham số chưa biết) B2. 2 (k −1) 1 B3. pi ==, i 1, k k 2 n kk ni − 1 2 B4. 2 k qs= =(n i . k − n) ii==11 n nk k B5. Theo bài toán chung như trên Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 29 @Copyright 2010
- Ví dụ 5.1. Tung 1 con xúc xắc ta được bảng điểm sau đây: Số điểm 1 2 3 4 5 6 Số lần 3 7 6 5 6 4 Với mức ý nghĩa 0.05 ,hãy kết luận con xúc sắc trên có đều hay không? Giải: 1 2 2 2 2 2 =2 (3.6 −+−+− 31) ( 7.6 31) ( 6.6 31) .2 +−+−( 5.6 31) ( 4.6 31) qs 31.6 2 =2,1 0.05 (5) = 11,4 Vậy con xúc xắc đều Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 30 @Copyright 2010
- 2. Kiểm định giả thiết về phân phối Poison. . Ha: ( ) X 0 1 2 k-1 ni n0 n1 n2 nk −1 B1.r =1 (có 1 tham số chưa biết là a), ax= 2 B2. (k − 2) B3. ai p= p( = i) = e−a , i = 0, k − 1 i i! 2 B4. k −1 2 (nii− np ) qs = i=0 npi B5. Như b5 ở bài trên Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 31 @Copyright 2010
- Ví dụ 5.2: Để kiểm tra công việc của 200 công nhân,người ta chọn ngẫu nhiên 1000 sản phẩm của mỗi người đem đi thử nghiệm để tìm ra phế phẩm. Kết quả như sau: Số phế phẩm trên1000 sản phẩm 0 1 2 3 4 Số công nhân 109 65 22 3 1 Với mức ý nghĩa 0.01, có thể coi mẫu trên phù hợp với phân phối Poisson Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 32 @Copyright 2010
- Giải: ax==0,61 0,61i np==200. e−0,61 . , i 0,4 i i! n i i npi 0 109 108,67 1 65 66,29 2 22 20,21 3 3 4,111 4 1 0,627 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 33 @Copyright 2010
- . (109− 108,67)2( 65 − 66,29) 2( 22 − 20,21) 2 2 = + + + qs 108,67 66,29 20,21 (3−− 4,11)22( 1 0,637) + =0,72 2 = 11,34 4,11 0,637 0.01 Vậy mẫu trên phù hợp với phân phối Poison. Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 34 @Copyright 2010
- II. Trường hợp F(x) liên tục: H: F( x) Giả sử bảng phân phối tần số mẫu có dạng: aa, aa, X (aa0, 1 ) ( 12) ( kk−1 ) ni n1 n2 nk B1. r là số tham số chưa biết.Thay các tham số đó bằng các ước lượng hợp lý tối đa của chúng. 2 B2.Tra (kr−−1) B3. Tính pa11= ( − ), p2= ( a 1 a 2 ), , pk−1= ( a k − 2 a k − 1 ) p =1 pa= + Chú ý: i kk( −1 ) i Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 35 @Copyright 2010
- 2 kk2 2 (nii− np ) ni 1 B4. qs = = . − n ii==11npii p n B5. Giống trường hợp F(x) rời rạc. Kiểm định về phân phối chuẩn. H:, N( a 2 ) (aa01, ) (aa12, ) (aakk−1, ) n ni n1 n2 k B1: r=2, a = x , = S = x n Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 36 @Copyright 2010
- 2 B2. (k −3) B3. ax1 − p1 = + 0,5 a21−− x a x p2 = − , , akk−−12−− x a x pk −1 = − axk −1 − pk =0,5 − Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 37 @Copyright 2010
- 2 kk2 B4. 2 (nii− np ) ni 1 qs = = . − n ii==11npii p n B5. kết luận như b5 bài toán chung Ví dụ 5.3 : Bảng điểm của 1 lớp học như sau Số điểm 0-3 3-5 5-7 7-8 8-10 Số học sinh 6 24 43 16 11 Với = 0,05 hãy kết luận bảng này có phù hợp với phân phối chuẩn hay không? x=5,82, = x n = 1,8688 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 38 @Copyright 2010
- Bài giải: 3− 5,82 p1 = +=−0,5( 1,51) +=− 0,5 0,43448 += 0,5 0,06552 1,8688 . 5− 5,82 p2 = +0,43448 = −( 0,44) + 0,43448 1,8688 = −0,17003 + 0,43448 = 0,26445 7− 5,82 p3 = +0,17003 = ( 0,03) + 0,17003 = 0,40568 1,8688 8− 5,82 p4 = −0,23565 = ( 1,17) − 0,23565 = 0,14335 1,8688 p5 =0,5 − ( 1,17) = 0,12 2 2 2 2 2 2 6 24 43 16 11 qs = + + + +:100 − 100 0,06552 0,26445 0,40568 0,14335 0,121 2 =0,707 0.05 (2) = 6 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 39 @Copyright 2010
- §6.Bảng phân phối tần số đồng thời hay bảng tương quan mẫu Giả sử X,Y là 2 đại lượng ngẫu nhiên gốc của cùng 1 tổng thể. Bảng phân phối tần số mẫu đồng thời của X,Y là: Y y1 y X 2 yh ni x1 n11 n12 n1h n1 x n21 n n 2 22 2h n2 xk nk1 nk 2 nkh nk m j n m1 m2 mh Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 40 @Copyright 2010
- y xi i nij x1 y1 n11 x y n 1 2 12 xk yh nkh Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 41 @Copyright 2010
- §7. Kiểm định độc lập. Giả sử X,Y là 2 đại lượng ngẫu nhiên của cùng 1 tổng thể,từ tổng thể lấy 1 mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H:X,Y độc lập 2 B1. (kh−−11)( ) B2. n − 2 ( ij ij ) nmij. qs = ,5ij = i,j ij n n2 2 =− ij 1.n qs nm. ij, ij B3. 22 độc lập qs () ,Y 22 phụ thuộc qs () ,Y Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 42 @Copyright 2010
- Ví dụ.7.1:Nghiên cứu ảnh hưởng của hoàn cảnh gia đình đối với tình trạng phạm tội của trẻ em có kết quả: Tình trạng phạm tội Bố mẹ Bố mẹ Còn cả đã mất ly hôn bố mẹ ni Không phạm tội 20 25 13 58 Có phạm tội 29 43 18 90 49 68 31 148 m j 2 2 2 22 20 25 11 qs = + + + − 1 = 0,32 0,05 (2) = 6 58.49 58.68 90.31 Vậy hoàn cảnh gia đình không ảnh hưởng tới tính trạng phạm tội Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 43 @Copyright 2010