Bài giảng Lý thuyết xác suất và thống kê toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm

pdf 115 trang cucquyet12 5411
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_8_kiem.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm

  1. Chương 8: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ CÁC KHÁI NIỆM KIỂM ĐỊNH THAM SỐ KIỂM ĐỊNH PHI THAM SỐ
  2. Giả thuyết thống kê Tiêu chuẩn kiểm định Miền bác bỏ giả thuyết Quy tắc kiểm định giả thuyết Các sai lầm mắc phải Thủ tục kiểm định giả thuyết CÁC KHÁI NIỆM
  3. CÁC KHÁI NIỆM Giả thuyết thống kê Tiêu chuẩn kiểm định Miền bác bỏ giả thuyết Quy tắc kiểm định giả thuyết Các sai lầm mắc phải Thủ tục kiểm định giả thuyết
  4. Định nghĩa Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập. Giả thuyết thống kê
  5. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập. Giả thuyết thống kê Định nghĩa Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0.
  6. Giả thuyết thống kê Định nghĩa Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập.
  7. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê.
  8. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc.
  9. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó.
  10. Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1,X2,. . . , Xn) và chọn lập thống kê: G = f (X1, X2, , Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, , xn, θ0) Tiêu chuẩn kiểm định
  11. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, , xn, θ0) Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1,X2,. . . , Xn) và chọn lập thống kê: G = f (X1, X2, , Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng.
  12. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, , xn, θ0) Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1,X2,. . . , Xn) và chọn lập thống kê: G = f (X1, X2, , Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết.
  13. Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1,X2,. . . , Xn) và chọn lập thống kê: G = f (X1, X2, , Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, , xn, θ0)
  14. Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết
  15. Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau:
  16. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ.
  17. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ.
  18. Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α
  19. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α.
  20. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định.
  21. Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈ Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ). Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs ∈/ Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1. Quy tắc kiểm định giả thuyết
  22. Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs ∈/ Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1. Quy tắc kiểm định giả thuyết Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈ Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ).
  23. Quy tắc kiểm định giả thuyết Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈ Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ). Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs ∈/ Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1.
  24. Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β Các sai lầm mắc phải
  25. Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau:
  26. Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng
  27. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α.
  28. Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai
  29. Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn bằng α. Nhưng khi G ∈ Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G ∈/ Wα/H1) = β
  30. Các sai lầm mắc phải Trên thực tế sai lầm loại I và loại II luôn mâu thuẫn nhau, tức nếu giảm α sẽ làm tăng β và ngược lại. Để dung hòa mâu thuẫn trên, người ta thường cho trước α, và trong số các miền Wα có thể lựa chọn miền nào có β nhỏ nhất, đó là miền bác bỏ tốt nhất. Vậy miền bác bỏ tốt nhất Wα phải thỏa mãn: P(G ∈ Wα/H0) = α P(G ∈ Wα/H1) = 1 - β max Việc chọn α tùy thuộc vào hậu quả mà sai lầm loại I và loại II mang lại.
  31. Giải Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒ đập nhà đi =⇒ gây tốn kém tiền của. Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒ vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng. Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ. Các sai lầm mắc phải Ví dụ Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm loại I hay loại II nghiêm trọng hơn.
  32. Các sai lầm mắc phải Ví dụ Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm loại I hay loại II nghiêm trọng hơn. Giải Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒ đập nhà đi =⇒ gây tốn kém tiền của. Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒ vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng. Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ.
  33. Xây dựng giả thuyết gốc H0 cần kiểm định. Từ tổng thể lập mẫu ngẫu nhiên kích thước n. Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể. Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα. So sánh Gqs với Wα và kết luận. Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs ∈/ Wα: Thừa nhận H0 và bác bỏ H1. Thủ tục kiểm định giả thuyết
  34. Thủ tục kiểm định giả thuyết Xây dựng giả thuyết gốc H0 cần kiểm định. Từ tổng thể lập mẫu ngẫu nhiên kích thước n. Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể. Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα. So sánh Gqs với Wα và kết luận. Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs ∈/ Wα: Thừa nhận H0 và bác bỏ H1.
  35. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) KIỂM ĐỊNH THAM SỐ
  36. KIỂM ĐỊNH THAM SỐ Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p)
  37. Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2,. . . , Xn). Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2 Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn
  38. Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2 Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2,. . . , Xn).
  39. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2,. . . , Xn). Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2
  40. Chọn tiêu chuẩn kiểm định √ (X¯ − µ ) n G = U = 0 σ Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được xác định như sau: a. H0: µ = µ0;H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ bên phải. (  √ ) X¯ − µ0 n W = U = ; U > u α σ α Trường hợp đã biết phương sai σ2
  41. Trường hợp đã biết phương sai σ2 Chọn tiêu chuẩn kiểm định √ (X¯ − µ ) n G = U = 0 σ Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được xác định như sau: a. H0: µ = µ0;H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ bên phải. (  √ ) X¯ − µ0 n W = U = ; U > u α σ α
  42. c. H0: µ = µ0;H1: µ 6= µ0: Với α, tìm được u1−α/2 và uα/2 sao cho: P(U uα/2) = P(U uα/2) = P(|U| > uα/2) = α Ta thu được miền bác bỏ hai phía: (  √ ) X¯ − µ0 n W = U = ; |U| > u α σ α/2 Trường hợp đã biết phương sai σ2 b. H0: µ = µ0 ;H1: µ < µ0: Với α, tìm được u1−α sao cho P(U<u1−α) = P(U < -uα) = α ta thu được miền bác bỏ bên trái: (  √ ) X¯ − µ0 n W = U = ; U < −u α σ α
  43. Trường hợp đã biết phương sai σ2 b. H0: µ = µ0 ;H1: µ uα/2) = P(U uα/2) = P(|U| > uα/2) = α Ta thu được miền bác bỏ hai phía: (  √ ) X¯ − µ0 n W = U = ; |U| > u α σ α/2
  44. Trường hợp đã biết phương sai σ2 Với mẫu cụ thể w = (x1, x2,. . . , xn) ta tính giá trị quan sát tiêu chuẩn kiểm định. √ (¯x − µ ) n U = 0 qs σ và so sánh với Wα để kết luận: - Nếu Uqs ∈ Wα: Bác bỏ H0, thừa nhận H1 - Nếu Uqs ∈/ Wα: Chưa có cơ sở để bác bỏ H0.
  45. Giải X: Trọng lượng đóng gói sản phẩm X ∼ N(µ, σ2 = 362) Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể. Trường hợp đã biết phương sai σ2 Ví dụ Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết luận các gói sản phẩm bị đóng thiếu hay không.
  46. Trường hợp đã biết phương sai σ2 Ví dụ Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết luận các gói sản phẩm bị đóng thiếu hay không. Giải X: Trọng lượng đóng gói sản phẩm X ∼ N(µ, σ2 = 362) Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể.
  47. Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65) Trường hợp đã biết phương sai σ2 Ví dụ Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453 Miền bác bỏ là: (  √ ) X¯ − µ0 n W = U = ; U < −u α σ α
  48. Trường hợp đã biết phương sai σ2 Ví dụ Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453 Miền bác bỏ là: (  √ ) X¯ − µ0 n W = U = ; U < −u α σ α Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65)
  49. Trường hợp đã biết phương sai σ2 Ví dụ Từ mẫu cụ thể: x¯ = 448 √ (448 − 453) 81 ⇒ U = = −1, 25 ∈/ W qs 36 α Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho chưa có cơ sở để bác bỏ H0, tức là chưa thể nói sản phẩm bị đóng thiếu.
  50. Chọn  √ X¯ − µ0 n G = T = S Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng: a. H0: µ = µ0;H1: µ > µ0 (  √ ) X¯ − µ0 n W = T = ; T > t(n−1) α S α Trường hợp chưa biết phương sai σ2
  51. Trường hợp chưa biết phương sai σ2 Chọn  √ X¯ − µ0 n G = T = S Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng: a. H0: µ = µ0;H1: µ > µ0 (  √ ) X¯ − µ0 n W = T = ; T > t(n−1) α S α
  52. Trường hợp chưa biết phương sai σ2 b. H0: µ = µ0;H1: µ t(n−1) α S α/2
  53. Giải Gọi X là năng suất lúa. X ∼ N(µ, σ2). Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi chưa biết phương sai tổng thể. Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0 Trường hợp chưa biết phương sai σ2 Ví dụ Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5 tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy luật chuẩn.
  54. Trường hợp chưa biết phương sai σ2 Ví dụ Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5 tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy luật chuẩn. Giải Gọi X là năng suất lúa. X ∼ N(µ, σ2). Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi chưa biết phương sai tổng thể. Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0
  55. Trường hợp chưa biết phương sai σ2 Ví dụ Miền bác bỏ (  √ ) X¯ − µ0 n W = T = ; T > t(n−1) α S α (40) α = 0,05; n = 41 ⇒ t0,05 = 1, 684 ⇒ Wα = (1, 684; +∞) Từ mẫu cụ thể có x¯ = 39, 5; s = 1, 2 √ (39, 5 − 39) 41 T = = 2, 667 ∈ W qs 1, 2 α Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho, bác bỏ H0, thừa nhận H1, tức năng suất lúa trung bình đã tăng lên.
  56. Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2) với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng 2 2 2 σ0. Người ta đưa ra giả thuyết: H0: σ = σ0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2,. . . , Xn) và chọn tiêu chuẩn kiểm định: 2 2 (n − 1)S G = χ = 2 σ0 2 2 Nếu H0 đúng thì χ ∼χ (n-1). Do đó với mức ý nghĩa α cho trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây dựng như sau: Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn
  57. Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2) với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng 2 2 2 σ0. Người ta đưa ra giả thuyết: H0: σ = σ0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2,. . . , Xn) và chọn tiêu chuẩn kiểm định: 2 2 (n − 1)S G = χ = 2 σ0 2 2 Nếu H0 đúng thì χ ∼χ (n-1). Do đó với mức ý nghĩa α cho trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây dựng như sau:
  58. Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn 2 2 2 2 a. H0 : σ = σ 0;H1: σ > σ 0.  2  2 (n − 1)S 2 2(n−1) Wα = χ = 2 ; χ > χα σ0 2 2 2 2 b. H0 : σ = σ 0;H1: σ χα/2 σ0
  59. Giải X: kích thước chi tiết. X ∼ N(µ; σ2). Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của biến ngẫu nhiên phân phối chuẩn. 2 2 2 Cặp giả thuyết cần kiểm định là: H0 : σ = σ0 = 12;H1 : σ > 12 Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 = 14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là σ2 = 12.
  60. Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 = 14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là σ2 = 12. Giải X: kích thước chi tiết. X ∼ N(µ; σ2). Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của biến ngẫu nhiên phân phối chuẩn. 2 2 2 Cặp giả thuyết cần kiểm định là: H0 : σ = σ0 = 12;H1 : σ > 12
  61. Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ 2(14) α = 0,01 ⇒ χ0,01 = 29, 14. Miền bác bỏ có dạng  2  2 (n − 1)S 2 2(n−1) Wα = χ = 2 ; χ > χα = (29, 14; +∞). σ0 Với mẫu cụ thể đã cho, ta có giá trị quan sát tiêu chuẩn kiểm định là: 14.14, 6 χ2 = = 17, 033 ∈/ (29, 14; +∞) . qs 12 Vậy chưa có cơ sở để bác bỏ H0, hay có thể nói máy móc vẫn làm việc bình thường.
  62. Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra giả thuyết thống kê: H0 : p = p0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2, ,Xn) Chọn tiêu chuẩn kiểm định: √ (f − p0) n G = U = p p0(1 − p0) Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước, các miền bác bỏ Wα có dạng: Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p)
  63. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra giả thuyết thống kê: H0 : p = p0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1,X2, ,Xn) Chọn tiêu chuẩn kiểm định: √ (f − p0) n G = U = p p0(1 − p0) Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước, các miền bác bỏ Wα có dạng:
  64. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) a. H0: p = p0;H1: p p0 ( √ ) (f − p0) n Wα = U = p ; U > uα p0(1 − p0) c. H0: p = p0;H1: p 6= p0 ( √ ) (f − p0) n Wα = U = p ; |U| > uα/2 p0(1 − p0)
  65. Giải X: Số con trai. X ∼ A(p) Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0 Miền bác bỏ tiêu chuẩn kiểm định có dạng: ( √ ) (f − p0) n Wα = p ; U > uα = (2, 23; +∞) p0(1 − p0) Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080 bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái không? Cho kết luận với mức ý nghĩa 0,01.
  66. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080 bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái không? Cho kết luận với mức ý nghĩa 0,01. Giải X: Số con trai. X ∼ A(p) Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0 Miền bác bỏ tiêu chuẩn kiểm định có dạng: ( √ ) (f − p0) n Wα = p ; U > uα = (2, 23; +∞) p0(1 − p0)
  67. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Từ mẫu cụ thể, ta có: 5080 f = = 0, 508 ; n = 10000 10000 √ (0, 508 − 0, 5) 10000 U = √ ≈ 1, 6 ∈/ (2, 33; +∞) qs 0, 5.0, 5 Vậy chưa có cơ sở để bác bỏ H0, tức là chưa có cơ sở cho rằng tỷ lệ sinh con trai thực sự cao hơn tỷ lệ sinh con gái.
  68. Giả sử có hai tổng thể nghiên cứu, trong đó các biến ngẫu nhiễn 2 2 X1 và X2 phân phối chuẩn: X1 ∼ N(µ1 , σ1);X2 ∼ N(µ2, σ2). Nếu chưa biết µ1 và µ2 song có thể cho rằng chúng bằng nhau thì đưa ra giả thuyết thống kê: H0: µ1 = µ2. Để kiểm định giả thuyết trên, từ hai tổng thể, lập hai mẫu độc lập kích thước n1, n2 W1 = (X11, X12, X1n1 )W2 = (X21, X22, X2n2 ) Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau : 2 2 Trường hợp đã biết các phương sai tổng thể σ1, σ2 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn
  69. Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Giả sử có hai tổng thể nghiên cứu, trong đó các biến ngẫu nhiễn 2 2 X1 và X2 phân phối chuẩn: X1 ∼ N(µ1 , σ1);X2 ∼ N(µ2, σ2). Nếu chưa biết µ1 và µ2 song có thể cho rằng chúng bằng nhau thì đưa ra giả thuyết thống kê: H0: µ1 = µ2. Để kiểm định giả thuyết trên, từ hai tổng thể, lập hai mẫu độc lập kích thước n1, n2 W1 = (X11, X12, X1n1 )W2 = (X21, X22, X2n2 ) Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau : 2 2 Trường hợp đã biết các phương sai tổng thể σ1, σ2 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2
  70. Chọn tiêu chuẩn kiểm định. (X¯ − X¯ ) − (µ − µ ) G = U = 1 2 1 2 q σ2 σ2 1 + 2 n1 n2 Nếu H0 đúng, tiêu chuẩn kiểm định trở thành. (X¯ − X¯ ) G = U = 1 2 ∼ N(0, 1) q σ2 σ2 1 + 2 n1 n2 Do đó các miến bác bỏ mức α có dạng: 2 2 Trường hợp đã biết các phương sai tổng thể σ1, σ2
  71. 2 2 Trường hợp đã biết các phương sai tổng thể σ1, σ2 Chọn tiêu chuẩn kiểm định. (X¯ − X¯ ) − (µ − µ ) G = U = 1 2 1 2 q σ2 σ2 1 + 2 n1 n2 Nếu H0 đúng, tiêu chuẩn kiểm định trở thành. (X¯ − X¯ ) G = U = 1 2 ∼ N(0, 1) q σ2 σ2 1 + 2 n1 n2 Do đó các miến bác bỏ mức α có dạng:
  72. 2 2 Trường hợp đã biết các phương sai tổng thể σ1, σ2 a. H0: µ1 = µ2;H1: µ1> µ2    X¯1 − X¯2  Wα = U = ; U > uα q σ2 σ2  1 + 1  n1 n2 b. H0: µ1= µ2;H1: µ1 uα/2 q σ2 σ2  1 + 1  n1 n2
  73. Chọn tiêu chuẩn kiểm định, nếu H0 đúng: X¯ − X¯ G = U = 1 2 ∼ N(0, 1) q S2 S2 1 + 1 n1 n2 với n1, n2 > 30 Các miền bác bỏ mức α có dạng: 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2
  74. 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 Chọn tiêu chuẩn kiểm định, nếu H0 đúng: X¯ − X¯ G = U = 1 2 ∼ N(0, 1) q S2 S2 1 + 1 n1 n2 với n1, n2 > 30 Các miền bác bỏ mức α có dạng:
  75. 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 a. H0: µ1 = µ2;H1: µ1 µ2    X¯1 − X¯2  Wα = U = ; U > uα q S2 S2  1 + 1  n1 n2 c. H0: µ1 = µ2;H1: µ1 µ2    X¯1 − X¯2  Wα = U = ; |U| > uα/2 q S2 S2  1 + 2  n1 n2
  76. 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 Ví dụ Kết quả thi môn thống kê của hai lớp A và B như sau: Lớp A: n1 = 64; x¯1 = 73, 2; s1 = 10, 9 Lớp B: n2 = 68; x¯2 = 76, 6; s2 = 11, 2 Với mức ý nghĩa 0,05 có thể cho rằng kết quả thi trung bình của lớp B cao hơn lớp A được không, biết rằng kết quả thi phân phối chuẩn.
  77. 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 Ví dụ Gọi X1 và X2 lần lượt là kết quả thi của hai lớp A, B. Ta có: 2 2 X1 ∼ N(µ1, σ1); X2 ∼ N (µ2, σ2) Cặp giả thuyết cần kiểm định: H0:µ1 =µ2;H1: µ1 < µ2 Tiêu chuẩn kiểm định: X¯ − X¯ U = 1 2 q S2 S2 1 + 2 n1 n2
  78. 2 2 Trường hợp chưa biết các phương sai tổng thể σ1, σ2 Ví dụ Do α = 0,05 ⇒uα = u0,05 = 1,65 nên Wα = (∞; - 1,65) Từ mẫu cụ thể đã cho (điểm thi môn thống kê), giá trị quan sát của tiêu chuẩn kiểm định là 73, 2 − 76, 6 Uqs = ≈ −1, 767 ∈ (−∞; −1, 65) q 10,92 11,22 64 + 68 Vậy bác bỏ H0, thừa nhận H1, tức là có thể cho rằng kết quả thi trung bình của lớp B cao hơn lớp A với mức ý nghĩa 0,05.
  79. 2 2 2 2 Giả sử X1 ∼ N(µ1, σ1), X2 ∼ N (µ2, σ2). Nếu chưa biết σ1 và σ2 song có cơ sở để cho rằng giá trị của chúng bằng nhau thì ta đưa ra giả thuyết thống kê: 2 2 H0 : σ1 = σ2 Để kiểm định giả thuyết trên, từ hai tổng thể rút ra hai mẫu ngẫu nhiên độc lập kích thước n1, n2: W1 = (X11, , X1n1 ), W2 = (X21, , X1n2 ) Chọn tiêu chuẩn kiểm định, nếu H0 đúng: 2 S1 G = F = 2 ∼ F (n1 − 1, n2 − 1) S2 Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn
  80. Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn 2 2 2 2 Giả sử X1 ∼ N(µ1, σ1), X2 ∼ N (µ2, σ2). Nếu chưa biết σ1 và σ2 song có cơ sở để cho rằng giá trị của chúng bằng nhau thì ta đưa ra giả thuyết thống kê: 2 2 H0 : σ1 = σ2 Để kiểm định giả thuyết trên, từ hai tổng thể rút ra hai mẫu ngẫu nhiên độc lập kích thước n1, n2: W1 = (X11, , X1n1 ), W2 = (X21, , X1n2 ) Chọn tiêu chuẩn kiểm định, nếu H0 đúng: 2 S1 G = F = 2 ∼ F (n1 − 1, n2 − 1) S2
  81. Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Các miền bác bỏ mức α có dạng: 2 2 2 2 a. H0 : σ1 = σ2 ; H1 : σ1 > σ2  S2  1 (n1 − 1; n2 − 1) Wα = F = 2 ; F > fα S2 2 2 2 2 b. H0 : σ1 = σ2; H1 : σ1 6= σ2  2  S1 (n1−1;n2 −1) (n1−1;n2 −1) Wα = F = 2 ; F fα/2 S2
  82. Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Ví dụ Một giống lúa được gieo cấy ở hai vùng A và B. Khi thu hoạch thử ở mỗi vùng 41 điểm, ta thu được kết quả sau: Vùng A : năng suất trung bình 40tạ/ha; độ lệch chuẩn 1,5 tạ/ha; Vùng B : năng suất trung bình 39,7 tạ/ha; độ lệch chuẩn 1,2 tạ/ha. Với mức ý nghĩa 0,05, có thể cho rằng, độ ổn định về năng suất ở hai vùng là như nhau hay không? Giả sử năng suất lúa phân phối quy luật chuẩn.
  83. Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Ví dụ 2 2 X1,X2: Năng suất lúa vùng A, B: X1 ∼ N(µ, σ1); X2 ∼ N(µ, σ2). 2 2 2 2 Cặp giả thuyết cần kiểm định H0: σ1 = σ2;H1: σ1 6= σ2 Miền bác bỏ tiêu chuẩn kiểm định:  2  S1 (n1−1;n2 −1) (n1−1;n2 −1) Wα = F = 2 ; F fα/2 S2 Do α = 0,05 nên 1 1 f (40;40) = 1, 88; f (40;40) = = = 0, 53 0,025 0,975 (40;40) 1, 88 f0,025
  84. Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Ví dụ Miền bác bỏWαcó dạng: Wα = (-∞; 0,53) ∪(1,88; +∞) Với mẫu cụ thể: s1 = 1,5; s2 = 1,2, ta có giá trị cụ thể của tiêu chuẩn kiểm định là: 1, 52 F = = 1, 3625 ∈/ W qs 1, 22 α Kết luận: Chưa có cơ sở để bác bỏ H0, tức là có thể cho rằng năng suất lúa ở hai vùng ổn định như nhau.
  85. Giả sử X1 ∼ A(p1); X2 ∼ A(p2). Nếu chưa biết p1, p2 song có thể cho rằng chúng bằng nhau thì đưa ra giả thuyết thống kê: H0: p1 = p2. Để kiểm định giả thuyết trên, từ hai tổng thể lập hai mẫu độc lập kích thước n1, n2. W1 = (X11, , X1n1 ) → f1; W1 = (X21, , X2n2 ) → f2 Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p)
  86. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Giả sử X1 ∼ A(p1); X2 ∼ A(p2). Nếu chưa biết p1, p2 song có thể cho rằng chúng bằng nhau thì đưa ra giả thuyết thống kê: H0: p1 = p2. Để kiểm định giả thuyết trên, từ hai tổng thể lập hai mẫu độc lập kích thước n1, n2. W1 = (X11, , X1n1 ) → f1; W1 = (X21, , X2n2 ) → f2
  87. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Chọn tiêu chuẩn kiểm định: f − f G = U = 1 2 ∼ N(0, 1) r   f¯ 1 − f¯ 1 + 1 n1 n2 trong đó n f + n f f¯ = 1 1 2 2 n1 + n2 Khi đó các miền bác bỏ mức α có dạng:
  88. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) a. H0: p1 = p2;H1: p1 p2      f − f  W = U = 1 2 ; U > u α r   α  f¯ 1 − f¯ 1 + 1   n1 n2 
  89. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) c. H0: p1 = p2;H1: p1 6= p2      f − f  W = U = 1 2 ; |U| > u α r   α/2  f¯ 1 − f¯ 1 + 1   n1 n2 
  90. Giải Gọi H là biến cố “Khỏi bệnh khi dùng thuốc H” và K là biến cố “Khỏi bệnh khi dùng thuốc K”. P(H) = p1, P(K) = p2 lần lượt là tỷ lệ khỏi bệnh khi dùng thuốc H và K. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Ví dụ Bệnh A có thể được chữa khỏi bằng 2 loại thuốc H và K. Người ta dùng thử thuốc H cho 250 bệnh nhân thấy 210 người khỏi bệnh và dùng thử thuốc K cho 200 bệnh nhân thấy 170 người khỏi bệnh. Có thể cho rằng hiệu quả chữa bệnh của thuốc K là cao hơn thuốc H không với mức ý nghĩa 0,05.
  91. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Ví dụ Bệnh A có thể được chữa khỏi bằng 2 loại thuốc H và K. Người ta dùng thử thuốc H cho 250 bệnh nhân thấy 210 người khỏi bệnh và dùng thử thuốc K cho 200 bệnh nhân thấy 170 người khỏi bệnh. Có thể cho rằng hiệu quả chữa bệnh của thuốc K là cao hơn thuốc H không với mức ý nghĩa 0,05. Giải Gọi H là biến cố “Khỏi bệnh khi dùng thuốc H” và K là biến cố “Khỏi bệnh khi dùng thuốc K”. P(H) = p1, P(K) = p2 lần lượt là tỷ lệ khỏi bệnh khi dùng thuốc H và K.
  92. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Ví dụ Theo yêu cầu bài toán, ta phải kiểm định cặp giả thuyết sau: H0: p1 = p2;H1: p1 < p2 Miền bác bỏ để kiểm định cặp giả thuyết trên là:      f − f  W = U = 1 2 ; U < − u α r   α  f¯ 1 − f¯ 1 + 1   n1 n2 
  93. Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Ví dụ Tính toán: n1 = 250; m1 = 210 ⇒ f1 = 0, 84; n2 = 200; m2 = 170 ⇒ f2 = 0, 875 0, 84 − 0, 875 Uqs = = −1, 049 q 38 38  1 1  45 1 − 45 250 + 200 −uα = −u0,05 = −1, 645 ⇒ uqs > −uα ⇒ uqs ∈/ Wα Vậy chưa có cơ sở để kết luận rằng hiệu quả chữa bệnh của thuốc K là cao hơn thuốc H.
  94. Kiểm định về sự độc lập của hai dấu hiệu định tính Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên KIỂM ĐỊNH PHI THAM SỐ
  95. KIỂM ĐỊNH PHI THAM SỐ Kiểm định về sự độc lập của hai dấu hiệu định tính Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên
  96. Xét 2 biến (chỉ tiêu) định tính - không đo đếm được A và B. Ví dụ. A – Màu tóc và B – Màu mắt; A – Phương pháp chữa bệnh và B – Kết quả chữa bệnh; A – Mẫu mã hàng hóa và B – Sở thích của khách hàng Bài toán đặt ra là kiểm định cặp giả thuyết: H0: A và B độc lập; H1: A và B phụ thuộc. Kiểm định về sự độc lập của hai dấu hiệu định tính
  97. Kiểm định về sự độc lập của hai dấu hiệu định tính Xét 2 biến (chỉ tiêu) định tính - không đo đếm được A và B. Ví dụ. A – Màu tóc và B – Màu mắt; A – Phương pháp chữa bệnh và B – Kết quả chữa bệnh; A – Mẫu mã hàng hóa và B – Sở thích của khách hàng Bài toán đặt ra là kiểm định cặp giả thuyết: H0: A và B độc lập; H1: A và B phụ thuộc.
  98. Kiểm định về sự độc lập của hai dấu hiệu định tính Chọn mẫu ngẫu nhiên W1 = (A1, ,Ak );W2 = (B1, ,Bl ) và thống kê số liệu theo bảng sau: BA A1 Ai Ak B1 . . Bj . . . nij nj . Bl . ni trong đó nij là số phần tử mang hai dấu hiệu A và B.
  99. Kiểm định về sự độc lập của hai dấu hiệu định tính Miền bác bỏ để kiểm định giả thuyết có dạng :      2 X nij 2 2(k−1)(l−1) Wα = χ = n  − 1 ; χ > χα ni nj  i,j 
  100. Kiểm định về sự độc lập của hai dấu hiệu định tính Ví dụ Trên cơ sở điều tra 400 người về màu mắt và màu tóc, ta được bảng số liệu sau: Tóc Mắt Hung Nâu Đen Đen 12 65 121 Nâu 38 59 105 Có thể cho rằng màu mắt và màu tóc không có gì liên quan với nhau không? Cho kết luận với mức ý nghĩa 5%.
  101. Kiểm định về sự độc lập của hai dấu hiệu định tính Ví dụ A = (Màu tóc), A có k = 3 phạm trù; B = (Màu mắt), B có l = 2 phạm trù. Ta phải kiểm định cặp giả thuyết: H0: A và B độc lập; H1: A và B phụ thuộc. Miền bác bỏ để kiểm định cặp giả thuyết là :     n2  2 X ij 2 2(k−1)(l−1) Wα = χ = n  − 1 ; χ > χα ni nj  i,j 
  102. Kiểm định về sự độc lập của hai dấu hiệu định tính Ví dụ Tính giá trị quan sát bằng cách lập bảng tính sau: Tóc Mắt Hung Nâu Đen 122 652 1212 Đen 12 198.50 65 198.124 121 198.226 198 382 592 1052 Nâu 38 202.50 59 202.124 105 202.226 202 50 124 226 400 Ta có: χqs = 400(1, 0373 − 1) = 14, 9046 2(k−1)(l−1) 2(2) 2 2(2) 2 Tra bảng: χα = χ0,05 = 5, 99; χqs > χ0,05 ⇒ χqs ∈ Wα. Vậy bác bỏ H0, tức là A và B phụ thuộc.
  103. Giả sử chưa biết quy luật phân phối xác suất của biến ngẫu nhiên gốc X trong tổng thể, xong có cơ sở để giả thiết rằng X phân phối theo quy luật A nào đó, ta đưa ra cặp giả thuyết thống kê : H0 : X phân phối theo quy luật A H1 : X không phân phối theo quy luật A Để kiểm định cặp giả thuyết trên, ta xét các trường hợp sau: X là biến ngẫu nhiên rời rạc X là biến ngẫu nhiên liên tục Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên
  104. Để kiểm định cặp giả thuyết trên, ta xét các trường hợp sau: X là biến ngẫu nhiên rời rạc X là biến ngẫu nhiên liên tục Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên Giả sử chưa biết quy luật phân phối xác suất của biến ngẫu nhiên gốc X trong tổng thể, xong có cơ sở để giả thiết rằng X phân phối theo quy luật A nào đó, ta đưa ra cặp giả thuyết thống kê : H0 : X phân phối theo quy luật A H1 : X không phân phối theo quy luật A
  105. Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên Giả sử chưa biết quy luật phân phối xác suất của biến ngẫu nhiên gốc X trong tổng thể, xong có cơ sở để giả thiết rằng X phân phối theo quy luật A nào đó, ta đưa ra cặp giả thuyết thống kê : H0 : X phân phối theo quy luật A H1 : X không phân phối theo quy luật A Để kiểm định cặp giả thuyết trên, ta xét các trường hợp sau: X là biến ngẫu nhiên rời rạc X là biến ngẫu nhiên liên tục
  106. Từ tổng thể rút ra một mẫu kích thước n trong đó biến ngẫu nhiên X có bảng phân phối tần số thực nghiệm sau: xi x1 x2 . . . xk ni n1 n2 . . . nk Pk trong đó i=1 ni = n. Nếu giả thuyết H0 là đúng thì có thể tính được các xác suất lý thuyết: pi = P(X=xi ), i=1,. . . ,k 0 Từ đó tần số lý thuyết của phân phối xác suất là ni = npi và bảng phân phối tần số lý thuyết có dạng xi x1 x2 . . . xk 0 0 0 0 ni n1 n2 nk trong đó Pk n0 = n. i=1 i X là biến ngẫu nhiên rời rạc
  107. X là biến ngẫu nhiên rời rạc Từ tổng thể rút ra một mẫu kích thước n trong đó biến ngẫu nhiên X có bảng phân phối tần số thực nghiệm sau: xi x1 x2 . . . xk ni n1 n2 . . . nk Pk trong đó i=1 ni = n. Nếu giả thuyết H0 là đúng thì có thể tính được các xác suất lý thuyết: pi = P(X=xi ), i=1,. . . ,k 0 Từ đó tần số lý thuyết của phân phối xác suất là ni = npi và bảng phân phối tần số lý thuyết có dạng xi x1 x2 . . . xk 0 0 0 0 ni n1 n2 nk trong đó Pk n0 = n. i=1 i
  108. X là biến ngẫu nhiên rời rạc Khi đó tiêu chuẩn kiểm định có dạng: k 0 2 X (ni − n ) G = χ2 = i n0 i=1 i Biến ngẫu nhiên phân phối khi bình phương với (k-r-1) bậc tự do trong đó r là tham số phụ thuộc vào tiêu chuẩn cần kiểm định. Với mức ý nghĩa α cho trước miền bác bỏ Wα có dạng ( k 0 2 ) 2 X (ni − ni ) 2 2(k−r−1) Wα = χ = ; χ > χ n0 α i=1 i
  109. X là biến ngẫu nhiên rời rạc Với một mẫu cụ thể tính được giá trị quan sát của χ2 và so sánh với miền bác bỏ Wα để kết luận: 2 Nếu χqs ∈ Wα thì bác bỏ giả thuyết về dạng phân phối A của biến ngẫu nhiên X. 2 Nếu χqs ∈/ Wα thì chưa có cơ sở bác bỏ giả thuyết về dạng phân phối A của biến ngẫu nhiên X.
  110. Giải Cặp giả thuyết thống kê là : H0 : X phân phối theo quy luật Poisson; H1: X không phân phối theo quy luật Poisson. Từ mẫu trên tính được x¯ = 2 là ước lượng hợp lý tối đa của λ trong phân phối Poisson. X là biến ngẫu nhiên rời rạc Ví dụ Số lời gọi đến một trạm điện thoại (X) trong một phút được cho trong bảng sau : Số lời gọi xi 0 1 2 3 4 5 ≥ 6 Số phút tương ứng ni 17 22 26 20 11 2 2 Với mức ý nghĩa có thể coi X phân phối theo quy luật Poisson được không?
  111. X là biến ngẫu nhiên rời rạc Ví dụ Số lời gọi đến một trạm điện thoại (X) trong một phút được cho trong bảng sau : Số lời gọi xi 0 1 2 3 4 5 ≥ 6 Số phút tương ứng ni 17 22 26 20 11 2 2 Với mức ý nghĩa có thể coi X phân phối theo quy luật Poisson được không? Giải Cặp giả thuyết thống kê là : H0 : X phân phối theo quy luật Poisson; H1: X không phân phối theo quy luật Poisson. Từ mẫu trên tính được x¯ = 2 là ước lượng hợp lý tối đa của λ trong phân phối Poisson.
  112. X là biến ngẫu nhiên rời rạc Ví dụ Để tính giá trị quan sát χ2 ta lập bảng tính toán sau : 0 −2 x 0 2 e 2 i (ni −ni ) xi ni pi = n = npi 0 xi ! i ni 0 17 0,1353 13,53 0,89 1 22 0,2707 27,07 0,95 2 26 0,2707 27,07 0,04 3 20 0,1804 18,04 0,21 4 11 0,0902 9,02 0,43 5 2 0,0361 3,61 0,72 ≥ 6 2 0,0166 1,66 0,07 n =100 P = 1 χ2=3,31
  113. X là biến ngẫu nhiên rời rạc Ví dụ 2(7−1−1) 2(7−1−1) Do α = 0, 01 → χα = χ0,01 = 15, 1. Vậy miền bác bỏ là (15, 1 ; +∞). 2 χqs ∈/ Wα nên chưa có cơ sở bác bỏ H0 hay có thể coi X phân phối theo quy luật Poisson với λ = 2.
  114. Từ tổng thể rút ra một mẫu kích thước n và giả sử các số liệu mẫu được ghép lớp như sau : xi−1 - xi x0 - x1 x1- x2 . . . xk−1 - xk ni n1 n2 . . . nk Lúc đó các xác suất lý thuyết pi chính là xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng (xi−1; xi ) nếu giả thuyết H0 là đúng: pi = P(xi−1 < X < xi ) 0 còn các tần số lý thuyết vẫn được tính bằng công thức: ni = npi . Từ đó thủ tục kiểm định vẫn giống như phần trước. X là biến ngẫu nhiên liên tục
  115. X là biến ngẫu nhiên liên tục Từ tổng thể rút ra một mẫu kích thước n và giả sử các số liệu mẫu được ghép lớp như sau : xi−1 - xi x0 - x1 x1- x2 . . . xk−1 - xk ni n1 n2 . . . nk Lúc đó các xác suất lý thuyết pi chính là xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng (xi−1; xi ) nếu giả thuyết H0 là đúng: pi = P(xi−1 < X < xi ) 0 còn các tần số lý thuyết vẫn được tính bằng công thức: ni = npi . Từ đó thủ tục kiểm định vẫn giống như phần trước.