Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Cơ sở lý thuyết mẫu - Phạm Thị Hồng Thắm

pdf 132 trang cucquyet12 6461
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Cơ sở lý thuyết mẫu - Phạm Thị Hồng Thắm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_6_co_so.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Cơ sở lý thuyết mẫu - Phạm Thị Hồng Thắm

  1. Chương 6: CƠ SỞ LÝ THUYẾT MẪU TỔNG THỂ MẪU NGẪU NHIÊN THỐNG KÊ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ ĐẶC TRƯNG MẪU SUY DIỄN THỐNG KÊ
  2. Định nghĩa Các phương pháp mô tả tổng thể Các tham số đặc trưng tổng thể TỔNG THỂ
  3. TỔNG THỂ Định nghĩa Các phương pháp mô tả tổng thể Các tham số đặc trưng tổng thể
  4. Ví dụ Nghiên cứu tập hợp các khách hàng của 1 doanh nghiệp theo dấu hiệu định tính - mức độ hài lòng về sản phẩm; định lượng - nhu cầu về số lượng sản phẩm. Nghiên cứu tập hợp học sinh của 1 lớp: định tính - học lực; định lượng - chiều cao/ cân nặng. TỔNG THỂ Định nghĩa Tổng thể nghiên cứu là một tập hợp gồm các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hay định lượng.
  5. TỔNG THỂ Định nghĩa Tổng thể nghiên cứu là một tập hợp gồm các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hay định lượng. Ví dụ Nghiên cứu tập hợp các khách hàng của 1 doanh nghiệp theo dấu hiệu định tính - mức độ hài lòng về sản phẩm; định lượng - nhu cầu về số lượng sản phẩm. Nghiên cứu tập hợp học sinh của 1 lớp: định tính - học lực; định lượng - chiều cao/ cân nặng.
  6. Bảng phân phối tần số của tổng thể Bảng phân phối tần suất của tổng thể Các phương pháp mô tả tổng thể
  7. Các phương pháp mô tả tổng thể Bảng phân phối tần số của tổng thể Bảng phân phối tần suất của tổng thể
  8. Ví dụ Tổng thể nghiên cứu là 1 lớp 50 học sinh với dấu hiệu nghiên cứu là điểm thi học phần môn xác suất thống kê. Trong đó có 5 em được 1; 7 em được 3; 20 em được 5; 10 em được 7 và 8 em được 10. Các phương pháp mô tả tổng thể Giả sử trong tổng thể, dấu hiệu nghiên cứu X nhận các giá trị x1, Pn x2,. . . xn với các tần số tương ứng N1,N2,. . . Nn; i=1Ni = N - số phần tử của tổng thể - kích thước tổng thể.
  9. Các phương pháp mô tả tổng thể Giả sử trong tổng thể, dấu hiệu nghiên cứu X nhận các giá trị x1, Pn x2,. . . xn với các tần số tương ứng N1,N2,. . . Nn; i=1Ni = N - số phần tử của tổng thể - kích thước tổng thể. Ví dụ Tổng thể nghiên cứu là 1 lớp 50 học sinh với dấu hiệu nghiên cứu là điểm thi học phần môn xác suất thống kê. Trong đó có 5 em được 1; 7 em được 3; 20 em được 5; 10 em được 7 và 8 em được 10.
  10. Bảng phân phối tần số của tổng thể X x1 x2 . . . xn N1 N2 Nn X 1 3 5 7 10 5 7 20 10 8
  11. Bảng phân phối tần suất của tổng thể Ni Đặt pi = N X x1 x2 . . . xn p1 p2 . . . pn Pn trong đó, i=1 pi = 1; 0 ≤ pi ≤ 1 X 1 3 5 7 10 0,1 0,14 0,4 0,2 0,16
  12. Các phương pháp mô tả tổng thể Nhận xét. Nếu lấy ngẫu nhiên 1 phần tử từ tổng thể, pi chính là xác suất để dấu hiệu nghiên cứu của phần tử đó nhận giá trị xi . Tần số tích lũy của giá trị x : w = P N i i x<xi j Tần suất tích lũy của giá trị x : F (x ) = P p i i x<xi j Việc mô tả dấu hiệu X trên một tổng thể bằng các phương pháp trên cho phép chúng ta có thể coi dấu hiệu X như 1 biến ngẫu nhiên.
  13. Các tham số đặc trưng tổng thể Trung bình tổng thể Phương sai tổng thể Tần suất tổng thể
  14. Trung bình tổng thể Là trung bình số học của các giá trị của dấu hiệu trong tổng thể với các ký hiệu ở phần 2. n n 1 X X m = x N = x p N i i i i i=1 i=1
  15. Phương sai tổng thể Là trung bình số học của bình phương các sai lệch giữa các giá trị của các dấu hiệu trong tổng thể và trung bình tổng thể. n n 1 X 1 X σ2 = N (x − m)2 = N x2 − m2 N i i N i i i=1 i=1
  16. Tần suất tổng thể Tổng thể kích thước N, trong đó có M phần tử mang dấu hiệu nghiên cứu, N - M phần tử còn lại không mang dấu hiệu đó. Khi đó tần suất tổng thể: M p = N Chú ý. Ta thấy p chính là xác suất để lấy ngẫu nhiên một phần tử thì phần tử đó mang dấu hiệu nghiên cứu. Như vậy ta có thể xem dấu hiệu nghiên cứu như biến ngẫu nhiên phân phối theo quy luật không - một với kì vọng toán p
  17. Nhận xét. Do có thể đặc trưng dấu hiệu nghiên cứu của tổng thể bằng một biến ngẫu nhiên X nên các tham số đặc trưng tổng thể cũng là các tham số của biến ngẫu nhiên X, cụ thể: Trung bình tổng thể là kì vọng toán của X; Phương sai tổng thể là phương sai của X; Tần suất tổng thể p là kì vọng toán của biến ngẫu nhiên X phân phối không – một; Các tham số còn lại như mốt, trung vị, hệ số biến thiên. . . cũng đều là tham số đặc trưng của X
  18. Cơ sở lý thuyết mẫu Mẫu ngẫu nhiên Các phương pháp mô tả số liệu mẫu MẪU NGẪU NHIÊN
  19. MẪU NGẪU NHIÊN Cơ sở lý thuyết mẫu Mẫu ngẫu nhiên Các phương pháp mô tả số liệu mẫu
  20. Để tìm các tham số đặc trưng của tổng thể, ta có thể dùng phương pháp điều tra toàn bộ, tức là thống kê toàn bộ tổng thể theo các dấu hiệu rồi phân tích từng phần tử của nó. Ví dụ. - Tổng điều tra dân số của 1 nước: Tuổi tác, trình độ văn hóa. - Kiểm tra chất lượng sản phẩm của 1 dây truyền sản xuất. Cơ sở lý thuyết mẫu
  21. Ví dụ. - Tổng điều tra dân số của 1 nước: Tuổi tác, trình độ văn hóa. - Kiểm tra chất lượng sản phẩm của 1 dây truyền sản xuất. Cơ sở lý thuyết mẫu Để tìm các tham số đặc trưng của tổng thể, ta có thể dùng phương pháp điều tra toàn bộ, tức là thống kê toàn bộ tổng thể theo các dấu hiệu rồi phân tích từng phần tử của nó.
  22. Cơ sở lý thuyết mẫu Để tìm các tham số đặc trưng của tổng thể, ta có thể dùng phương pháp điều tra toàn bộ, tức là thống kê toàn bộ tổng thể theo các dấu hiệu rồi phân tích từng phần tử của nó. Ví dụ. - Tổng điều tra dân số của 1 nước: Tuổi tác, trình độ văn hóa. - Kiểm tra chất lượng sản phẩm của 1 dây truyền sản xuất.
  23. Kích thước tổng thể quá lớn gây ra: Tốn kém về vật chất và thời gian Có thể tính trùng hoặc bỏ sót Có sự sai sót trong quá trình điều tra → hạn chế độ chính xác. Có trường hợp các đơn vị điều tra bị phá hủy ngay trong quá trình điều tra (kiểm tra đồ hộp - bật nắp) → nghiên cứu toàn bộ sẽ vô nghĩa. Trong nhiều trường hợp không thể có được danh sách tổng thể (kiểm tra tất cả những người nghiện ma túy hoặc phạm tội. . . ). Vì vậy, trong thực tế người ta thường dùng phương pháp mẫu, tức là từ tổng thể rút ra một mẫu, trên cơ sở phân tích mẫu sẽ đưa ra kết luận về tổng thể. Cơ sở lý thuyết mẫu Tuy nhiên phương pháp này rất ít được sử dụng trong thực tế vì nhiều hạn chế:
  24. Có trường hợp các đơn vị điều tra bị phá hủy ngay trong quá trình điều tra (kiểm tra đồ hộp - bật nắp) → nghiên cứu toàn bộ sẽ vô nghĩa. Trong nhiều trường hợp không thể có được danh sách tổng thể (kiểm tra tất cả những người nghiện ma túy hoặc phạm tội. . . ). Vì vậy, trong thực tế người ta thường dùng phương pháp mẫu, tức là từ tổng thể rút ra một mẫu, trên cơ sở phân tích mẫu sẽ đưa ra kết luận về tổng thể. Cơ sở lý thuyết mẫu Tuy nhiên phương pháp này rất ít được sử dụng trong thực tế vì nhiều hạn chế: Kích thước tổng thể quá lớn gây ra: Tốn kém về vật chất và thời gian Có thể tính trùng hoặc bỏ sót Có sự sai sót trong quá trình điều tra → hạn chế độ chính xác.
  25. Trong nhiều trường hợp không thể có được danh sách tổng thể (kiểm tra tất cả những người nghiện ma túy hoặc phạm tội. . . ). Vì vậy, trong thực tế người ta thường dùng phương pháp mẫu, tức là từ tổng thể rút ra một mẫu, trên cơ sở phân tích mẫu sẽ đưa ra kết luận về tổng thể. Cơ sở lý thuyết mẫu Tuy nhiên phương pháp này rất ít được sử dụng trong thực tế vì nhiều hạn chế: Kích thước tổng thể quá lớn gây ra: Tốn kém về vật chất và thời gian Có thể tính trùng hoặc bỏ sót Có sự sai sót trong quá trình điều tra → hạn chế độ chính xác. Có trường hợp các đơn vị điều tra bị phá hủy ngay trong quá trình điều tra (kiểm tra đồ hộp - bật nắp) → nghiên cứu toàn bộ sẽ vô nghĩa.
  26. Vì vậy, trong thực tế người ta thường dùng phương pháp mẫu, tức là từ tổng thể rút ra một mẫu, trên cơ sở phân tích mẫu sẽ đưa ra kết luận về tổng thể. Cơ sở lý thuyết mẫu Tuy nhiên phương pháp này rất ít được sử dụng trong thực tế vì nhiều hạn chế: Kích thước tổng thể quá lớn gây ra: Tốn kém về vật chất và thời gian Có thể tính trùng hoặc bỏ sót Có sự sai sót trong quá trình điều tra → hạn chế độ chính xác. Có trường hợp các đơn vị điều tra bị phá hủy ngay trong quá trình điều tra (kiểm tra đồ hộp - bật nắp) → nghiên cứu toàn bộ sẽ vô nghĩa. Trong nhiều trường hợp không thể có được danh sách tổng thể (kiểm tra tất cả những người nghiện ma túy hoặc phạm tội. . . ).
  27. Cơ sở lý thuyết mẫu Tuy nhiên phương pháp này rất ít được sử dụng trong thực tế vì nhiều hạn chế: Kích thước tổng thể quá lớn gây ra: Tốn kém về vật chất và thời gian Có thể tính trùng hoặc bỏ sót Có sự sai sót trong quá trình điều tra → hạn chế độ chính xác. Có trường hợp các đơn vị điều tra bị phá hủy ngay trong quá trình điều tra (kiểm tra đồ hộp - bật nắp) → nghiên cứu toàn bộ sẽ vô nghĩa. Trong nhiều trường hợp không thể có được danh sách tổng thể (kiểm tra tất cả những người nghiện ma túy hoặc phạm tội. . . ). Vì vậy, trong thực tế người ta thường dùng phương pháp mẫu, tức là từ tổng thể rút ra một mẫu, trên cơ sở phân tích mẫu sẽ đưa ra kết luận về tổng thể.
  28. Từ tổng thể rút ra một mẫu kích thước n. Xác định các tham số đặc trưng của mẫu. Xác định quy luật phân phối xác suất của các tham số đặc trưng mẫu. Từ các tham số của mẫu đưa ra kết luận. Cơ sở lý thuyết mẫu Phương pháp mẫu bao gồm các nội dung sau:
  29. Xác định các tham số đặc trưng của mẫu. Xác định quy luật phân phối xác suất của các tham số đặc trưng mẫu. Từ các tham số của mẫu đưa ra kết luận. Cơ sở lý thuyết mẫu Phương pháp mẫu bao gồm các nội dung sau: Từ tổng thể rút ra một mẫu kích thước n.
  30. Xác định quy luật phân phối xác suất của các tham số đặc trưng mẫu. Từ các tham số của mẫu đưa ra kết luận. Cơ sở lý thuyết mẫu Phương pháp mẫu bao gồm các nội dung sau: Từ tổng thể rút ra một mẫu kích thước n. Xác định các tham số đặc trưng của mẫu.
  31. Từ các tham số của mẫu đưa ra kết luận. Cơ sở lý thuyết mẫu Phương pháp mẫu bao gồm các nội dung sau: Từ tổng thể rút ra một mẫu kích thước n. Xác định các tham số đặc trưng của mẫu. Xác định quy luật phân phối xác suất của các tham số đặc trưng mẫu.
  32. Cơ sở lý thuyết mẫu Phương pháp mẫu bao gồm các nội dung sau: Từ tổng thể rút ra một mẫu kích thước n. Xác định các tham số đặc trưng của mẫu. Xác định quy luật phân phối xác suất của các tham số đặc trưng mẫu. Từ các tham số của mẫu đưa ra kết luận.
  33. Gieo con xúc xắc 3 lần và gọi Xi là số chấm xuất hiện ở lần gieo thứ i. Ta có 3 biến ngẫu nhiên X1,X2,X3 độc lập, cùng phân phối xác suất với X. Ta nói ta có mẫu ngẫu nhiên kích thước 3: W =(X1,X2,X3). Nếu thực hiện việc gieo con xúc xắc 3 lần, ta được bộ 3 số, chẳng hạn w = (1, 3, 6), gọi là mẫu cụ thể. Mẫu ngẫu nhiên Ví dụ Gọi X là số chấm thu được khi gieo một xúc xắc → X là biến ngẫu nhiên với bảng phân phối xác suất : X 1 2 3 4 5 6 P 1/6 1/6 1/6 1/6 1/6 1/6
  34. Nếu thực hiện việc gieo con xúc xắc 3 lần, ta được bộ 3 số, chẳng hạn w = (1, 3, 6), gọi là mẫu cụ thể. Mẫu ngẫu nhiên Ví dụ Gọi X là số chấm thu được khi gieo một xúc xắc → X là biến ngẫu nhiên với bảng phân phối xác suất : X 1 2 3 4 5 6 P 1/6 1/6 1/6 1/6 1/6 1/6 Gieo con xúc xắc 3 lần và gọi Xi là số chấm xuất hiện ở lần gieo thứ i. Ta có 3 biến ngẫu nhiên X1,X2,X3 độc lập, cùng phân phối xác suất với X. Ta nói ta có mẫu ngẫu nhiên kích thước 3: W =(X1,X2,X3).
  35. Mẫu ngẫu nhiên Ví dụ Gọi X là số chấm thu được khi gieo một xúc xắc → X là biến ngẫu nhiên với bảng phân phối xác suất : X 1 2 3 4 5 6 P 1/6 1/6 1/6 1/6 1/6 1/6 Gieo con xúc xắc 3 lần và gọi Xi là số chấm xuất hiện ở lần gieo thứ i. Ta có 3 biến ngẫu nhiên X1,X2,X3 độc lập, cùng phân phối xác suất với X. Ta nói ta có mẫu ngẫu nhiên kích thước 3: W =(X1,X2,X3). Nếu thực hiện việc gieo con xúc xắc 3 lần, ta được bộ 3 số, chẳng hạn w = (1, 3, 6), gọi là mẫu cụ thể.
  36. + Ký hiệu mẫu ngẫu nhiên : W = (X1,X2, ,Xn). + Nếu tiến hành 1 phép thử đối với mẫu ngẫu nhiên, ta thu được mẫu cụ thể: w = (x1, x2, xn). Mẫu ngẫu nhiên Định nghĩa Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X1,X2,. . . , Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùng quy luật phân phối xác suất với X.
  37. + Nếu tiến hành 1 phép thử đối với mẫu ngẫu nhiên, ta thu được mẫu cụ thể: w = (x1, x2, xn). Mẫu ngẫu nhiên Định nghĩa Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X1,X2,. . . , Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùng quy luật phân phối xác suất với X. + Ký hiệu mẫu ngẫu nhiên : W = (X1,X2, ,Xn).
  38. Mẫu ngẫu nhiên Định nghĩa Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X1,X2,. . . , Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùng quy luật phân phối xác suất với X. + Ký hiệu mẫu ngẫu nhiên : W = (X1,X2, ,Xn). + Nếu tiến hành 1 phép thử đối với mẫu ngẫu nhiên, ta thu được mẫu cụ thể: w = (x1, x2, xn).
  39. 2 X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. X1: Năng suất giống lúa đó trên thửa 1,
  40. 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ).
  41. 2 X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). X2: Năng suất giống lúa đó trên thửa 2,
  42. 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ).
  43. 2 Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). Xn: Năng suất giống lúa đó trên thửa n,
  44. Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ )
  45. Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi . Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2)
  46. Mẫu ngẫu nhiên Ví dụ Gọi X là năng suất một giống lúa, giả sử X ∼ N(µ, σ2)(µ là năng suất trung bình, σ2 là độ biến động về năng suất (độ ổn định)). Trồng thử loại lúa này trên n thửa ruộng n phép thử. 2 X1: Năng suất giống lúa đó trên thửa 1, X1 ∼ N(µ, σ ). 2 X2: Năng suất giống lúa đó trên thửa 2, X2 ∼ N(µ, σ ). 2 Xn: Năng suất giống lúa đó trên thửa n, Xn ∼ N(µ, σ ) Tập hợp (X1,X2,. . . , Xn) gọi là mẫu ngẫu nhiên kích thước n được lấy ra từ tổng thể có phân phối chuẩn N (µ, σ2) Giả sử đã trồng thật và đã thu hoạch → thu được tập n số cụ thể (x1, x2,. . . xn) trong đó xi là năng suất thực thu trên thửa thứ i, chính là 1 giá trị của Xi .
  47. Các phương pháp mô tả số liệu mẫu Giả sử từ tổng thể với biến ngẫu nhiên gốc X, rút ra một mẫu cụ thể kích thước n, w = (x1, x2,. . . xn) trong đó các giá trị x1, Pk x2,. . . xk xuất hiện với tần số tương ứng n1,. . . , nk , i=1 ni = n. Lúc đó ta có thể mô tả số liệu mẫu bằng các phương pháp: Bảng phân phối tần số thực nghiệm Bảng phân phối tần suất thực nghiệm Bảng phân phối tần số thực nghiệm Bảng phương pháp tần số ghép lớp Đồ thị
  48. Bảng phân phối tần số thực nghiệm xi x1 x2 . . . xk n1 n2 . . . nk
  49. Bảng phân phối tần suất thực nghiệm Đặt n f = i i n xi x1 x2 . . . xk f1 f2 . . . fk
  50. Bảng phương pháp tần số ghép lớp Nếu các số liệu sai khác nhau không đáng kể xi−1 - xi x1 - x2 x3 - x4 . . . xk−1- xk m1 m2 mj
  51. Định nghĩa Một số thống kê đặc trưng mẫu ngẫu nhiên THỐNG KÊ
  52. THỐNG KÊ Định nghĩa Một số thống kê đặc trưng mẫu ngẫu nhiên
  53. Định nghĩa Cho mẫu ngẫu nhiên W = (X1,X2,. . . , Xn). Mỗi một cách tổng hợp mẫu ngẫu nhiên dưới dạng một hàm nào đó của các biến ngẫu nhiên X1,X2,. . . , Xn được gọi là một thống kê. Ký hiệu: G = f(X1,X2,. . . , Xn). Chú ý. - Thống kê G là một hàm của các biến ngẫu nhiên nên G cũng là một biến ngẫu nhiên và tuân theo một quy luật phân phối xác suất nhất định và có các tham số đặc trưng E(G), V(G). . . - Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x1, . . . , xn) thì thống kê G cũng nhận giá trị cụ thể g = f(x1. . . , xn). Định nghĩa thống kê
  54. Chú ý. - Thống kê G là một hàm của các biến ngẫu nhiên nên G cũng là một biến ngẫu nhiên và tuân theo một quy luật phân phối xác suất nhất định và có các tham số đặc trưng E(G), V(G). . . - Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x1, . . . , xn) thì thống kê G cũng nhận giá trị cụ thể g = f(x1. . . , xn). Định nghĩa thống kê Định nghĩa Cho mẫu ngẫu nhiên W = (X1,X2,. . . , Xn). Mỗi một cách tổng hợp mẫu ngẫu nhiên dưới dạng một hàm nào đó của các biến ngẫu nhiên X1,X2,. . . , Xn được gọi là một thống kê. Ký hiệu: G = f(X1,X2,. . . , Xn).
  55. - Thống kê G là một hàm của các biến ngẫu nhiên nên G cũng là một biến ngẫu nhiên và tuân theo một quy luật phân phối xác suất nhất định và có các tham số đặc trưng E(G), V(G). . . - Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x1, . . . , xn) thì thống kê G cũng nhận giá trị cụ thể g = f(x1. . . , xn). Định nghĩa thống kê Định nghĩa Cho mẫu ngẫu nhiên W = (X1,X2,. . . , Xn). Mỗi một cách tổng hợp mẫu ngẫu nhiên dưới dạng một hàm nào đó của các biến ngẫu nhiên X1,X2,. . . , Xn được gọi là một thống kê. Ký hiệu: G = f(X1,X2,. . . , Xn). Chú ý.
  56. - Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x1, . . . , xn) thì thống kê G cũng nhận giá trị cụ thể g = f(x1. . . , xn). Định nghĩa thống kê Định nghĩa Cho mẫu ngẫu nhiên W = (X1,X2,. . . , Xn). Mỗi một cách tổng hợp mẫu ngẫu nhiên dưới dạng một hàm nào đó của các biến ngẫu nhiên X1,X2,. . . , Xn được gọi là một thống kê. Ký hiệu: G = f(X1,X2,. . . , Xn). Chú ý. - Thống kê G là một hàm của các biến ngẫu nhiên nên G cũng là một biến ngẫu nhiên và tuân theo một quy luật phân phối xác suất nhất định và có các tham số đặc trưng E(G), V(G). . .
  57. Định nghĩa thống kê Định nghĩa Cho mẫu ngẫu nhiên W = (X1,X2,. . . , Xn). Mỗi một cách tổng hợp mẫu ngẫu nhiên dưới dạng một hàm nào đó của các biến ngẫu nhiên X1,X2,. . . , Xn được gọi là một thống kê. Ký hiệu: G = f(X1,X2,. . . , Xn). Chú ý. - Thống kê G là một hàm của các biến ngẫu nhiên nên G cũng là một biến ngẫu nhiên và tuân theo một quy luật phân phối xác suất nhất định và có các tham số đặc trưng E(G), V(G). . . - Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x1, . . . , xn) thì thống kê G cũng nhận giá trị cụ thể g = f(x1. . . , xn).
  58. Trung bình mẫu Phương sai mẫu Độ lệch chuẩn mẫu Tần suất mẫu Một số thống kê đặc trưng mẫu ngẫu nhiên
  59. Một số thống kê đặc trưng mẫu ngẫu nhiên Trung bình mẫu Phương sai mẫu Độ lệch chuẩn mẫu Tần suất mẫu
  60. Trung bình mẫu là trung bình số học của các giá trị mẫu. n 1 X X¯ = X n i i=1 Chú ý. Với mẫu ngẫu nhiên, trung bình mẫu là một biến ngẫu nhiên, còn với mẫu cụ thể thì nó nhận một giá trị xác định được tính bằng công thức : n 1 X x¯ = x n i i=1 hay k 1 X x¯ = n x n i i i=1 Trung bình mẫu - X¯
  61. Chú ý. Với mẫu ngẫu nhiên, trung bình mẫu là một biến ngẫu nhiên, còn với mẫu cụ thể thì nó nhận một giá trị xác định được tính bằng công thức : n 1 X x¯ = x n i i=1 hay k 1 X x¯ = n x n i i i=1 Trung bình mẫu - X¯ Trung bình mẫu là trung bình số học của các giá trị mẫu. n 1 X X¯ = X n i i=1
  62. hay k 1 X x¯ = n x n i i i=1 Trung bình mẫu - X¯ Trung bình mẫu là trung bình số học của các giá trị mẫu. n 1 X X¯ = X n i i=1 Chú ý. Với mẫu ngẫu nhiên, trung bình mẫu là một biến ngẫu nhiên, còn với mẫu cụ thể thì nó nhận một giá trị xác định được tính bằng công thức : n 1 X x¯ = x n i i=1
  63. Trung bình mẫu - X¯ Trung bình mẫu là trung bình số học của các giá trị mẫu. n 1 X X¯ = X n i i=1 Chú ý. Với mẫu ngẫu nhiên, trung bình mẫu là một biến ngẫu nhiên, còn với mẫu cụ thể thì nó nhận một giá trị xác định được tính bằng công thức : n 1 X x¯ = x n i i=1 hay k 1 X x¯ = n x n i i i=1
  64. n ! n 1 X 1 X 1 V (X ) V (X¯ ) = V X = V (X ) = nV (X ) = n i n2 i n2 n i=1 i=1 Trung bình mẫu - X¯ n ! n 1 X 1 X E(X¯ ) = E X = E(X ) = E(X ) n i n i i=1 i=1
  65. Trung bình mẫu - X¯ n ! n 1 X 1 X E(X¯ ) = E X = E(X ) = E(X ) n i n i i=1 i=1 n ! n 1 X 1 X 1 V (X ) V (X¯ ) = V X = V (X ) = nV (X ) = n i n2 i n2 n i=1 i=1
  66. Phương sai S2: n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1 Phương sai S∗2: n 1 X S∗2 = (X − m)2 n i i=1 E(S∗2) = E(S2) = σ2 Phương sai mẫu
  67. n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1 Phương sai S∗2: n 1 X S∗2 = (X − m)2 n i i=1 E(S∗2) = E(S2) = σ2 Phương sai mẫu Phương sai S2:
  68. Phương sai S∗2: n 1 X S∗2 = (X − m)2 n i i=1 E(S∗2) = E(S2) = σ2 Phương sai mẫu Phương sai S2: n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1
  69. n 1 X S∗2 = (X − m)2 n i i=1 E(S∗2) = E(S2) = σ2 Phương sai mẫu Phương sai S2: n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1 Phương sai S∗2:
  70. E(S∗2) = E(S2) = σ2 Phương sai mẫu Phương sai S2: n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1 Phương sai S∗2: n 1 X S∗2 = (X − m)2 n i i=1
  71. Phương sai mẫu Phương sai S2: n n ! 1 X 1 X S2 = (X − X¯ )2 = X 2 − nX¯ 2 n − 1 i n − 1 i i=n i=1 Phương sai S∗2: n 1 X S∗2 = (X − m)2 n i i=1 E(S∗2) = E(S2) = σ2
  72. v √ u n 2 u 1 X 2 S = S = t (Xi − X¯ ) n − 1 i=1 Độ lệch chuẩn mẫu
  73. Độ lệch chuẩn mẫu v √ u n 2 u 1 X 2 S = S = t (Xi − X¯ ) n − 1 i=1
  74. X là số phần tử mang dấu hiệu nghiên cứu, n là kích thước mẫu, tần suất mẫu được tính bởi: X f = n p(1 − p) E(f ) = p; V (f ) = n trong đó p là tần suất tổng thể. Ví dụ Xét tổng thể là dân số một nước, p là tỉ lệ nam. Kiểm tra ngẫu X nhiên 100 người thấy có X nam giới, khi đó f = 100 là tỉ lệ nam trong mẫu = tần suất mẫu. Tần suất mẫu
  75. p(1 − p) E(f ) = p; V (f ) = n trong đó p là tần suất tổng thể. Ví dụ Xét tổng thể là dân số một nước, p là tỉ lệ nam. Kiểm tra ngẫu X nhiên 100 người thấy có X nam giới, khi đó f = 100 là tỉ lệ nam trong mẫu = tần suất mẫu. Tần suất mẫu X là số phần tử mang dấu hiệu nghiên cứu, n là kích thước mẫu, tần suất mẫu được tính bởi: X f = n
  76. Ví dụ Xét tổng thể là dân số một nước, p là tỉ lệ nam. Kiểm tra ngẫu X nhiên 100 người thấy có X nam giới, khi đó f = 100 là tỉ lệ nam trong mẫu = tần suất mẫu. Tần suất mẫu X là số phần tử mang dấu hiệu nghiên cứu, n là kích thước mẫu, tần suất mẫu được tính bởi: X f = n p(1 − p) E(f ) = p; V (f ) = n trong đó p là tần suất tổng thể.
  77. Tần suất mẫu X là số phần tử mang dấu hiệu nghiên cứu, n là kích thước mẫu, tần suất mẫu được tính bởi: X f = n p(1 − p) E(f ) = p; V (f ) = n trong đó p là tần suất tổng thể. Ví dụ Xét tổng thể là dân số một nước, p là tỉ lệ nam. Kiểm tra ngẫu X nhiên 100 người thấy có X nam giới, khi đó f = 100 là tỉ lệ nam trong mẫu = tần suất mẫu.
  78. Một số thống kê đặc trưng mẫu ngẫu nhiên Ví dụ Gặt ngẫu nhiên 100 điểm trồng lúa của một vùng thu được bảng số liệu sau: Năng suất 30 33 34 36 40 Số điểm 15 20 41 18 6 Xác định các thống kê đặc trưng mẫu.
  79. Một số thống kê đặc trưng mẫu ngẫu nhiên Ví dụ Gọi X là năng suất lúa (tạ/ha).Ta có mẫu cụ thể kích thước n = 100. Để tiện cho việc tính toán, ta lập bảng sau: 2 xi ni ni xi ni xi 30 15 450 13500 33 20 660 21780 34 41 1394 47396 36 18 648 23328 40 6 240 9600 P P P 2 ni = n = 100 ni xi = 3392 ni xi = 115604
  80. Một số thống kê đặc trưng mẫu ngẫu nhiên Ví dụ Từ đó, 3392 x¯ = = 33, 92 100 1 s2 = 115604 − 100 × 33, 922 = 5, 5289; 99 s = p5, 5289 ≈ 2, 35
  81. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ ĐẶC TRƯNG MẪU Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Trường hợp hai biến ngẫu nhiên gốc tuân theo quy luật phân phối không – một
  82. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Lập mẫu ngẫu nhiên kích thước n: W = (X1, X2, , Xn). Ta có: 2 Xi ∼ N(µ, σ ), i = 1, , n. Khi đó: σ2 X¯ ∼ N(µ, ) n √ X¯ − µ n ∼ N (0; 1) σ nS∗2 ∼ χ2(n) σ2 (n − 1) S2 ∼ χ2 (n − 1) σ2 √ X¯ − µ n ∼ T (n − 1) S
  83. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Giả sử ở vùng M, người trưởng thành có chiều cao phân phối chuẩn với trung bình là 165 cm và độ lệch chuẩn 10 cm. Chọn ngẫu nhiên 100 người trưởng thành ở vùng đó. a) Tìm xác suất để chiều cao trung bình đo được (của 100 người đó) lớn hơn 168 cm. b) Nếu muốn chiều cao trung bình đo được sai lệch so với chiều cao trung bình của cả vùng không quá 1 cm với xác suất 95% thì phải lấy một mẫu kích thước là bao nhiêu. c) Với kích thước mẫu 100 thì phương sai đo được lớn hơn phương sai thật không quá bao nhiêu lần với xác suất 95%.
  84. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n ) √ √ ! X¯ − µ n (168 − µ) n P(X¯ > 168) = P > σ σ = P(U > 3) = 0, 0013 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M.
  85. √ √ ! X¯ − µ n (168 − µ) n P(X¯ > 168) = P > σ σ = P(U > 3) = 0, 0013 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n )
  86. √ √ ! X¯ − µ n (168 − µ) n = P > σ σ = P(U > 3) = 0, 0013 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n ) P(X¯ > 168)
  87. √ ! (168 − µ) n > σ = P(U > 3) = 0, 0013 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n ) √ X¯ − µ n P(X¯ > 168) = P σ
  88. = P(U > 3) = 0, 0013 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n ) √ √ ! X¯ − µ n (168 − µ) n P(X¯ > 168) = P > σ σ
  89. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ Gọi X là chiều cao người trưởng thành ở vùng M. ¯ σ2 a) Lấy mẫu kích thước n = 100. X ∼ N(µ, n ) √ √ ! X¯ − µ n (168 − µ) n P(X¯ > 168) = P > σ σ = P(U > 3) = 0, 0013
  90. √ √ √ n n n ⇒ 2Φ ( ) = 0, 95 ⇒ Φ ( ) = 0, 475 = Φ (1, 96) ⇒ = 1, 96 0 10 0 10 0 10 ⇒ n = 384, 16. Vậy, phải điều tra mẫu kích thước n = 385. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95
  91. √ √ n n ⇒ Φ ( ) = 0, 475 = Φ (1, 96) ⇒ = 1, 96 0 10 0 10 ⇒ n = 384, 16. Vậy, phải điều tra mẫu kích thước n = 385. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95 √ n ⇒ 2Φ ( ) = 0, 95 0 10
  92. √ n ⇒ = 1, 96 10 ⇒ n = 384, 16. Vậy, phải điều tra mẫu kích thước n = 385. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95 √ √ n n ⇒ 2Φ ( ) = 0, 95 ⇒ Φ ( ) = 0, 475 = Φ (1, 96) 0 10 0 10 0
  93. ⇒ n = 384, 16. Vậy, phải điều tra mẫu kích thước n = 385. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95 √ √ √ n n n ⇒ 2Φ ( ) = 0, 95 ⇒ Φ ( ) = 0, 475 = Φ (1, 96) ⇒ = 1, 96 0 10 0 10 0 10
  94. Vậy, phải điều tra mẫu kích thước n = 385. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95 √ √ √ n n n ⇒ 2Φ ( ) = 0, 95 ⇒ Φ ( ) = 0, 475 = Φ (1, 96) ⇒ = 1, 96 0 10 0 10 0 10 ⇒ n = 384, 16.
  95. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ b) Tìm n sao cho P( X¯ − µ ≤ 1) = 0, 95 √ √ √ n n n ⇒ 2Φ ( ) = 0, 95 ⇒ Φ ( ) = 0, 475 = Φ (1, 96) ⇒ = 1, 96 0 10 0 10 0 10 ⇒ n = 384, 16. Vậy, phải điều tra mẫu kích thước n = 385.
  96. S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95
  97. (n − 1)S2  = P ≤ (n − 1)ε = 0, 95 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  ⇒ P ≤ ε σ2
  98. = 0, 95 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε σ2 σ2
  99. (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2
  100. 2(n−1) ⇒ (n − 1)ε = χ0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 σ2
  101. 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05
  102. 124, 34 ⇒ ε = ≈ 1, 26 99 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 2(99) ⇒ 99ε = χ0,05 = 124, 34
  103. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân phối chuẩn. X ∼ N(µ, σ2) Ví dụ S2 c) Tìm ε sao cho P( σ2 ≤ ε) = 0, 95 S2  (n − 1)S2  ⇒ P ≤ ε = P ≤ (n − 1)ε = 0, 95 σ2 σ2 (n − 1)S2  ⇒ P > (n − 1)ε = 0, 05 ⇒ (n − 1)ε = χ2(n−1) σ2 0,05 124, 34 ⇒ 99ε = χ2(99) = 124, 34 ⇒ ε = ≈ 1, 26 0,05 99
  104. 2 Giả sử có hai tổng thể với các biến ngẫu nhiên X1 ∼ N µ1, σ1 ; 2 X2 ∼ N µ2, σ2 . Từ hai tổng thể lập hai mẫu ngẫu nhiên độc lập: W1 = (X11, X12, , X1n1 ), W2 = (X21,X22, , X2n2 )  2 2   σ1 σ2 X¯1 − X¯2 ∼ N µ1 − µ2; + n1 n2  X¯1 − X¯2 − (µ1 − µ2) ∼ N (0; 1) q σ2 σ2 1 + 2 n1 n2 Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn
  105. Từ hai tổng thể lập hai mẫu ngẫu nhiên độc lập: W1 = (X11, X12, , X1n1 ), W2 = (X21,X22, , X2n2 )  2 2   σ1 σ2 X¯1 − X¯2 ∼ N µ1 − µ2; + n1 n2  X¯1 − X¯2 − (µ1 − µ2) ∼ N (0; 1) q σ2 σ2 1 + 2 n1 n2 Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn 2 Giả sử có hai tổng thể với các biến ngẫu nhiên X1 ∼ N µ1, σ1 ; 2 X2 ∼ N µ2, σ2 .
  106.  2 2   σ1 σ2 X¯1 − X¯2 ∼ N µ1 − µ2; + n1 n2  X¯1 − X¯2 − (µ1 − µ2) ∼ N (0; 1) q σ2 σ2 1 + 2 n1 n2 Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn 2 Giả sử có hai tổng thể với các biến ngẫu nhiên X1 ∼ N µ1, σ1 ; 2 X2 ∼ N µ2, σ2 . Từ hai tổng thể lập hai mẫu ngẫu nhiên độc lập: W1 = (X11, X12, , X1n1 ), W2 = (X21,X22, , X2n2 )
  107. Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn 2 Giả sử có hai tổng thể với các biến ngẫu nhiên X1 ∼ N µ1, σ1 ; 2 X2 ∼ N µ2, σ2 . Từ hai tổng thể lập hai mẫu ngẫu nhiên độc lập: W1 = (X11, X12, , X1n1 ), W2 = (X21,X22, , X2n2 )  2 2   σ1 σ2 X¯1 − X¯2 ∼ N µ1 − µ2; + n1 n2  X¯1 − X¯2 − (µ1 − µ2) ∼ N (0; 1) q σ2 σ2 1 + 2 n1 n2
  108. Trường hợp hai biến ngẫu nhiên gốc cùng tuân theo quy luật phân phối theo chuẩn 2 2 S1 σ2 G = F = 2 · 2 ∼ F (n1 − 1; n2 − 1) S2 σ1 Nếu n1, n2 > 30 thì :  X¯1 − X¯2 − (µ1 − µ2) U = ∼ N(0, 1) q S2 S2 1 + 2 n1 n2
  109. Lập mẫu ngẫu nhiên : W = (X1,X2,. . . , Xn) q q Nếu n > 5 và p − 1−p · √1 < 0, 3 thì 1−p p n  p(1 − p) f ∼ N p; n và √ (f − p) n ∼ N(0, 1) pp (1 − p) Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p)
  110. q q Nếu n > 5 và p − 1−p · √1 < 0, 3 thì 1−p p n  p(1 − p) f ∼ N p; n và √ (f − p) n ∼ N(0, 1) pp (1 − p) Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Lập mẫu ngẫu nhiên : W = (X1,X2,. . . , Xn)
  111. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Lập mẫu ngẫu nhiên : W = (X1,X2,. . . , Xn) q q Nếu n > 5 và p − 1−p · √1 < 0, 3 thì 1−p p n  p(1 − p) f ∼ N p; n và √ (f − p) n ∼ N(0, 1) pp (1 − p)
  112. Giải Giả sử lô hàng đủ chỉ tiêu xuất khẩu. Gọi X là số phế phẩm, ta có X ∼ A(p = 0.05). Với mẫu kích thước n = 100, ta phải tìm ε sao cho X P(f ≤ ε) = 0, 95, trong đó f = n là tần suất mẫu. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ Lô hàng đủ tiêu chuẩn xuất khẩu nếu có tỉ lệ phế phẩm không quá 5%. Nếu kiểm tra ngẫu nhiên 100 sản phẩm thì với tỉ lệ phế phẩm tối đa là bao nhiêu ta có thể chấp nhận lô hàng đủ tiêu chuẩn xuất khẩu (với khả năng không mắc sai lầm là 95%).
  113. Với mẫu kích thước n = 100, ta phải tìm ε sao cho X P(f ≤ ε) = 0, 95, trong đó f = n là tần suất mẫu. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ Lô hàng đủ tiêu chuẩn xuất khẩu nếu có tỉ lệ phế phẩm không quá 5%. Nếu kiểm tra ngẫu nhiên 100 sản phẩm thì với tỉ lệ phế phẩm tối đa là bao nhiêu ta có thể chấp nhận lô hàng đủ tiêu chuẩn xuất khẩu (với khả năng không mắc sai lầm là 95%). Giải Giả sử lô hàng đủ chỉ tiêu xuất khẩu. Gọi X là số phế phẩm, ta có X ∼ A(p = 0.05).
  114. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ Lô hàng đủ tiêu chuẩn xuất khẩu nếu có tỉ lệ phế phẩm không quá 5%. Nếu kiểm tra ngẫu nhiên 100 sản phẩm thì với tỉ lệ phế phẩm tối đa là bao nhiêu ta có thể chấp nhận lô hàng đủ tiêu chuẩn xuất khẩu (với khả năng không mắc sai lầm là 95%). Giải Giả sử lô hàng đủ chỉ tiêu xuất khẩu. Gọi X là số phế phẩm, ta có X ∼ A(p = 0.05). Với mẫu kích thước n = 100, ta phải tìm ε sao cho X P(f ≤ ε) = 0, 95, trong đó f = n là tần suất mẫu.
  115. √ ! (ε − 0, 05) 100 = P U ≤ √ = 0, 95 0, 05.0, 95 √ √ (ε−0,05) 100 ⇒ √ = u = 1, 645 ⇒ ε = 1,645.√0,05.0,95 + 0, 5 = 0,05.0,95 0,05 100 0, 086 Vậy khi kiểm tra 100 sản phẩm, tỉ lệ phế phẩm cho phép là 8,6%. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ  p(1−p)  Do f ∼ N p; n nên √ √ ! (f − p) n (ε − 0, 05) 100 P(f ≤ ε) = P ≤ √ pp (1 − p) 0, 05.0, 95
  116. √ √ (ε−0,05) 100 ⇒ √ = u = 1, 645 ⇒ ε = 1,645.√0,05.0,95 + 0, 5 = 0,05.0,95 0,05 100 0, 086 Vậy khi kiểm tra 100 sản phẩm, tỉ lệ phế phẩm cho phép là 8,6%. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ  p(1−p)  Do f ∼ N p; n nên √ √ ! (f − p) n (ε − 0, 05) 100 P(f ≤ ε) = P ≤ √ pp (1 − p) 0, 05.0, 95 √ ! (ε − 0, 05) 100 = P U ≤ √ = 0, 95 0, 05.0, 95
  117. Vậy khi kiểm tra 100 sản phẩm, tỉ lệ phế phẩm cho phép là 8,6%. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ  p(1−p)  Do f ∼ N p; n nên √ √ ! (f − p) n (ε − 0, 05) 100 P(f ≤ ε) = P ≤ √ pp (1 − p) 0, 05.0, 95 √ ! (ε − 0, 05) 100 = P U ≤ √ = 0, 95 0, 05.0, 95 √ √ (ε−0,05) 100 ⇒ √ = u = 1, 645 ⇒ ε = 1,645.√0,05.0,95 + 0, 5 = 0,05.0,95 0,05 100 0, 086
  118. Trường hợp biến ngẫu nhiên gốc tuân theo quy luật không – một. X ∼ A(p) Ví dụ  p(1−p)  Do f ∼ N p; n nên √ √ ! (f − p) n (ε − 0, 05) 100 P(f ≤ ε) = P ≤ √ pp (1 − p) 0, 05.0, 95 √ ! (ε − 0, 05) 100 = P U ≤ √ = 0, 95 0, 05.0, 95 √ √ (ε−0,05) 100 ⇒ √ = u = 1, 645 ⇒ ε = 1,645.√0,05.0,95 + 0, 5 = 0,05.0,95 0,05 100 0, 086 Vậy khi kiểm tra 100 sản phẩm, tỉ lệ phế phẩm cho phép là 8,6%.
  119. Giả sử: X1 ∼ A(p1); X2 ∼ A(p2) Lập 2 mẫu độc lập: W1 = (X11,X12, , X1n1 ); W2 = (X21,X22, , X2n2 ) Nếu n1, n2 > 30 thì   p1(1 − p1) p2(1 − p2) (f1 − f2) ∼ N p1 − p2; + n1 n2 (f1 − f2) − (p1 − p2) q ∼ N(0; 1) p1(1−p1) + p2(1−p2) n1 n2 Trường hợp hai biến ngẫu nhiên gốc tuân theo quy luật phân phối không – một
  120. Trường hợp hai biến ngẫu nhiên gốc tuân theo quy luật phân phối không – một Giả sử: X1 ∼ A(p1); X2 ∼ A(p2) Lập 2 mẫu độc lập: W1 = (X11,X12, , X1n1 ); W2 = (X21,X22, , X2n2 ) Nếu n1, n2 > 30 thì   p1(1 − p1) p2(1 − p2) (f1 − f2) ∼ N p1 − p2; + n1 n2 (f1 − f2) − (p1 − p2) q ∼ N(0; 1) p1(1−p1) + p2(1−p2) n1 n2
  121. SUY DIỄN THỐNG KÊ Suy đoán về tính chất của một mẫu ngẫu nhiên được suy ra từ tổng thể nếu đã biết quy luật phân phối xác suất và các tham số đặc trưng tổng thể. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối chuẩn Suy đoán về giá trị của trung bình mẫu Suy đoán về giá trị của phương sai mẫu Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một
  122. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối chuẩn Giả sử trong tổng thể nghiên cứu biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán µ và phương sai σ2 đã biết. Nếu từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n thì có thể căn cứ vào thông tin của tổng thể để suy đoán về giá trị của trung bình mẫu X¯ và của phương sai mẫu S2.
  123. Suy đoán về giá trị của trung bình mẫu √ (X¯ −µ) n Ta có thống kê: U = σ ∼ N(0, 1) Từ đó với xác suất 1 − α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được các giá trị tới hạn u1−α1 và uα2 tương ứng sao cho: P(u < U < u ) = 1 − α. 1−√α1 α2  (X¯ −µ) n  Từ đó: P u1−α1 < σ < uα2 = 1 − α.  σ σ  =⇒ P µ − √ u < X¯ < µ + √ u = 1 − α (1) n α1 n α2 Với các cặp giá trị của α1 và α2 khác nhau ta thu được các khoảng giá trị khác nhau của X¯ .
  124. Suy đoán về giá trị của trung bình mẫu Ví dụ Một dây chuyền sản xuất ra một loại sản phẩm có kích thước phân phối chuẩn với trung bình 40cm và độ lệch chuẩn 4cm. Lấy ngẫu nhiên 16 chi tiết để kiểm tra. a. Tìm xác suất để kích thước trung bình của các chi tiết đó nằm trong khoảng từ 38cm đến 42cm. b. Tìm xác suất để kích thước trung bình của các chi tiết đó lớn hơn 40cm. c. Với xác suất 95% thì kích thước trung bình của các chi tiết đó nằm trong khoảng nào xung quanh giá trị trung bình?
  125. Suy đoán về giá trị của trung bình mẫu Ví dụ Gọi X là kích thước của chi tiết do dây chuyền sản xuất ra. X ∼ N(40, 42). Lấy ngẫu nhiên một mẫu kích thước n = 16. a. Ta phải tìm xác suất để trung bình mẫu X¯ nằm trong khoảng (38; 42). Theo công thức (1) ta có: µ − √σ u = 40 − √4 u = 38 =⇒ u = 2 n α1 16 α1 α1 Tương tự: µ + √σ u = 40 + √4 u = 42 =⇒ u = 2 n α2 16 α2 α2 Tra bảng giá trị tới hạn chuẩn được α1 = α2 = 0, 0228, suy ra α = α1 + α2 = 0, 0456. Từ đó 1 − α = 1 − 0, 0456 = 0, 9544
  126. Suy đoán về giá trị của trung bình mẫu Ví dụ b. Để tìm xác suất sao cho trung bình mẫu lớn hơn 40cm, ta lấy α2 = 0; α1 = α, từ đó uα2 = +∞ và công thức (6.1) trở thành:  σ  P X¯ > µ − √ u = 1 − α n α Từ đó: σ 4 µ − √ uα = 40 − √ uα = 40 n 16 Suy ra uα = 0 =⇒ α = 0, 5 =⇒ 1 − α = 0, 5.
  127. Suy đoán về giá trị của trung bình mẫu Ví dụ c. Ta phải tìm a và b sao cho P a < X¯ < b = 0.95 = 1 − α. Từ đó α = 0, 05. Áp dụng công thức (6.1) với α1 = α2 = α/2 = 0, 025, tức là với uα1 = uα2 = 1, 96, ta được: σ 4 a = µ − √ uα = 40 − √ · 1, 96 = 38, 04 n 1 16 và σ 4 b = µ + √ uα = 40 + √ · 1, 96 = 41, 96 n 2 16 Vậy với xác suất 0,95 kích thước trung bình của số chi tiết được đem kiểm tra sẽ nằm trong khoảng (38,04; 41,96) cm.
  128. Suy đoán về giá trị của phương sai mẫu 2 (n−1)S2 2 Ta có thống kê: χ = σ2 ∼ χ (n) Từ đó với xác suất 1 − α có thể tìm được các giá trị α1 và α2 sao cho α + α = α và tìm được các giá trị tới hạn χ2(n−1) và χ2(n−1) 1 2 1−α1 α2 tương ứng sao cho: P(χ2(n−1) < χ2 < χ2(n−1)) = 1 − α. Từ đó: 1−α1 α2  σ2 σ2  P χ2(n−1) < S2 < χ2(n−1) = 1 − α (2) n − 1 1−α1 n − 1 1−α2 Với các cặp giá trị của α1 và α2 khác nhau ta thu được các khoảng giá trị khác nhau của S2.
  129. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một Giả sử X ∼ A(p). Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n, ta có thể suy đoán về số lần xuất hiện biến cố trong mẫu đó hoặc tần suất mẫu.√ Thống kê: U = √(f −p) n ∼ N(0, 1) nếu p(1−1) q q n > 5; p − 1−p · √1 < 0, 3 1−p p n Khi đó với xác suất 1 − α có thể tìm được α1 và α2 sao cho α1 + α2 = α và tìm được các giá trị tới hạn chuẩn u1−α1 và uα2 sao cho: P(u1−α1 < U < uα2 ) = 1 − α. Từ đó ! pp(1 − p) pp(1 − p) P p − √ u < f < p + √ u = 1 − α (3) n α1 n α2 Từ đó có các suy đoán đối với f.
  130. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một Ví dụ Tỷ lệ phế phẩm cho phép của một lô hàng là 10%. Lấy ngẫu nhiên một mẫu 100 sản phẩm từ lô hàng đó ra kiểm tra. Với xác suất 95%, số phế phẩm tối đa của mẫu đó là bao nhiêu thì có thể chấp nhận lô hàng đó.
  131. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một Ví dụ Gọi p là tỷ lệ phế phẩm của lô hàng, p = 0.1. Gọi X là số phế phẩm trong mẫu n = 100 sản phẩm của lô hàng, ta có tần suất X X mẫu: f = n = 100 Do n = 100 > 5 và q q q q p − 1−p · √1 = 0,1 − 1−0,1 · √1 = 0, 267 < 0, 3 1−p p n 1−0,1 0,1 100 nên có thể dùng công thức (3), trong đó chọn α1 = 0, α2 = α.
  132. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một Ví dụ Ta có: ! pp(1 − p) P f < p + √ u = 1 − α = 0, 95 n α từ đó α = 0, 05 và uα = u0,05 = 1, 64. Vậy √ 0, 1.0, 9 f < 0, 1 + √ · 1, 64 = 0, 1492 100 Từ đó X < 100.0,1492 = 14,92. Do X là số nguyên nên X ≥ 15 phế phẩm.