Bài giảng Lý thuyết xác suất thống kê - Chương 7: Ước lượng các số đặc trưng của tổng thể - Trường Đại học Kinh tế Thành phố Hồ Chí Minh

pdf 77 trang cucquyet12 3390
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất thống kê - Chương 7: Ước lượng các số đặc trưng của tổng thể - Trường Đại học Kinh tế Thành phố Hồ Chí Minh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_thong_ke_chuong_7_uoc_luong_cac.pdf

Nội dung text: Bài giảng Lý thuyết xác suất thống kê - Chương 7: Ước lượng các số đặc trưng của tổng thể - Trường Đại học Kinh tế Thành phố Hồ Chí Minh

  1. Chương 7 ƯỚC LƯỢNG CÁC SỐ ĐẶC TRƯNG CỦA TỔNG THỂ
  2. Các số đặc trưng của tổng thể như trung bình tổng thể, tỷ lệ tổng thể, phương sai của tổng thể, . . . được sử dụng rất nhiều trong phân tích kinh tế - xã hội và các lĩnh vực khác.
  3. Nhưng các số đặc trưng này thường là chưa biết. Vì vậy đặt ra vấn đề cần ước lượng chúng bằng phương pháp mẫu. Chúng ta có thể nêu vấn đề thực tế đó dưới dạng toán học như sau:
  4. Cho đại lượng ngẫu nhiên X có thể đã biết hoặc chưa biết phân phối xác suất và chưa biết tham số  nào đó của X. Hãy ước lượng  bằng phương pháp mẫu.
  5. Vì  là một hằng số nên ta có thể dùng một con số để ước lượng . Ước lượng như vậy được gọi là ước lượng điểm Ngoài ước lượng điểm, ta còn dùng ước lượng khoảng. Tức là chỉ ra một khoảng số (1, 2) có thể chứa được .
  6. I- PHƯƠNG PHÁP HÀM ƯỚC LƯỢNG 1- Mô tả phương pháp: Giả sử cần ước lượng tham số  của đ.l.n.n X. Từ X ta lập mẫu ngẫu nhiên kích thước n: WX = (X1, X2, , . . . , Xn) Chọn
  7. ˆ  = f(X1, X2, . . . , Xn) ˆ được gọi là hàm ước lượng của  Trong thực tế người ta thường chọn hàm ước lượng như sau: n ª Chọn ˆ= 1 nếu là ước  X  Xi n i 1 lượng trung bình của tổng thể
  8. 1 n ª Chọn ˆ= S2 = 2 (Xi X) n 1 i 1 nếu là ước lượng phương sai của tổng thể n ª Chọn ˆ= F = 1 nếu là ước   Xi n i 1 lượng tỷ lệ tổng thể
  9. Từ mẫu cụ thể Wx = (x1, x2, , xn), ta tính giá trị của ˆ (ký hiệu là ˆ)*. Tức là: ˆ *  = f(x1, x2, . . . , xn) Ước lượng điểm của  chính là giá trị ˆ *vừa tính được.
  10. 2 -Ước lượng không chệch * Định nghĩa: ˆ được gọi là ước lượng không chệch của tham số  nếu: E(ˆ )  Ngược lại, nếu E(ˆ )  thì  là ước lượng chệch của tham số 
  11. * Ý nghĩa: Ứớc lượng không chệch là ước lượng có sai số trung bình bằng 0. * Thí dụ: ª Trung bình mẫu ngẫu nhiên ( )Xlà ước lượng không chệch của trung bình tổng thể () vì E( ) =  X
  12. ª Phương sai mẫu ngẫu nhiên (S2) là ước lượng không chệch của phương sai tổng thể (2) vì: E(S2) = 2 ª Tỷ lệ mẫu ngẫu nhiên (F) là ước lượng không chệch của tỷ lệ tổng thể (p) vì E(Fn) = p
  13. II- PHƯƠNG PHÁP KHOẢNG TIN CẬY (phương pháp ước lượng khoảng) Phương pháp khoảng tin cậy dùng một khoảng số để ước lượng . Phương pháp này được nhà toán học Pháp P.S. Laplace ng/c (1841) và được hoàn thiện bởi nhà thống kê Mỹ J. Neyman (1937).
  14. 1 - Mô tả phương pháp khoảng tin cậy Để ước lượng tham số  của đ.l.n.n X, từ X ta lập mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn).
  15. Chọn thống kê: ˆ  = f(X1, X2, . . . , Xn) Sao cho: mặc dù chưa biết giá trị của  nhưng phân phối xác suất của ˆ được xác định.
  16. Do đó với xác suất khá bé ( ≤ 0,05) ta có thể tìm được 2 số a, b sao cho: P(a ≤ ˆ ≤ b) = 1- (6.1)
  17. Nếu từ biểu thức (6.1) ta giải ra được . Tức ta đưa biểu thức (6.1) về dạng: ˆ ˆ P(1  2 ) 1 ˆ ˆ Khoảng 1 ,gọi2 là khoảng tin cậy của .
  18. Vì ˆ , ˆ là các ĐLNN nên khoảng 1 2 ˆ ˆ là khoảng ngẫu nhiên. 1 ,2
  19. 1- gọi là độ tin cậy (hệ số tin cậy) của ước lượng. Trong thực tế người ta thường yêu cầu 1- 95% để có thể sử dụng nguyên lý xác suất lớn cho biến cố: ˆ ˆ (1  2 )
  20. ˆ ˆ gọi là độ dài khoảng l 2 1 tin cậy l có thể là hằng số và cũng có thể là ĐLNN.  = l/2 gọi là độ chính xác của ước lượng khoảng.
  21. Do xác suất 1- khá lớn nên theo nguyên lý xác suất lớn ta có thể coi biến cố: ˆ ˆ (1  2 ) Hầu như chắc chắn xảy ra trong một phép thử
  22. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX, ta sẽ thu được mẫu cụ thể. Từ mẫu cụ thể này ta sẽ tính được giá trị của ˆ , ˆ 1 2 Ký hiệu các giá trị đó tương ứng là ˆ * ˆ * 1 ,2
  23. Như vậy có thể kết luận: Với độ tin cậy 1- , qua mẫu cụ thể W ,  nằm trong khoảng ˆ * ˆ * x (1 ,2 ) Tức là: ˆ * ˆ * (1  2 )
  24. Phương pháp này có ưu điểm là: Chẳng những tìm được khoảng ˆ * ˆ * (1 ,2 ) để ước lượng  mà còn cho biết độ tin cậy của ước lượng. Tuy nhiên phương pháp này cũng chứa đựng khả năng mắc phải sai lầm. Xác suất mắc phải sai lầm là .
  25. 2 - Ước lượng trung bình tổng thể Giả sử trung bình của tổng thể là  chưa biết, ta cần ước lượng  với độ tin cậy 1 . Lập mẫu ngẫu nhiên WX = (X1, X2, . . . . , Xn) và xét các trường hợp sau:
  26.  Trường hợp kích thước mẫu n 30 (hoặc n < 30 nhưng X có phân phối chuẩn); 2 đã biết Xét đại lượng ngẫu nhiên Z = X   / n
  27. Z có phân phối xấp xỉ với phân phối N(0, 1) khi n khá lớn. Trường hợp n 0 và P(Z > z /2) = (*)
  28. Thay biểu thức của Z vào (*) và sau một số biến đổi, ta được:   P( X z  X z ) = 1 / 2 n / 2 n Vậy với độ tin cậy 1 , khoảng tin cậy của  là:   X z / 2 ;X z / 2 n n
  29. Ký hiệu:   = z /2 n  được gọi là độ chính xác của ước lượng khoảng. Khi đó ta có thể viết: P( X  <  < X + ) = 1
  30. ( X  ; X+ ) được gọi là khoảng tin cậy đối xứng của . Ứng với độ tin cậy 1 , khoảng tin cậy đối xứng có độ dài ngắn nhất. Vì vậy khi cần tìm khoảng tin cậy, thông thường ta chỉ cần tìm khoảng tin cậy đối xứng.
  31. Ngoài khoảng tin cậy đối xứng ta cũng có thể tìm khoảng tin cậy phía bên trái:   X z n hoặc khoảng tin cậy phía bên phải:   X z n
  32.  Giá trị x + z được dùng n để ước lượng chặn trên của .  Giá trị x - z được dùng n để ước lượng chặn dưới của .
  33. Vì độ tin cậy 1 khá lớn, nên theo nguyên lý xác suất lớn ta có thể coi biến cố ( X  <  < X+ ) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX, ta sẽ thu được mẫu cụ thể: Wx = (x1, x2, . . . , xn)
  34. Từ mẫu cụ thể ta tính được: 1 n x  xi n i 1 Với độ tin cậy 1 cho trước, tra bảng hàm Laplace để tìm giá trị z /2.
  35. z /2 là giá trị của đại lượng ngẫu nhiên Z  N(0, 1) thỏa mãn điều kiện: z /2 > 0 và P( Z > z /2) = /2 Hay: (z ) = 1 - /2 2
  36. Minh họa z /2 trên đồ thị:
  37. Một số giá trị Z và Z /2 với 1- thông dụng
  38. Chú ý: Có thể dùng hàm: NORMSINV(1- /2) trong Excel để tìm trị z /2. Thí dụ: Với độ tin cậy 98% thì: z /2 = z0,01 = NORMSINV(0,99) = 2,326348 2,326
  39. Với độ tin cậy 1 , qua mẫu cụ thể Wx, ước lượng khoảng của  là: (x -  <  < x + )  Trong đó:  = z /2 n
  40.  Trường hợp n 30;  2 chưa biết Trường hợp này, vì kích thước mẫu lớn (n > 30) nên ta có thể dùng ước lượng của Var(X) là S2 để thay cho 2 (chưa biết)
  41. Tiến hành các bước tương tự như trường hợp 1, ta được ước lượng khoảng của  (với độ tin cậy 1 ) là: (x -  <  < x + ) s Trong đó:  = z /2 n
  42.  Trường hợp n < 30; 2 chưa biết; X có phân phối chuẩn. Trường hợp này ta xét đại lượng ngẫu nhiên: X  T = S / n
  43. T có phân phối Student với bậc tự do là (n 1). Xác định khoảng tin cậy của  theo công thức: (x -  <  < x + ) Trong đó: s  = t /2 n
  44. Trong đó t /2 là giá trị của đại lượng ngẫu nhiên T có phân phối Student với n 1 bậc tự do thoả mãn điều kiện: t /2 > 0 và P(T > t /2) = /2 Để tìm t /2 có thể tra bảng hoặc dùng hàm TINV trong Excel.
  45. Thí dụ 1: Điều tra năng suất lúa trên diện tích 100 héc ta trồng lúa của một vùng, người ta tính được: x = 56 tạ/ha; s = 3,3. Hãy ước lượng năng suất lúa trung bình của toàn vùng với độ tin cậy 95%.
  46. Giải: Gọi  là năng suất lúa trung bình của toàn vùng. Ta cần ước lượng  với độ tin cậy 95%. Vì n = 100 > 30; 2 chưa biết, nên khoảng tin cậy của  là: (x -  <  < x + )
  47. Độ tin cậy 1 = 95%, tra bảng ta được: z /2 = z0,025 = 1,96 3,3  1,96 0,6468 0,65 10 Vậy khoảng tin cậy của  là: (56 0,65 ; 56 + 0,65) Hay: (55,35 <  < 56,65) tạ/ha
  48. Thí dụ 2: Theo dõi mức nguyên liệu hao phí để sản xuất một đơn vị sản phẩm người ta thu được các số liệu cho ở bảng sau:
  49. Mức ng/liệu Số sản phẩm hao phí (xi - gr) 19 – 19,5 2 19,5 – 20 10 20 – 20,5 8 20,5 – 21 5
  50. Ước lượng mức hao phí nguyên liệu trung bình để sản xuất một đơn vị sản phẩm với độ tin cậy 1 = 95%. Giả thiết mức hao phí nguyên liệu để sản xuất một đơn vị sản phẩm là đ.l.n.n có phân phối chuẩn.
  51. Giải: Gọi mức nguyên liệu hao phí trung bình để sản xuất một đơn vị sản phẩm là . Ta cần ước lượng  với độ tin cậy 95%. n = 25 < 30 ; 2 chưa biết. x = 20,07 ; s = 0,4537
  52. Với độ tin cậy 1 = 95% , tra bảng phân phối Student với bậc tự do n 1 = 25 1 = 24 ta được: t0,025 = 2,064
  53. Vậy: 0,4537  = 2,064 0,187 25 Khoảng tin cậy của  là: (20,07 0,187 ; 20,07 + 0,187) Hay: (19,883 <  < 20,257) gr
  54. 3- Ước lượng tỷ lệ của tổng thể Giả sử tỷ lệ tổng thể (p) chưa biết, ta cần ước lượng p với độ tin cậy 1 - Để cho việc giải bài toán được đơn giản, ta thường yêu cầu kích thước mẫu n khá lớn để có thể sử dụng định lý Lindeberg - Levy.
  55. Theo định lý Lindeberg - Levy, đại lượng ngẫu nhiên: F p Z = pq / n có phân phối xấp xỉ N(0, 1)
  56. Do n khá lớn nên ta có thể thay pq bằng F (1 F). Áp dụng phương pháp đã nêu ở phần 2 ta có ước lượng khoảng của p là: (f -  < p < f + ) f(1 f ) Trong đó:  = z /2 n
  57. Thí dụ: Để ng/c nhu cầu tiêu dùng của một loại hàng ở một thành phố, người ta tiến hành điều tra nhu cầu tiêu dùng về mặt hàng này ở 100 hộ thì thấy có 60 hộ có nhu cầu về loại hàng đó. Hãy ước lượng tỷ lệ hộ có nhu cầu về mặt hàng này của thành phố với độ tin cậy 95%.
  58. Giải: Gọi tỷ lệ gia đình có nhu cầu về mặt hàng này là p (p chưa biết). Ta cần ước lượng p với độ tin cậy 95%. Theo giả thiết của bài toán ta có:
  59. Tỷ lệ gia đình có nhu cầu về mặt hàng này của mẫu là: 60 f 0,6 100 1 = 0,95 z /2 = 1,96
  60. 0,6(1 0,6)  = 1,96 100 = 0,096 Vậy khoảng tin cậy của p (với độ tin cậy 95%) là: (0,6 0,096 ; 0,6 + 0,096) (50,4% < p < 69,6%)
  61. 4- Xác định kích thước mẫu Vấn đề đặt ra là: khi ước lượng  (hoặc p), ta muốn độ tin cậy 1 và độ chính xác  đạt được ở một mức nào đó cho trước thì cần kích thước mẫu (n) tối thiểu là bao nhiêu ?
  62. 1- Xác định kích thước mẫu khi ước lượng trung bình tổng thể a- Nếu biết Var(X) = 2 Từ công thức:   = z /2 2 n  suy ra: n z / 2 
  63. b- Nếu chưa biết 2 , khi đó ta căn cứ vào mẫu đã cho (nếu chưa có mẫu thì ta có thể tiến hành lấy mẫu với kích thước n1 30) để tính s. Từ đó tính n theo công thức: 2 s n z / 2 
  64. * Chú ý: Nếu bài toán thực tế đòi hỏi n phải là số nguyên nhưng khi tính n theo các công thức trên ta thường được kết quả là số không nguyên, khi đó ta lấy phần nguyên của kết quả cộng với 1.
  65. Thí dụ: Khảo sát thu nhập của 100 người của một ngành, người ta tính được: s = 1,94936. Nếu muốn ước lượng thu nhập trung bình của một người ở ngành này với độ tin cậy 98% và độ chính xác  = 0,4 triệu đ/tháng thì cần khảo sát thu nhập của bao nhiêu người?
  66. Giải: Ta cần xác định kích thước mẫu (n) khi ước lượng trung bình tổng thể với độ tin cậy 98% và độ chính xác  = 0,4. Với 1- = 98% thì z0,01= 2,326. Vậy: 2 1,94936 n 2,326 129 0,4
  67. 2- Xác định kích thước mẫu khi ước lượng tỷ lệ tổng thể Nếu biết f , từ công thức: f(1 f )  = z /2 n ta suy ra: 2 f(1 f ) n = (z /2)  2
  68. Nếu không biết f, từ công thức: pq  = z /2 n suy ra: (z )2 n = / 2 42
  69. 5- Xác định độ tin cậy Khi tìm ước lượng khoảng của  (hoặc p), với kích thước mẫu (n) và độ chính xác  cho trước thì độ tin cậy của ước lượng khoảng sẽ đạt được bao nhiêu %?
  70. 1- Xác định độ tin cậy khi ước lượng trung bình tổng thể Từ công thức: s  = z /2 suy ra: n  n z = /2 s
  71. Sau khi tính được z /2 ta tra bảng hàm Laplace để tìm (z /2) Độ tin cậy 1 được xác định theo công thức: 1 = 2(z /2)
  72. 2- Xác định độ tin cậy khi ước lượng tỷ lệ tổng thể f(1 f ) Từ công thức:  = z /2 n suy ra:  n z /2 = f(1 f )
  73. Độ tin cậy được xác định theo công thức: 1 = 2(z /2) Như vậy, trong 3 tham số: n ;  ; z /2. nếu ta biết được hai tham số thì có thể tính được tham số còn lại (công thức tính suy ra từ công thức tính  trong các bài toán ước lượng).
  74. TÓM TẮT CHƯƠNG 7 Ước lượng điểm Ước lượng khoảng Ước Ước lượng  Khái lượng Khái niệm không niệm Biết Chưa Chưa Biết 2 Biết 2 2 chệch n 30 n < 30 Ước lượng p Ưl k/chệch của  Ưl  Ưl p Xác định n Ưl k/chệch của 2 Ưl  Xác định 1- Ưl k/chệch của p Ưl p
  75. Bài tập 7.6; 7.7; 7.8; 7.17 7.18; 7.19; 7.26. Hết chương 7