Bài giảng Lý thuyết xác suất thống kê - Chương 6: Mẫu ngẫu nhiên - Trường Đại học Kinh tế Thành phố Hồ Chí Minh

pdf 78 trang cucquyet12 6210
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất thống kê - Chương 6: Mẫu ngẫu nhiên - Trường Đại học Kinh tế Thành phố Hồ Chí Minh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_thong_ke_chuong_6_mau_ngau_nhie.pdf

Nội dung text: Bài giảng Lý thuyết xác suất thống kê - Chương 6: Mẫu ngẫu nhiên - Trường Đại học Kinh tế Thành phố Hồ Chí Minh

  1. Phần 2 MẪU NGẪU NHIÊN I- TỔNG THỂ: 1- Khái niệm:
  2. Khi nghiên cứu các vấn đề kinh tế - xã hội, cũng như nhiều vấn đề thuộc các lĩnh vực khác, người ta thường phải khảo sát một hay một số dấu hiệu nào đó. Những thông tin về các dấu hiệu này được thu thập trên nhiều phần tử khác nhau.
  3. Tập hợp tất cả các phần tử mà từ các phần tử từ đó ta có thể khảo sát, thu thập những thông tin về các dấu hiệu ta cần nghiên cứu được gọi là tổng thể. (Population)
  4. Các thí dụ:  Nghiên cứu về năng suất lúa ở vùng đồng bằng sông Cửu Long, tổng thể là số héc ta trồng lúa ở vùng này.
  5.  Khảo sát thu nhập của những người làm việc ở một công ty, tổng thể là những người làm việc ở công ty này.  Khảo sát doanh số bán của một siêu thị trong một năm (365 ngày), tổng thể là 365 ngày trong năm.
  6. Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây:  N: Số phần tử của tổng thể và được gọi là kích thước của tổng thể.
  7.  X*: Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi là chỉ tiêu). Khi nói nghiên cứu một tổng thể có nghĩa là nghiên cứu dấu hiệu X* mà những thông tin về X* được khảo sát, thu thập trên các phần tử của tổng thể.
  8.  xi (i = 1, 2, , k) là các giá trị của dấu hiệu X* đo được trên các phần tử của tổng thể. xi là những thông tin cần thiết để ta nghiên cứu về dấu hiệu X*, còn các phần tử của tổng thể là những đối tượng mang thông tin.
  9.  Ni (i = 1, 2, . . . , k): Tần số của xi - là số phần tử nhận giá trị xi. k  Ni = N i 1  pi (i = 1, 2, . . . , k): Tần suất của x i Ni pi = N
  10. Bảng cơ cấu của tổng thể theo dấu hiệu X* thể hiện sự tương ứng giữa xi, Ni, pi. Giaù trò cuûa X* x1 x2 . . . xk Taàn soá (Ni) N1 N2 . . . Nk Taàn suaát (pi) p1 p2 . . . pk
  11. * Chú ý: Có thể lập bảng cơ cấu của tổng thể dưới dạng cột. 2- Các số đặc trưng của tổng thể: 1- Trung bình của tổng thể
  12. Trung bình của tổng thể (ký hiệu là ), được xác định theo công thức: k  = xi .p i i 1
  13. 2- Phương sai của tổng thể Phương sai của tổng thể (ký hiệu là 2) được xác định theo công thức: k 2 2  = xi  pi i 1
  14. 3- Độ lệch chuẩn của tổng thể Độ lệch chuẩn của tổng thể (ký hiệu là ) được xác định theo công thức:  =  2
  15. 4- Tỷ lệ tổng thể Giả sử tổng thể gồm N phần tử, trong đó có M phần tử có tính chất A . Gọi p = M là tỷ lệ các phần tử có N tính chất A của tổng thể (gọi tắt là tỷ lệ tổng thể).
  16. Thí dụ: Ngành cao su có 500.000 công nhân. Để nghiên cứu mức sống của họ, người ta khảo sát chỉ tiêu X*:”Thu nhập thực tế của công nhân ngành cao su” và giả sử thu được các số liệu cho ở bảng sau:
  17. II- KHÁI NIỆM MẪU: Để lập bảng cơ cấu của tổng thể từ đó ta tính được trung bình, phương sai của tổng thể . . . thì ta cần khảo sát toàn bộ N phần tử của tổng thể. Cách làm này trong thực tế sẽ gặp phải những khó khăn sau đây:
  18. Phải chịu chi phí lớn về tiền của, thời gian, nhân lực, phương tiện, . . . Có nhiều trường hợp khi điều tra sẽ phá hủy đi các phần tử được điều tra. Do vậy về phương diện kinh tế thì không thể điều tra toàn bộ được.
  19. Có những trường hợp ta không thể xác định được toàn bộ N phần tử của tổng thể. Trường hợp này thường xảy ra trong việc điều tra các vấn đề thuộc về lĩnh vực xã hội học.
  20. Vì vậy, từ thế kỷ 17, phương pháp nghiên cứu mẫu đã ra đời, ngày càng phát triển và được sử dụng rộng rãi trong nhiều lĩnh vực. Tư tưởng cơ bản của phương pháp mẫu như sau:
  21. Từ tổng thể ta lấy ra n phần tử và đo lường giá trị của dấu hiệu X* trên chúng, n phần tử này lập nên một mẫu. Số phần tử của mẫu (n) được gọi là kích thước mẫu.
  22. Thông thường kích thước của mẫu nhỏ hơn nhiều so với kích thước của tổng thể. Vì vậy ta có khả năng thực tế để thu thập, xử lý và khai thác thông tin mẫu một cách nhanh chóng, toàn diện hơn.
  23. Sử dụng các phương pháp toán học người ta tiến hành suy rộng kết quả nghiên cứu trên mẫu cho toàn bộ tổng thể, đó là mục đích cuối cùng của phương pháp mẫu.
  24. Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể. Muốn vậy, khi lấy mẫu phải đảm bảo tính ngẫu nhiên, không chọn mẫu theo một tiêu chuẩn chủ quan đã định trước.
  25. Trong thực tế có nhiều cách lấy mẫu:  Lấy mẫu ngẫu nhiên:  Chọn mẫu cơ giới  Chọn mẫu bằng cách phân lớp  Lấy mẫu có hoàn lại (có lặp)  Laáy maãu khoâng hoaøn laïi (khoâng laëp)
  26. III- MÔ HÌNH XÁC SUẤT CỦA TỔNG THỂ VÀ MẪU 1- Đại lượng ngẫu nhiên gốc vàø phân phối gốc Có thể mô hình hoá dấu hiệu X* bằng một đại lượng ngẫu nhiên.
  27. Lấy ngẫu nhiên từ tổng thể ra một phần tử và gọi X là giá trị của dấu hiệu X* đo được trên phần tử lấy ra thì X là ĐLNN có phân phối xác suất như sau: X x1 x2 . . . xk P p1 p2 . . . pk
  28. Như vậy dấu hiệu mà ta nghiên cứu (X*) được mô hình hóa bởi đại lượng ngẫu nhiên X. Phân phối xác suất của X được gọi là phân phối gốc.
  29. a- Kỳ vọng toán: k E(X)  xipi i 1 Trung bình của tổng thể chính là kỳ vọng toán của đ.l.n.n X.
  30. b- Phương sai: k 2 Var(X) xi E(X) p i i 1 Nhưng E(X) = , Do đó: k 2 Var(X) (xi ) pi i 1
  31. Phương sai của đại lượng ngẫu nhiên X chính là phương sai của tổng thể: Var(X) = 2 3- Mẫu ngẫu nhiên
  32. Cho đ.l.n.n X với phân phối xác suất nào đó. Một mẫu ng.nhiên kích thước n được thành lập từ X là n đ.l.n.n độc lập, có cùng phân phối xác suất với X. Ký hiệu mẫu ng.n kích thước n được xây dựng từ X là: WX = (X1, X2, . . . . , Xn)
  33. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX, tức là thực hiện một phép thử đối với mỗi thành phần (Xi) của mẫu. Giả sử Xi nhận giá trị xi ( i = 1, 2, . . . , n)
  34. Các giá trị x1, x2, . . . ., xn tạo thành một giá trị của mẫu ngẫu nhiên, hay còn được gọi là một mẫu cụ thể. Ký hiệu là Wx = (x1, x2, . . . , xn) Thí dụ: Kết quả thi môn toán của một lớp gồm 50 sinh viên như sau:
  35. Ñieåm thi 4 5 6 7 9 Soá s/v 8 15 13 9 5 Gọi X là điểm thi môn toán của một sinh viên chọn ng.n trong danh sách của lớp thì X là đ.l.n.n có phân phối xác suất như sau:
  36. X 4 5 6 7 9 P 0,16 0,3 0,26 0,18 0,1
  37. Từ lớp này ta lấy một mẫu gồm 5 s/v. Gọi Xi ( i =1, 2, 3, 4, 5) là điểm thi môn toán của s/v thứ i được lấy 1,5 vào mẫu. Vậy ta có mẫu ngẫu nhiên kích thước n = 5 được xây dựng từ X: WX = (X1, X2, X3, X4, X5)
  38. Thực hiện một phép thử đối với mẫu ng.n này, tức chọn ngẫu nhiên 5 s/v của lớp. Giả sử điểm thi của s/v thứ nhất, thứ hai, thứ ba, thứ tư, thứ năm tương ứng là 5, 9, 5, 7, 4, thì ta có một mẫu cụ thể là: Wx = (5, 9, 5, 7, 4)
  39. Thực hiện một phép thử khác đối với WX (tức chọn 5 s/v khác của lớp) ta lại được một mẫu cụ thể khác, chẳng hạn: Wx = (4, 7, 9, 9, 5) Thí dụ 2: (Đọc giáo trình)
  40. IV- CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU 1- Trung bình mẫu: a- Định nghĩa: Cho mẫu ng.n kích thước n, được xây dựng từ đ.l.n.n X: WX = (X1, X2, . . . , Xn)
  41. Trung bình mẫu ngẫu nhiên (ký hiệu là X ) được định nghĩa: 1 n X  Xi n i 1
  42. Nếu có mẫu cụ thể: Wx = (x1, x2, . . . , xn) thì ta sẽ tính được giá trị của X (ký hiệu là x ) n i = 1 xi x = n
  43. b- Tính chất: Nếu đại lượng ngẫu nhiên gốc X có kỳ vọng toán: E(X) =  và phương sai: Var(X) = 2 thì: 2 E(X ) =  và Var( X) = n
  44. Như vậy, bất kể phân phối xác suất của đ.l.n.n gốc như thế nào, X cũng có kỳ vọng toán bằng kỳ vọng của đ.l.n.n gốc E(X) = E(X), và phương sai của X nhỏ hơn phương sai của đ.l.n.n gốc n lần.
  45. Chú ý: Nếu lấy mẫu không hoàn lại thì: N - n 2 Var(X) =  N - 1 n
  46. Thí dụ: Tổng thể là tập hợp gồm 5 công ty A, B, C, D, E với lợi nhuận (tỷ đồng/năm) lần lượt là: 29, 31, 32, 33, 36. Lấy mẫu ng.n kích thước n = 4 từ tổng thể này. Tính kỳ vọng toán và phương sai của trung bình mẫu ng.n trong hai trường hợp: a- Chọn mẫu có lặp; b- Chọn mẫu không lặp.
  47. c- Phân phối xác suất của X Phân phối xác suất của X phụ thuộc vào phân phối xác suất của đ.l.n.n gốc. Nếu X có phân phối chuẩn N(; 2) thì X có phân phối chuẩn N( ; 2/n).
  48. 2- Phương sai mẫu a- Định nghĩa: Cho mẫu ngẫu nhiên WX = (X1, X2, , Xn) Phương sai mẫu ngẫu nhiên (ký hiệu là S2) được định nghĩa: n 2 1 2 S =  (X i X) n 1 i 1
  49. Nếu có mẫu cụ thể: Wx = (x1, x2, . . . , xn) thì S2 sẽ nhận giá trị: n 2 1 2 s = 1(x - x) n- i=1 i s2 gọi là phương sai của mẫu cụ thể.
  50. b- Tính chất của S2 Nếu E(X) =  ; Var(X) = 2 E(S2) = 2 Kỳ vọng toán của phương sai mẫu bằng phương sai của đại lượng ngẫu nhiên gốc X.
  51. c- Định lý 1: Giả sử X ~ N(; 2) và WX = (X1, X2, . . . , Xn) là mẫu ngẫu nhiên kích thước n được thành lập từ X. Khi đó:
  52. n (X - )2 i 2 2 ~  (n) i= 1  (n -1)S2 ~ 2(n-1) 2
  53. c- Định lý 2: X ~ N(; 2) thì: X -   T(n-1) S/n
  54. 3- Độ lệch chuẩn mẫu Độ lệch chuẩn của mẫu ngẫu nhiên (ký hiệu S) là căn bậc hai của phương sai mẫu: S = S 2
  55. Nếu có mẫu cụ thể thì độ lệch chuẩn của mẫu cụ thể là một giá trị của S (ký hiệu là s) s = s2
  56. 4- Tỷ lệ mẫu Tỷ lệ mẫu ngẫu nhiên (ký hiệu F) được định nghĩa như sau: 1 n F =  X i n i 1
  57. Xi (i = 1, 2, , n) là số phần tử có tính chất A có trong lần lấy phần tử thứ i vào mẫu. Xi nhận giá trị 0 nếu phần tử thứ i lấy vào mẫu không có tính chất A; Xi nhận giá trị 1 nếu phần tử thứ i lấy vào mẫu có tính chất A.
  58. Nếu có mẫu cụ thể, ta sẽ tính được giá trị của Fn (ký hiệu là f) n f = A n Trong đó nA là số phần tử có tính chất A có trong mẫu cụ thể; n là kích thước mẫu.
  59. V- PHƯƠNG PHÁP TÍNH CÁC SỐ ĐẶC TRƯNG CỦA MẪU 1- Trường hợp số liệu của mẫu cho dưới dạng gồm n giá trị quan sát n 1 n xi X = i=1 2 2 2 s = xi - n(x)  n n-1 i=1
  60. 2- Trường hợp số liệu của mẫu cho dưới dạng có tần số ni (nói chung ni > 1): k i=1nixi X = n k s2 = 1 n x 2 - n(x)2 n-1 i=1 i i
  61. Thí dụ: Quan sát điểm thi môn Toán cao cấp của 10 sinh viên được chọn ngẫu nhiên từ một lớp ta thu được các số liệu sau: 5; 6; 7; 4; 6; 9; 4; 5; 5; 7. Tính x và s của mẫu này.
  62. Giải: 10 X = 58 = 5,8  xi 58; i 1 10 10 2 xi 358 i 1 1 s 2 358 10(5,8)2  2,4 9 s 2,4 1,5492
  63. * Với các số liệu cho ở thí dụ trên, ta có thể trình bày số liệu quan sát của mẫu này dưới dạng có tần số như sau: xi 4 5 6 7 9 ni 2 3 2 2 1
  64. * Chú ý: Nếu số liệu của mẫu được chia thành từng khoảng, thì khi tính ta thay mỗi khoảng bằng giá ' 'trị' trung tâm của khoảng đó. xi ;xi x' x'' x i i i 2 ( i = 1, 2, . . . , k)
  65. * Thí dụ: Bảng dưới đây là số liệu quan sát về thu nhập của một số người làm việc ở một công ty (đơn vị: ngàn đồng/tháng). Hãy tính trung bình mẫu và phương sai mẫu.
  66. Thu nhaäp Soá xi ngöôøi 5 – 7 14 6 7 – 9 26 8 9 – 11 38 10 11 – 13 25 12 13 – 15 20 14 15 – 17 16 16 17 – 19 12 18 19 – 23 9 21
  67. x = 11,95625 S = 4,019366
  68. Tổng kết chương 6 Tổng thể Mẫu Tham số k/niệm Tham số k/niệm đ/trưng đ/trưng TB tổng thể () TB mẫu (x) Cách 2 2 Psai tổng thể ( ) Psai mẫu (s ) tính 2 Độ lệch chuẩn TT() Độ l.ch mẫu (s) X; s ; s; f Tỷ lệ tổng thể (p) Tỷ lệ mẫu (f)
  69. Bài tập: 6.7; 6.8; 6.9; 6.10; 6.11; 6.12; Hết chương 6