Bài giảng Lý thuyết thống kê

ppt 161 trang cucquyet12 6060
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_ly_thuyet_thong_ke.ppt

Nội dung text: Bài giảng Lý thuyết thống kê

  1. BÀI GIẢNG LÝ THUYẾT THỐNG KÊ (Dành cho các lớp ngoài chuyên ngành Thống kê)
  2. Chương I: ĐỐI TƯỢNG CỦA THỐNG KÊ HỌC • Thống kê là gì? • Đối tượng nghiên cứu của thống kê • Một số khái niệm dùng trong thống kê
  3. Thống kê là gì? Khái niệm: Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. Thống kê bao gồm: • Thống kê mô tả: thu thập số liệu, mô tả và trình bày số liệu, tính toán các đặc trưng đo lường • Thống kê suy diễn: ước lượng, kiểm định, phân tích mối liên hệ, dự đoán trên cơ sở các thông tin thu được từ mẫu.
  4. Đối tượng nghiên cứu của thống kê • Nghiên cứu mặt lượng trong mối liên hệ với mặt chất • Những hiện tượng kinh tế - xã hội số lớn • Trong điều kiện thời gian và địa điểm cụ thể
  5. Các hiện tượng thống kê nghiên cứu • Các hiện tượng về nguồn tài nguyên, môi trường, của cải tích luỹ của một địa phương, vùng, quốc gia. • Các hiện tượng về sản xuất, phân phối, lưu thông, tiêu dùng sản phẩm. • Các hiện tượng về dân số, nguồn lao động. • Các hiện tượng về đời sống vật chất, văn hoá của dân cư. • Các hiện tượng về sinh hoạt chính trị xã hội.
  6. Một số khái niệm dùng trong thống kê Tổng thể thống kê và đơn vị tổng thể: • Tổng thể thống kê (còn gọi là tổng thể chung): là tập hợp các đơn vị (hay phần tử) thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lương của chúng theo một hoặc một số tiêu thức nào đó. • Đơn vị tổng thể: là các phần tử cấu thành tổng thể thống kê
  7. Các loại tổng thể • Tổng thể bộc lộ: bao • Tổng thể đồng chất: gồm các đơn vị (hoặc bao gồm các đơn vị phần tử) có thể trực tiếp (hoặc phần tử) giống quan sát hoặc nhận biết. nhau ở một hay 1 số đặc điểm chủ yếu liên • Tổng thể tiềm ẩn: bao quan đến mục đích gồm các đơn vị (hoặc n/c phần tử) không trực • Tổng thể không đồng tiếp quan sát hoặc nhận chất: bao gồm các biết được. đơn vị (hoặc phần tử) khác nhau
  8. Tổng thể mẫu: là tổng thể bao gồm một số đơn vị được chọn ra từ tổng thể chung theo một phương pháp lấy mẫu nào đó. • Quan sát: là cơ sở để thu thập số liệu và thông tin cần nghiên cứu.
  9. Tiêu thức thống kê: là khái niệm dùng để chỉ các đặc điểm của đơn vị tổng thể • Tiêu thức thuộc tính: phản ánh tính chất hay loại hình của đơn vị tổng thể, không có biểu hiện trực tiếp bằng các con số. • Tiêu thức số lượng: có biểu hiện trực tiếp bằng con số. Bao gồm: - lượng biến rời rạc. - lượng biến liên tục.
  10. Chỉ tiêu thống kê: là các trị số phản ánh các đặc điểm, các tính chất cơ bản của tổng thể thống kê trong điều kiện thời gian và không gian xác định. • Chỉ tiêu khối lượng: biểu hiện quy mô của tổng thể • Chỉ tiêu chất lượng: biểu hiện tính chất, trình độ phổ biến, quan hệ so sánh trong tổng thể
  11. Chương II: QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ • Điều tra thống kê • Tổng hợp thống kê • Phân tích thống kê
  12. Khái quát quá trình nghiên cứu thống kê • Xác định mục đích nghiên cứu • Xây dựng hệ thống các khái niệm, chỉ tiêu thống kê • Điều tra thống kê • Xử lý số liệu: tổng hợp số liệu, chọn phần mềm xử lý, phân tích sơ bộ, lựa chọn phương pháp thống kê • Phân tích, dự đoán xu hướng phát triển • Báo cáo và truyền đạt kết quả nghiên cứu
  13. Các loại thang đo • Thang đo định danh: dùng cho các tiêu thức thuộc tính, mục đích để phân loại các đối tượng • Thang đo thứ bậc: biểu hiện của tiêu thức có quan hệ thứ bậc hơn kém • Thang đo khoảng: là thang đo thứ bậc nhưng đã biểu hiện mức độ hơn kém giữa các bậc. • Thang đo tỷ lệ: là thang đo khoảng nhưng đã có một trị số “0” thật sự ở bậc nào đó.
  14. THU THẬP DỮ LIỆU THỐNG KÊ (Điều tra thống kê) Điều tra thống kê tổ chức một cách khoa học và theo một kế hoạch thống nhất việc thu thập, ghi chép tài liệu ban đầu về các hiện tượng và quá trình kinh tế xã hộI để phục vụ cho những mục đích nhất định.
  15. XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP • Xác định rõ những dữ liệu cần thu thập. • Xác định rõ thứ tự ưu tiên của những dữ liệu cần thu thập. • Xác định những dữ liệu cần thu thập phải xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu. Ví dụ: Nghiên cứu vấn đề sinh viên đi làm thêm có ảnh hưởng đến kết quả học tập không? Hai nhóm dữ liệu chính là: - Đi làm thêm. - Kết quả học tập.
  16. DỮ LIỆU ĐỊNH TÍNH VÀ DỮ LIỆU ĐỊNH LƯỢNG • Dữ liệu định tính: phản ánh tính chất, sự hơn kém của các đối tượng nghiên cứu (nam đi làm thêm nhiều hay nữ đi làm thêm nhiều). Thu thập bằng thang đo định danh hay thứ bậc. • Dữ liệu định lượng: phản ánh mức độ hay mức độ hơn kém của các đối tượng nghiên cứu (thời gian làm thêm của sinh viên bao nhiêu giờ một ngày). Thu thập bằng thang đo khoảng hay thứ bậc.
  17. DỮ LIỆU THỨ CẤP VÀ DỮ LIỆU SƠ CẤP • Dữ liệu thứ cấp: là dữ liệu thu thập từ nguồn có sẵn, đó chính là những dữ liệu đã qua tổng hợp, xử lý. Ví dụ: khi nghiên cứu về ảnh hưởng của việc đi làm thêm đến kết quả học tập, những dữ liệu liên quan đến kết quả học tập lấy từ phòng đào tạo hoặc thư ký khoa. • Dữ liệu sơ cấp: là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu. Ví dụ: những dữ liệu có liên quan đến việc đi làm thêm của sinh viên không có sẵn phải trực tiếp thu thập từ sinh viên.
  18. NGUỒN DỮ LIỆU Dữ liệu thứ cấp: Dữ liệu sơ cấp: • Các báo cáo của các • Thu thập qua các đơn vị. cuộc điều tra khảo sát. • Các số liệu do các cơ Bao gồm: quan trực thuộc • Điều tra thường chính phủ cung cấp. xuyên và điều tra • Số liệu từ báo chí. không thường xuyên • Các công ty nghiên • Điều tra toàn bộ và cứu và cung cấp điều tra không toàn thông tin. bộ
  19. CÁC PHƯƠNG PHÁP THU THẬP DỮ LIỆU BAN ĐẦU Thu thập trực tiếp: • Quan sát: quan sát các hành động, thái độ của đối tượng khảo sát trong những tình huống nhất định. • Phỏng vấn trực tiếp: trực tiếp hỏi đối tượng được điều tra và tự ghi chép dữ liệu vào bản câu hỏi hay phiếu điều tra. Thu thập gián tiếp: thu thập tài liệu qua thư từ, điện thoại hoặc qua chứng từ sổ sách.
  20. XÂY DỰNG KẾ HOẠCH ĐIỀU TRA • Mô tả mục đích điều tra • Xác định đối tượng điều tra và đơn vị điều tra • Nội dung điều tra • Biểu điều tra và bản giải thích cách ghi biểu • Thời điểm và thời kỳ điều tra • Một số vấn đề về phương pháp, tổ chức và tiến hành điều tra
  21. SAI SỐ TRONG ĐIỀU TRA THỐNG KÊ Các loại sai số: • Sai số do đăng ký • Sai số do tính chất đại biểu Biện pháp hạn chế: • Chuẩn bị tốt. • Kiểm tra một cách có hệ thống toàn bộ cuộc điều tra. • Làm tốt công tác tuyên truyền.
  22. Tổng hợp thống kê Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hoá một cách khoa học các tài liệu ban đầu đã thu thập được trong điều tra thống kê TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ Sử dụng bảng thống kê
  23. NHIỆM VỤ • Từ những thông tin riêng biệt trên từng đơn vị, thực hiện sắp xếp, phân loại. • Giúp người nghiên cứu thấy được các đặc trưng của mẫu hay của tổng thể nghiên cứu. Trường hợp sắp xếp: • Sắp xếp đơn giản theo một trật tự nào đó: tăng dần hoặc giảm dần (đối với dữ liệu định lượng) hoặc theo trật tự quy định nào đó (đối với dữ liệu định tính) • Phân tổ thống kê.
  24. KHÁI NIỆM PHÂN TỔ Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để sắp xếp các đơn vị quan sát vào các tổ, nhóm có tính chất khác nhau, hay nói cách khác là chia tổng thể hay mẫu nghiên cứu thành các tổ nhóm có tính chất khác nhau.
  25. CÁC BƯỚC TIẾN HÀNH PHÂN TỔ • Lựa chọn tiêu thức phân tổ: chọn đặc trưng cơ bản để làm căn cứ phân tổ. • Xác định số tổ: - đối với tiêu thức thuộc tính (phân ra trong trường hợp có ít hoặc nhiều biểu hiện) - đối với tiêu thức số lượng (phân ra trong trường hợp có ít hoặc nhiều trị số)
  26. CÔNG THỨC XÁC ĐỊNH TRỊ SỐ KHOẢNG CÁCH TỔ • Đối với trị số quan sát liên tục: x − x h = max min k • Đối với trị số quan sát rời rạc: (x − x ) − (k −1) h = max min k
  27. PHÂN TỔ MỞ • Là phân tổ mà tổ đầu tiên không có giới hạn dưới, tổ cuối cùng không giới hạn trên, các tổ còn lại có khoảng cách tổ đều hoặc không đều. • Khi tính toán đối với tài liệu phân tổ mở thì quy ước lấy khoảng cách của tổ mở bằng với khoảng cách tổ của tổ đứng gần nó nhất.
  28. Phân tích thống kê Phân tích thống kê là nêu lên một cách tổng hợp qua các biểu hiện bằng số lượng bản chất và tính quy luật của hiện tượng và quá trình kinh tế xã hội trong điều kiện thời gian và địa điểm cụ thể. Bao gồm: • Phân tích tình hình hoàn thành kế hoạch • Phân tích bản chất, tính quy luật của các hiện tượng và quá trình kinh tế xã hội
  29. Các bước tiến hành phân tích thống kê • Xác định mục đích và nhiệm vụ cụ thể của phân tích thống kê • Lựa chọn và đánh giá tài liệu dùng để phân tích • Xác định phương pháp và các chỉ tiêu phân tích • Kết luận và đề xuất các quyết định quản lý
  30. Chương 4 MÔ TẢ DỮ LIỆU BẰNG CÁC ĐẶC TRƯNG ĐO LƯỜNG
  31. SỐ TUYỆT ĐỐI Khái niệm: là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa điểm cụ thể. Các loại số tuyệt đối: • Số tuyệt đối thời điểm: phản ánh quy mô, khối lượng của hiện tượng tại một thời điểm nhất định. • Số tuyệt đối thời kỳ: phản ánh quy mô, khối lượng của hiện tượng trong một khoảng thờI gian nhất định.
  32. ĐƠN VỊ TÍNH CỦA SỐ TUYỆT ĐỐI • Đơn vị hiện vật: là đơn vị tính phù hợp vớI đặc điểm vật lý của hiện tượng. Bao gồm: đơn vị hiện vật tự nhiên và đơn vị hiện vật tiêu chuẩn. • Đơn vị hiện vật quy đổi: chọn một sản phẩm làm gốc rồi quy đổi các sản phẩm khác cùng tên nhưng có quy cách, phẩm chất khác nhau ra sản phẩm đó theo một hệ số quy đổi.
  33. ĐƠN VỊ TÍNH CỦA SỐ TUYỆT ĐỐI • Đơn vị tiền tệ: biểu hiện giá trị sản phẩm thông qua giá của nó. Để đảm bảo tính so sánh qua thời gian, tránh ảnh hưởng của thay đổI giá cả thường dùng giá so sánh hoặc điều chỉnh thông qua chỉ số lạm phát giá cả. • Đơn vị thờI gian lao động: như giờ công, ngày công , biểu hiện lượng lao động hao phí để sản xuất ra sản phẩm. Dùng nhiều trong định mức SX.
  34. SỐ TƯƠNG ĐỐI Khái niệm: là chỉ tiêu biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng nghiên cứu. Có 2 trường hợp: so sánh hiện tượng cùng loạI và so sánh hiện tượng khác loạI có liên quan vớI nhau. Hình thức biểu hiện: số lần, số % hoặc đơn vị kép.
  35. Các loại số tương đối: • Số tương đối động thái (tốc độ phát triển) là kết quả so sánh giữa hai mức độ của cùng hiện tượng nhưng khác nhau về thời gian. Công thức: y t = 1 y0
  36. • Số tương đối kế hoạch: dùng để lập kế hoạch và đánh giá hoàn thành kế hoạch chỉ tiêu kinh tế - xã hội. Bao gồm: - Số tương đối nhiệm vụ kế hoạch: yk tnk = y0
  37. - Số tương đối hoàn thành kế hoạch: y1 thk = yk Mối quan hệ: y y y 1 = k 1 y0 y0 yk
  38. • Số tương đối kết cấu: xác định tỷ trọng của mỗI bộ phận cấu thành tổng thể yi di =  yi
  39. • Số tương đối cường độ: là kết quả so sánh mức độ của hai hiện tượng khác nhau nhưng có liên quan đến nhau. Ví dụ: Mật độ dân số; GDP tính trên đầu người. • Số tương đối không gian: là kết quả so sánh giữa hai mức độ của một hiện tượng nhưng khác nhau về không gian. Ví dụ: so sánh giá gạo ở chợ A với giá gạo ở chợ B
  40. CÁC ĐẶC TRƯNG ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG Số trung bình Là chỉ tiêu biểu hiện mức độ đại diện của một tiêu thức số lượng nào đó trong 1 tổng thể bao gồm nhiều đơn vị cùng loại
  41. • SỐ TRUNG BÌNH CÔNG ( SỐ TB SỐ HỌC ) • Tính từ tài liệu rời rạc, không phân tổ, mỗi lượng biến xi có tần số fi bằng nhau. • => Số trung bình cộng tính từ tổng thể chung : N  X i Trong đó : x+ x + + x  ==1 2Ni= 1 -µ- Số trung bình của tổngNN thể chung. - Xi ( i=1->N) – Trị số của lượng biến thức i - N – Số đơn vị tổng thể.
  42. • SỐ TRUNG BÌNH TÍNH TỪ TỔNG THỂ MẪU n X x+ x + + x  i X ==1 2ni= 1 nn _ Trong đó : X - Số trung bình mẫu; n - Tổng số đơn vị mẫu. Ví dụ : Thời gian ôn tập ở nhà môn học LTTK của 5 sinh viên trước đợt kiểm tra học kỳ : 20, 23, 25,30,32 giờ. Thời gian ôn thi trung bình của 1 SV : 20+ 23 + 25 + 30 + 32 130 X = = = 26 55
  43. • * Số trung bình cộng gia quyền (Số TB số học có trọng số) • Khi mỗi lượng biến xi có thể gặp nhiều lần, tức là có tần số fi khác nhau. • Đối với tổng thể chung : k  Xfii x1 f 1+ x 2 f 2 + + xk f k i= 1  ==k f12+ f + + fk  fi i=1 k  Xfii  = i=1 N
  44. k • Đối với mẫu :  Xfii i=1 X = k  fi i=1 Ví dụ : Mức năng suất lao động ngày của 32 CN trong 1 tổ sản xuất ( kg/Ngày ): Möùc NSLÑ ngaøy 8 9 10 12 13 15 (kg /CN) Soá CN (ngöôøi) 4 7 5 6 5 5
  45. • Tính soá trung bình coäng gia quyeàn coù theå duøng quyeàn soá laø tæ troïng cuûa moãi toå chieám trong toång theå : k X=  Xii d i=1 Trong ñoù : di – Tæ troïng moãi toå chieám trong toång theå.
  46. Trong trường hợp mỗi tổ có 1 phạm vi lượng biến ta lấy trị số giữa làm lượng biến đại diện cho tổ đó để tính số trung bình • Trị số giữa của tổ = ( xmin + xmax) : 2 Trong đó :xmin ; xmax - Giới hạn dưới & giới hạn trên của tổ. • Nếu dãy số lượng biến có khoảng cách tổ mở : Căn cứ vào khoảng cách tổ của tổ đứng gần chúng để tính toán cho hợp lý .
  47. Ví dụ: Có số liệu về thời gian sử dụng được của 200 bóng đèn kiểu A được bán ngoài thị trường Thời gian ( tính bằng giờ) Số lượng bóng đèn Dưới 500 5 500-1000 13 1000-1500 57 1500-2000 85 2000-2500 26 2500-3000 8 3000 trở lên 6 Tổng 200
  48. • CHÚ Ý • Nếu : f1 = f2 = f3 = = fk = f thì : •  X i (XXi −= ) 0 X = N  Xfii X = • - Số trung bình tổ thứ i f •  i •
  49. • Ví dụ : Tài liệu về 2 tổ SX trong một phân xưởng : Toà saûn xuaát Soá Coâng nhaân Naêng suaát (ng) trung bình (kg/ng) Toå 1 200 32,2 Toå 2 300 30,8
  50. Số trung bình điều hoà Sử dụng trong trường hợp biết các lượng biến xi và tích (xifi) mà chưa biết tần số fi . Ví dụ :Tình hình về doanh số bán và giá bán sản phẩm dầu gội K của 1 Cty ở 4 thị trường quý 4/2005 Thị trường Giá đ/v Doanh số bán (1000đ/chai) (tr.đ) Hà nội 22 440 Đà nẳng 21 378 Tp.HCM 19 570 Cần thơ 20 420
  51. Giải Doanhsoban X = Sosanphamban 440+ 378 + 570 + 420 X = 440 378 570 420 + + + 22 21 19 20 1808 X==20315 d / c 89
  52. Nếu ký hiệu :Mi = xifi -Tổng cáclượng biến; xi- lượng biến M MMM+ + +  i X ==12 n MM MM 12+ + + ni x12 x xni x Số TB tính theo công thức trên gọi là số trung bình điều hoà gia quyền * Nếu các Mi bằng nhau ( M1=M2 = =Mn=M) , thì n X =  1 xi
  53. • Ví dụ 1: Có 3 công nhân cùng làm thời gian như nhau, sản xuất ra cùng loại sản phẩm K. Để làm ra 1 sp K, công nhân thứ 1 hết 30 phút, tương ứng công nhân thứ 2 và 3 là 28 và 35 phút. Tính thời gian trung bình để SX ra 1 SP K của 3 CN trên.
  54. Ví dụ 2 : Có 3 tổ CN cùng SX 1 loại SP trong 8 giờ. ▪ Tổ 1 có 9 CN, mỗi CN làm 1SP hết 32.5 phút. ▪ Tổ 2 có 12 CN, mỗi CN làm 1SP hết 34,6 phút. ▪ Tổ 3 có 15 CN , mỗi CN làm 1SP hết 36,0 phút. Tính thời gian hao phí trung bình làm ra 1SP của cả 3 tổ.
  55. Số trung bình nhân (Số TB hình học) • Sử dụng để tính tốc độ phát triển trung bình,tính từ những lượng biến có quan hệ tích số . • Có 2 loại : 1. Số trung bình nhân giản đơn: m m m X== x12. x xmi hayX X i=1
  56. 2. Số trung bình nhân gia quyền, sử dụng khi mỗi lượng biến xi có fi khác nhau f k  i fi ff12 ffki X== x12. x xki hayX X i=1 Trong đó : • Xi ( i=1->k) – Các trị số lượng biến. k  fmi = i=1 • ∏ - Ký hiệu của tích .
  57. • Ví dụ 1: Tổng doanh thu tại 1 Cty qua các năm. Năm 2000 2001 2002 2003 2004 2005 Tổng 200 210 215 226 242 250 doanh thu (tỷ đg) Tốc độ - 1,050 1,024 1,051 1,071 1,033 phát triển (lần) Tính tốc độ phát triển TB hàng năm về tổng DT thời kỳ 2000-2005.
  58. Ví dụ 2 : Tốc độ phát triển về doanh số bán mặt hàng K của Cty X qua các thời kỳ như sau : ➢Thời kỳ 1995-1998 :Tốc độ phát triển mỗi năm bằng 106,5%. ➢Thời kỳ 1998-2000 : Tốc độ phát triển mỗi năm bằng : 110,2%. ➢Thời kỳ 2000-2005:Tốc độ phát triển mỗi năm bằng : 112,5% . Tính tốc độ phát triển trung bình mỗi năm thời kỳ 1995-2005?
  59. MỐT Mốt là trị số lượng biến của 1 tiêu thức xuất hiện nhiều nhất trong một tổng thể hay trong một dãy số phân phối. Đối với 1 dãy số lượng biến, mốt là lượng biến có tần số lớn nhất.
  60. Ví dụ Tài liệu về mức lương và số công nhân trong 1 phân xưởng sản xuất. Múc lương (tr.đ) Số công nhân (ng) 1,0 10 1,2 12 1,4 20 1,5 8 M0= 1,4 triệu đồng vì có fi= 20 CN ( lớn nhất)
  61. • Đối với dãy số lượng biến có khoảng cách tổ đều: Đầu tiên là xác định tổ có mốt, tức tổ có tần số lớn nhất, sau đó tính theo công thức: ff− M=+ x h . MM01o− o Mo(min) Mo ()()f− f + f − f MMMMo o−+11 o o
  62. Nếu các tổ có khoảng cách tổ không bằng nhau • Mốt vẫn tính theo công thức trên, nhưng không dựa vào fi mà dựa vào mật độ phân phối (tỷ số giữa tần số với trị số khoảng cách tổ) Tiền lương của 170 CNV trong ngành bưu điện tỉnh H năm 2005. Tiền Dưới 1,5-3,0 3,0-4,0 4,0-5,0 5,0-7,0 lương 1,5 (tr.đ) Số 10 66 54 25 15 CNV
  63. • Mốt được sử dụng rộng rải để đo độ tập trung : ➢ Dễ tính toán, dễ hiểu. ➢Không phụ thuộc vào giá trị ở 2 đầu mút. ➢Mốt có thể tính trong trường hợp lượng biến biến động trong phạm vi rất rộng hoặc rất hẹp. • Tuy nhiên : Mo không dùng phổ biến như số trung bình; Có trường hợp không có Mo vì không có giá trị xuất hiện nhiều nhất.
  64. SỐ TRUNG VỊ • Là trị số lượng biến của đơn vị đứng ở vị trí giữa trong dãy số lượng biến đã được sắp xếp theo một thứ tự tăng dần. • Số trung vị chia dãy số thành 2 phần, mỗi phần có số đơn vị tổng thể bằng nhau .
  65. Tính số trung vị với dãy số lượng biến không phân tổ • Giả sử tổng thể nghiên cứu gồm n đơn vị : ❑Nếu n lẻ: Số trung vị là trị số lượng biến đứng ở giữa dãy số, tức trị số lượng biến của đơn vị đứng ở vị trí thứ (n +1) : 2. ❑Nếu n chẳn: Số Trung vị sẽ là trị số lượng biến của 2 đơn vị đứng giữa, tức 2 lượng biến ở vị trí n/2 và ( n+2) /2 .
  66. • Ví dụ: Thu nhập trong 1 ngày làm việc của 1 nhóm 7 sinh viên ở 7 gian hàng của 7 hãng khác nhau trong một hội chợ triển lãm hàng tiêu dùng (ngàn đồng): 70 ; 80 ; 100 ; 110 ; 120 ; 150 ; 160 . Me = 110 • Cũng ví dụ trên , với nhóm 8 sinh viên và thu nhập của người thứ 8 là : 140 . Me = (110 + 120) : 2 = 115
  67. Tính số trung vị từ tài liệu phân tổ không có khoảng cách tổ • Số trung vị sẽ là lượng biến có tần số tích lũy bằng hoặc vượt quá một nửa tổng các tần số, tức bằng hoặc lớn hơn nửa tổng tần số.  fi +1 2
  68. Ví dụ Tài liệu về 1ca làm việc của 1 tổ SX Số SP SX Số CN Tần số tích (sp/ca) (ng) luỹ 40 4 4 45 8 12 47 10 22 50 7 29 52 1 30 Cộng 30 -
  69. Tính số trung vị từ tài liệu phân tổ có khoảng cách tổ • Trước hết xác định tổ có số trung vị (Tổ có tần số tích luỹ bằng hoặc vượt quá một nửa tổng tần số. 1/ 2 fS− Me−1 M=+ x(min) h . e Me Me f • Me - số trung vị ; XMe - giới hạn dưới tổ chứaMe số trung vị ; hMe - Khoảng cách tổ tổ có số trung vị • fMe - Tần số tổ có số T/vị , SMe-1- Tổng các tần số của các tổ đứng trước tổ có số trung vị.
  70. Tứ phân vị • Tứ phân vị chia dãy số lượng biến làm 4 phần, mỗi phần có số đơn vị tổng thể bằng nhau.
  71. Trường hợp dãy số không có khoảng cách tổ ➢Tứ phân vị đầu tiên là lượng biến đứng ở vị trí thứ ( n+1)/4. ➢Tứ phân vị thứ hai: Chính là số trung vị. ➢Tứ phân vị thứ ba: là lượng biến đứng ở vị trí thứ 3(n+1)/4.
  72. Chú ý • Nếu ( n+1) không là bội số của 4. Ví dụ: n=12 đơn vị, lúc đó (n+1)/4 = (3+1)/4 thì tứ phân vị thứ 1 sẽ là lượng biến dứng ở vị trí thứ 3 cộng với ¼ giá trị chênh lệch của lượng biến thứ 4 và lượng biến thứ 3. • Tương tự, Q3 sẽ là 3(n+1)/4 =9.¾ Q3 sẽ bằng lượng biến đứng ở vị trí thứ 9 cộng với ¾ giá trị chênh lệch của lượng biến thứ 10 và lượng biến thứ 9.
  73. Trường hợp dãy số có khoảng cách tổ Tứ phân vị thứ 1: 1/4∑f - SQ1-1 Q1 =XQ1(min) + hQ1 fQ1 Tứ phân vị thứ 3 : 3/4∑f - SQ3-1 Q3 = XQ3(min) + hQ3 . fQ3
  74. Ví dụ Số giờ làm việc của 2 nhóm CN trong 1 tuần làm việc: • Nhóm 1: 47, 49 , 50 , 51 , 53 , 56 , 57 ,60 , 63 , 64 ,66 • Nhóm 2: 45, 48, 49, 50 , 52, 55 , 56 ,60 , 64, 68, 69 Tính cho nhóm 1: • Q1 = x(n+1)/4 =x3= 50 giờ • Q3 = x3(n+1)/4 = x9 = 63 giờ.
  75. • Ví dụ : Lương giờ của 25 công nhân được khảo sát ở Mỹ Lương giờ (USD) Số công nhân 3,5 - 3,6 1 3,6 - 3,7 2 3,7 - 3,8 2 3,8 - 3,9 4 3,9 - 4,0 5 4,0 - 4,1 6 4,1 - 4,2 3 4,2 - 4,3 2
  76. • Tứ phân vị thứ nhất chứa trong tổ có tần số tích lũy đúng bằng hoặc vượt quá (n+1)/4 25 − 5 Q=3,8 + 0,14 = 3,83 USD 1 4 • Tứ phân vị thứ 3 chứa trong tổ có tần số tích luỹ đúng bằng hoặc lớn hơn 3(n+1)/4 75 −14 Q=4,0 + 0,14 = 4,08 USD 3 6
  77. 4.4 CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ PHÂN TÁN • 4.4.1. Khái niệm: Là những chỉ tiêu phản ánh độ biến thiên của tiêu thức, từ đó đánh giá mức độ đại biểu của các chỉ tiêu đo lướng khuynh hướng tập trung của hiện tượng. • 4.4.2. Khoảng biến thiên ( R ) Là chênh lệch giữa lượng biến lớn nhất và nhỏ nhất của tiêu thức . R= xmax – xmin Dễ tính toán, khái quát, song chỉ tính đến lượng biến tại 2 cực, còn các lượng biến khác không đề cập đến. Đối với dãy số có khoảng cách tổ mở thì không xác định được.
  78. • Từ ví dụ X1 = 56 gio X2 = 56 gio • Nhưng R1 = 65 – 47 = 18 giờ R2 = 69 – 45 = 24 giờ R1 < R2 ➔ đại diện tốt hơn.
  79. • 4.4.2. Độ trải giữa ( RQ ) RQ = Q3 - Q1 Tứ ví dụ Nhóm 1 : RQ = 63 - 50 = 13 giờ Nhóm 2 : RQ = 64 – 49 = 15 giờ . => Số giờ làm việc của công nhân nhóm 2 biến thiên nhiều hơn.
  80. 4.4.3.Độ lệch tuyệt đối trung bình − d Là số trung bình cộng của các độ lệch tuyệt đối giữa các lượng biến xi với số trung bình cộng của các lượng biến đó.
  81. • * Tính từ tổng thể chung: N ()X i −  d = i=1 N • d : Độ lệch tuyệt đối trung bình • µ : Số trung bình tổng thể • N : Số đơn vị tổng thể
  82. • Độ lệch tuyệt đối trung bình tính từ mẫu n ()XXi − d = i=1 n • Trường hợp tài liệu phân tổ : k ()Xii− X f i=1 d = k  fi i=1 • Độ lệch tuyệt đối càng nhỏ , tổng thể càng đồng đều , tính đại diện của số trung bình càng cao .
  83. 4.4.4.Phương sai • Là số trung bình cộng của bình phương các độ lệch giữa các trị số lượng biến xi với số trung bình cộng của các lượng biến đó.
  84. • Phương sai tính từ tổng thể chung: N 2 ()X i −  2=i=1 =x 2 − 2 N • σ2 – Phương sai của tổng thể chung • Xi - Lượng biến thứ i • N- Số đơng vị tổng thể • µ - Số trung bình tổng thể
  85. • Trường hợp tài liệu phân tổ k 2 ()Xfii−  2 i=1  = k  fi i=1
  86. • Phương sai tính từ tổng thể mẫu n 2 ()XXi − 2  s=i=1 = x22 − () x n • Khi xi có tần số fi khác nhau k 2 ()Xii− X f 2  i=1 22 s=k = x − () x  fi i=1
  87. • Phương sai mẫu hiệu chỉnh : n 2 ()XXi − s2 = i=1 n −1 k 2 ()Xii− X f 2 i=1 Hoac: s = k  fi −1 i=1 • Phương sai mẫu hiệu chỉnh được sử dụng nhiều trong thống kê suy diễn : Ước lượng , kiểm định . Cho nên trong các chương sau nói đến phương sai là ta nói đến phương sai mẫu hiệu chỉnh.
  88. • Trong trường hợp tiêu thức nghiên cứu là tiêu thức thay phiên , thì phương sai : σ2 = p.q Trong đó : P - Tỷ trọng số đơn vị có biểu hiện của tiêu thức nghiên cứu ; q - Tỷ trọng số đơn vị không có biểu hiện của tiêu thức nghiên cứu. • VD: Kiểm tra 1000 quạt điện được SX trong 1 lô hàng thấy có 12 quạt không hoạt động sau 3 giờ chạy thử . Tìm σ2 . • Tỷ trọng số quạt không hoạt động p=12/1000 = 0,012. • Phương sai : p.q =0,012x0,988=1,18%.
  89. • 4.4.5. Độ lệch tiêu chuẩn Là căn bậc hai của phương sai • Độ lệch chuẩn của tổng thể chung: N 2 ()X i −   = i=1 N • Độ lệch chuẩn của tổng thể mẫu n 2 ()XXi − S = 1 n
  90. Ý nghĩa của độ lệch tiêu chuẩn Quy tắc Trêbưsép : Đối với tập hợp dữ liệu có số trung bình µ , độ lệch chuẩn σ và một số m > 1 , thì có ít nhất 100 (1 - 1) % giá trị rơi vào 2 Khoảng ± mσ so với trungm bình . Các tỉ lệ tương ứng: m 1,5 2 2,5 3 100(1-1/m2) % 55,6 % 75% 84 % 88,9 % • Với m=1,5 : Ít nhất 55,6 % giá trị rơi vào khoảng ± 1,5σ so với trung bình ( µ ± 1,5σ )
  91. • Ưu điểm của qui tắc Trêbưsép là áp dụng cho bất kỳ tổng thể nào.Tuy nhiên hạn chế của quy tắc đó là không thể xác định được đối với m ≤ 1.
  92. • Quy tắc thực nghiệm • Đối với phân phối chuẩn ( Phân phối hình chuông ) : ❖ Khoảng 68% giá trị của dữ liệu rơi vào khoảng ± σ so với trung bình ❖ Khoảng 95% giá trị dữ liệu rơi vào khoảng ± 2σ so với trung bình ❖ Khoảng 99,73 % giá trị dữ liệu rơi vào khoảng ± 3σ so với trung bình.
  93. 4.4.7. Hệ số biến thiên • Hệ số biên thiên dùng để so sánh độ phân tán của tiêu thức có đơn vị tính khác nhau (Tiêu thức khác loại), hoặc giữa các tiêu thức cùng loại nhưng có số trung bình không bằng nhau . • Nó là số tương đối tính được bằng cách so sánh giữa độ lệch tiêu chuẩn với số trung bình cộng .  V = .100% x
  94. • Ví dụ : Có số liệu dưới đây về 1 Cty năm 2005 CHỈ TIÊU Số trung độ lệch bình tiêu chuẩn NSLĐ , kg 400 60 Giá thành đ/v SP, ng. đ. 3,8 0,19 Vnsld= ( 60 : 400).100 = 15% Vgtsp= ( 0,199 : 3,8).100= 5% ➔ NSLĐ biến thiên lớn hơn so với giá thành sản phẩm.
  95. ĐIỀU TRA CHỌN MẪU • Khái niệm • Ưu điểm và hạn chế của điều tra chọn mẫu. • Sai số trong điều tra chọn mẫu . 8/22/2021 96
  96. • KHÁI NIỆM VỀ ĐIỀU TRA CHỌN MẪU • Khái niệm *Giả sử ta cần đưa ra kết luận về những đặc trưng nào đó của tổng thể chung gồm N đơn vị ( phần tử ). *Từ N đơn vị của tổng thể chung đó , ta chọn ra một tập hợp nhỏ gồm n đơn vị. *Sau khi khảo sát n đơn vị của tập hợp nầy, bằng các phương pháp suy luận khoa học, rút ra những kết luận cần thiết về tổng thể chung. Phương pháp làm việc như vậy gọi là phương pháp chọn mẫu. 8/22/2021 97
  97. • Điều tra chọn mẫu là loại điều tra không toàn bộ, người ta chỉ chọn ra một số đơn vị trong toàn bộ các đơn vị của tổng thể chung để điều tra thực tế. • Kết quả thu thập được, dùng các công thức thích hợp để tính toán, suy rộng thành các đặc điểm cho toàn bộ tổng thể. 8/22/2021 98
  98. Ví dụ • Trong điều tra năng suất , sản lượng lúa chỉ tiến hành thu thập số liệu trên một số đơn vị diện tích hay hộ gia đình , sau đó dùng kết quả thu thập được suy rộng cho năng suất & sản lượng toàn địa bàn nghiên cứu . • Hoặc để đi đến kết luận về thái độ , sự chọn lựa của người tiêu dùng đối với sản phẩm của Cty , hay điều tra ý kiến cử tri v.v 8/22/2021 99
  99. Ưu điểm của điều tra chọn mẫu ❖Chi phí điều tra giảm . ❖Đơn vị điều tra ít, gọn, tài liệu ghi chép giảm, thời gian điều tra, tổng hợp, phân tích sẽ rút ngắn. Đáp ứng được tính kịp thời cao. ❖Có thể mở rộng nội dung điều tra, nghiên cứu nhiều mặt của hiện tượng . ❖Tài liệu thu thập đầy đủ và chính xác cao, việc giám sát điều tra và kiểm tra số liệu thu thập đựơc thực hiện tỉ mỉ và tập trung làm giảm sai số do đăng ký. 8/22/2021 100
  100. Vì những ưu điểm trên mà điều tra chọn mẫu được sử dụng rất nhiều trong thực tế với các mục đích khác nhau : - Dùng để thay thế đìều tra toàn bộ (Khi tổng thể nghiên cứu vừa cho phép điều tra toàn bộ vừa cho phép ĐTCM thì người ta thường quyết định dùng ĐTCM ). - Khi tổng thể nghiên cứu không cho phép điều tra toàn bộ (Khi tổng thể quá lớn hoặc không xác định trước được hoặc khi điều tra phải phá huỷ sản phẩm v.v thì người ta phải dùng ĐTCM). 8/22/2021 101
  101. - Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả điều tra toàn bộ (Thường áp dụng trong tổng điều tra dân số). - Khi muốn kiểm định lại giả thuyết đặt ra. - Khi khoảng cách giữa 2 cuộc đ/tra toàn bộ định kỳ quá dài,giữa 2 cuộc đ/tra, tiến hành đtcm để kịp thời nắm bắt sự vận động, biến đổi của tổng thể . 8/22/2021 102
  102. Sai số trong điều tra chọn mẫu 2 loại: Sai số phi chọn mẫu và sai số chọn mẫu. • Sai số phi chọn mẫu : Sai số do đăng ký, ghi chép , cân đong đo đếm loại sai số nầy có cả trong đt toàn bộ cũng như trong chọn mẫu. 8/22/2021 103
  103. • Sai số chọn mẫu : Là sự khác nhau giá trị ước lượng của mẫu & giá trị của tổng thể chung. Sai số chọn mẫu còn gọi là sai số do tính chất đại biểu. 8/22/2021 104
  104. Sai số chọn mẫu bao gồm • Sai số ngẫu nhiên : Do các đơn vị của tổng thể được chọn theo nguyên tắc ngẫu nhiên, không phụ thuộc vào ý định của người điều tra. Sai số nầy giảm khi cỡ mẫu tăng lên. • Sai số có hệ thống : Sai số xảy ra do vi phạm nguyên tắc chọn mẫu , nghĩa là không đảm bảo tính khách quan khi chọn đơn vị điều tra. 8/22/2021 105
  105. Khi mục tiêu của đtcm là để ước lượng số trung bình về một tiêu thức nào đó, thì sai số trung bình mẫu sẽ có các trường hợp 8/22/2021 106
  106. ❖Trường hợp chọn hoàn lại :  2  = x n Nếu σ2 chưa biết ta thay thế bằng phương sai hiệu chỉnh mẫu , lúc đó : S 2  = x n 8/22/2021 107
  107. ❖Trường hợp chọn không hoàn lại :  2 n  =−(1 ) x nN Nếu σ2 chưa biết , thay bằng S2 , công thức trở thành : S 2 n  =−(1 ) x nN 8/22/2021 108
  108. ➢ Khi mục tiêu nghiên cứu là để ước lượng tỷ lệ theo một tiêu thức nào đó, thì sai số trung bình chọn mẫu sẽ có các trường hợp • Trường hợp chọn hoàn lại : PP(1− )  = p n Nếu p chưa biết, ta thay bằng tỷ lệ mẫu. 8/22/2021 109
  109. Trường hợp chọn không hoàn lại : sai số trung bình chọn mẫu sẽ nhân với hệ số điều chỉnh tổng thể hữu n 1− hạn: N Phạm vi sai số chọn mẫu sẽ là: - Ước lượng số trung bình:   x = Z / 2 − = Z / 2 X n - Ước lượng tỷ lệ: p(1− p)  = Z  = Z p / 2 p / 2 n 8/22/2021 110
  110. • Ví dụ : XN có 2000 CN , chọn 100 CN để điều tra về NSLĐ, kết quả như sau: 2 NSLD, So Xi Xi.fi (xi -x) fi kg CN 35-45 14 40 560 4536 45-55 20 50 1000 1280 55-65 42 60 2520 168 65-75 20 70 1400 2880 75-85 4 80 320 1936 8/22/2021 Total 100 X 5800 10800 111
  111. ➢Năng suất LĐ trung bình = 58 tấn ➢Phương sai mẫu hiệu chỉnh = 109,09 ➢Tỷ lệ CN đạt NSLĐ tiên tiến 0,24 (từ 65 kg trở lên) Khi suy rộng về NSLĐ TB và tỷ lệ NSLĐ tiên tiến ❑Chọn hoàn lại : 109,09  = =1,044 tan x 100 0,24.0,76  ==0,0429 p 99 8/22/2021 112
  112. ❑Chọn không hoàn lại : 109,09 100  =(1 − ) = 1,02 tan x 100 2000 0,24.0,76 100  =(1 − ) = 0,0418 p 99 2000 Theo ví dụ trên : NSLĐ TB mẫu = 58 kg , sai số trung bình mẫu =1,044 tấn. Như vậy suy ra NSLĐ TB CN toàn XN là : μ = 58 tấn ± 1,044 tấn nghĩa là trong phạm vi 56,956 tấn đến 59,044 tấn. 8/22/2021 113
  113. CÁC BƯỚC CỦA QUÁ TRÌNH NGHIÊN CỨU MẪU Quá trình nghiên cứu mẫu thường bao gồm 6 bước sau: • 1. Xác định mục đích nghiên cứu: Xác định mục đích nghiên cứu là việc rất quan trọng là tiền đề cho các giai đoạn sau : như chọn lựa phương pháp lấy mẫu, xác định kích thước mẫu v.v 8/22/2021 114
  114. 2. Xác định tổng thể: - Mẫu phải được lấy ra từ chính tổng thể đó. - Nguyên tắc nầy khi được tôn trọng sẽ dẫn đến có kết luận có giá trị. - Do vậy cần chỉ rõ, xác định phạm vi, tính chất của đối tượng nghiên cứu phù hợp với mục đích nghiên cứu. 8/22/2021 115
  115. •3. Chọn lựa phương pháp lấy mẫu - Xác định kích thước mẫu : Chọn lựa phương pháp nào là tuỳ thuộc vấn đề nghiên cứu, tính chất của tổng thể và điều kiện của người nghiên cứu. Chẳng hạn, có thể dùng phương pháp chọn mẫu ngẫu nhiên đơn giản hoặc chọn mẫu phân tầng, chọn mẫu chùm. 8/22/2021 116
  116. • 4. Lựa chọn phương pháp thu thập dữ liệu: Dữ liệu được thu thập như thế nào từ các đơn vị mẫu Có 2 quan điểm: Thứ nhất, tỉ lệ trả lời càng cao càng tốt. Nếu tỉ lệ không trả lời cao thì tỉ lệ trả lời chưa chắc đã đại diện được cho tổng thể. Để tăng tỉ lệ trả lời, cần chú ý đến việc thiết kế số lượng câu hỏi thích hợp và cách thức tiếp xúc với đối tượng điều tra (Giải thích rõ mục đích, bảo đảm bí mật cho người trả lời, có quà tặng v.v ) 8/22/2021 117
  117. Thứ hai là sự chính xác và thành thật của các câu trả lời. Những kết luận được rút ra từ các phương pháp thống kê vô cùng phức tạp nhưng nếu dựa trên số liệu không đáng tin cậy sẽ trở thành vô nghĩa. Ở đây, cần chú ý đến việc thiết kế các câu hỏi. Đây là một nghệ thuật tạo sự thoải mái, hài lòng của người được hỏi, do vậy, câu hỏi phải rõ ràng, dễ hiểu, từ ngữ thông dụng. 8/22/2021 118
  118. 5. Suy rộng các đặc trưng mẫu thành các đặc trưng của tổng thể: Đây là vấn đề thuộc về kỹ thuật xử lý thông tin. Cần hiểu rõ nội dung, bản chất của vấn đề nghiên cứu để sử dụng phương pháp thống kê thích hợp . 8/22/2021 119
  119. 6. Rút ra kết luận về tổng thể: Các kết quả nghiên cứu được tóm lược và trình bày qua các bảng thống kê, đồ thị hoặc báo cáo phân tích. 8/22/2021 120
  120. XÁC ĐỊNH CỠ MẪU • Nhiệm vụ của nhà nghiên cứu là xác định cỡ mẫu đủ lớn để có thể ước lượng một cách tương đối chính xác các tham số của tổng thể chung, đồng thời tiết kiệm được chi phí nghiên cứu. • Tuỳ theo phương pháp chọn mẫu mà sử dụng công thức xác định kích thước mẫu phù hợp . Ở phần nầy ta giới hạn trong phạm vi phương pháp lấy mẫu ngẫu nhiên đơn giản. 8/22/2021 121
  121. Cần làm theo qui trình tổng quát sau đây: 1. Xác định phạm vi sai số có thể chấp nhận được () • 2. Xác định độ tin cậy mong muốn . • 3. Xác định hệ số tin cậy (Z) từ độ tin cậy mong muốn. • 4. Ước tính độ lệch chuẩn của tổng thể. • 5. Sử dụng công thức xác định cỡ mẫu phù hợp. • 6. Lấy mẫu thích ứng. 8/22/2021 122
  122. Để xác định cỡ mẫu, trước hết phải xác định phạm vi sai số có thể chấp nhận được giữa giá trị ước lượng của mẫu và giá trị thực của tổng thể chung. Độ lớn của sai số được xác định căn cứ vào mục đích nghiên cứu cụ thể, kinh nghiệm nghiên cứu, vào độ nhạy của kết quả ước lượng 8/22/2021 123
  123. • Xác định độ tin cậy mong muốn : •- Muốn có kết quả nghiên cứu với độ tin cậy là 100% thì phải điều tra toàn bộ các đơn vị tổng thể. Song quá tốn kém, không thực tế. •- Do vậy, phải chấp nhận mức tin cậy dưới 100%. Trong thực tế độ tin cậy thường được sử dụng là 99%, 95%, 90%. •- Độ tin cậy 95% được sử dụng phổ biến nhất, với độ tin cậy nầy cho phép kết quả nghiên cứu sai số 5% so với giá trị thực của tổng thể chung. Từ độ tin cậy mong muốn này, ta xác định hệ số tin cậy Z thông qua bảng tính sẵn. 8/22/2021 124
  124. Ước tính độ lệch chuẩn: Vì không điều tra toàn bộ nên không biết độ lệch tiêu chuẩn, có thể ước tính độ lệch tiêu chuẩn theo các cách sau: - Nếu trước đây đã tiến hành điều tra và được xem là tương tự với lần nầy thì có thể lấy độ lệch tiêu chuẩn của lần điều tra trước. - Có thể sử dụng độ lệch tiêu chuẩn của cuộc điều tra tương ứng ở nơi khác (Có những đặc điểm và điều kiện tương tự với hiện tượng ta cần nghiên cứu). - Tiến hành điều tra thí điểm để tính độ lệch tiêu chuẩn. 8/22/2021 125
  125. Có thể ước tính độ lệch tiêu chuẩn theo khoảng biến thiên (R) tuỳ theo đặc điểm phân phối của hiện tượng nghiên cứu. Nếu là phân phối chuẩn thì : •R=Xmax – Xmin = ( + 3) – ( - 3) = 6 • →  = R : 6 = (Xmax – Xmin ):6 8/22/2021 126
  126. Các công thức xác đinh cỡ mẫu thường sử dụng •Khi nhiệm vụ nghiên cứu là để ước lượng số trung bình theo một tiêu thức nào đó: 2 2 2 . α/2 σ •x = Z /2.  n = Z n 2 εx 8/22/2021 127
  127. Trường hợp chọn không hoàn lại: 2 n = .  1−  x Z / 2 n N Z2 . 2.N n = /2 2 + 2 . 2  x N Z /2  8/22/2021 128
  128. Khi nhiệm vụ nghiên cứu là để ước lượng tỷ lệ theo một tiêu thức nào đó : •Trường hợp hoàn lại : pp(1− ) = ppZZ / 2= / 2 n Z 2 .pq n = / 2  2 8/22/2021 p 129
  129. Trường hợp chọn không hoàn lại: 2 .pqN Z / 2 n = 2 2  p N + Z / 2.pq 8/22/2021 130
  130. Ví dụ : Trong một XN dệt có 4000 công nhân, người ta cần tính năng suất lao động trung bình trong một ngày bằng phương pháp chọn mẫu, yêu cầu độ tin cậy là 0,9973 và phạm vi sai số không vượt quá 2 mét. Thực tế trong XN cho thấy rằng, nhìn chung mỗi ngày người kém nhất cũng dệt được 60 mét, người giỏi nhất không vượt quá 90 mét . Vậy cần chọn ra ít nhất bao nhiêu công nhân để điều tra thực tế. 8/22/2021 131
  131. Giả định rằng tổng thể chung được phân phối theo quí luật chuẩn và ta ước lượng độ lệch tiêu chuẩn theo công thức : •= ( 90 – 60) : 6 = 5 mét • Với độ tin cậy 0,9973 tra bảng ta được • Z /2 = 3 8/22/2021 132
  132. Trường hợp chọn hoàn lại: 2 2 2 2 Z / 2  3 .5 n = 2 = = 57CN  2 x 2 8/22/2021 133
  133. Trường hợp chọn không hoàn lại : 2 2 22. NZ / 2  4000.3 5 n = = 2 2 2 2 2 2 .  x N + Z / 2  4000.2+ 3 5 = 56CN 8/22/2021 134
  134. Ví du 2 : Một XN đồ hộp tiến hành điều tra chọn mẫu để xác định tỷ lệ đồ hộp không đúng quy cách trong một đợt sản xuất. Yêu cầu mức độ tin cậy 95%, phạm vi sai số không vượt quá 4%. Trong ba lần điều tra trước tỷ lệ đồ hợp không đạt tiêu chuẩn là 3%, 4%, 5% . Hãy xác định số hộp cần điều tra lần nầy. 8/22/2021 135
  135. Để có phương sai lớn nhất ta sử dụng tỷ lệ 5% . Với độ tin cậy 95% tra bảng phân phối chuẩn ta tìm được Z /2 = 1,96. Vì số đồ hộp thường sản xuất rất nhiều nên dù có chọn hoàn lại hay không hoàn lại vẫn có thể sử dụng công thức : 2 1,96 .0,05.0,95 n = =114hoäp 0,042 8/22/2021 136
  136. CÁC PHƯƠNG PHÁP CHỌN MẪU: •Chọn các đơn vị mẫu từ tổng thể chung có thể tiến hành theo nhiều cách khác nhau. Dưới đây là một số phương pháp thường dùng : 8/22/2021 137
  137. •a) Chọn mẫu ngẫu nhiên đơn giản : •Là phương pháp chọn mẫu từ tổng thể chung hoàn toàn ngẫu nhiên không qua một sự sắp xếp nào. Người ta phải lần lượt chọn ra từng đơn vì bằng cách rút thăm, quay số hoặc theo bảng số ngẫu nhiên. Mỗi đơn vị tổng thể chung có thể được chọn một lần (Không hoàn lại) hoặc được chọn nhiều lần (chọn hoàn lại) 8/22/2021 138
  138. Chọn mẫu ngẫu nhiên có một số ưu điểm (So với chọn mẫu phi ngẫu nhiên) là có thể chọn được mẫu có khả năng đại diện cho tổng thể, tính toán sai số trung bình chọn mẫu và có thể suy luận các đặc trưng mẫu thành các đặc trưng của cả tổng thể (Sử dụng các công thức đã nêu ở chương trước). 8/22/2021 139
  139. • Tuy nhiên, nếu tổng thể chung có kết cấu phức tạp thì chọn theo phương pháp nầy sẽ khó đảm bảo tính đại biểu. Mặt khác, đối với tổng thể lớn có hàng ngàn đơn vị thì việc lập số rút thăm và đặt số hiệu cho từng đơn vị cũng gặp khó khăn. 8/22/2021 140
  140. Chọn mẫu hệ thống (Chọn máy móc). • Trong chọn mẫu hệ thống các đơn vị được chọn lựa từ tổng thể chung theo khoảng cách thời gian, không gian hoặc thứ hạng bằng nhau - tức là chọn ngẫu nhiên một đơn vị vào mẫu từ danh sách tất cả các đơn vị của tổng thể, còn các đơn vị tiếp theo được chọn vào mẫu cứ sau khoảng cách chọn mẫu k đã xác định trước N K = n 8/22/2021 141
  141. Nếu khoảng cách chọn mẫu là 50, thì từ đơn vị mẫu đầu tiên được chọn ngẫu nhiên, cứ cách 50 đơn vị ta chọn một đơn vị cho đến khi đủ n đơn vị mẫu. 8/22/2021 142
  142. • Chọn mẫu hệ thống có ưu điểm : thủ tục tiến hành đơn giản, nên rút ngắn được thời gian và chi phí có khả năng giảm bớt. Mặt khác, do số đơn vị mẫu được phân phối rải đều trong tổng thể chung nên tính dại biểu của mẫu cao so với chọn mẫu ngẫu nhiên đơn giản. Nhược điểm của chọn hệ thống là có khả năng xuất hiện sai số hệ thống. 8/22/2021 143
  143. Chọn mẫu ngẫu nhiên phân tổ: Sai số chuẩn cũng có thể giảm khi chia tổng thể thành những tổng thể con trong đó các đơn vị trong mỗi tổng thể con tương đối đồng đều nhau và sau đó áp dụng chọn mẫu ngẫu nhiên đơn giản trong từng tổ (Hoặc chọn hệ thống). 8/22/2021 144
  144. Trong chọn mẫu phân tổ, tử một tổng thể gồm N đơn vị được chia thành k tổng thể con với số đơn vị tương ứng là N1; N2, , Nk. Như thế các đơn vị trong mỗi tổng thể con tương đối giống nhau. Các tổng thể con nầy không trùng nhau và cùng nhau tạo thành toàn bộ tổng thể lớn, tức là •N1 + N2 + + Nk = N 8/22/2021 145
  145. - Các tổng thể con được gọi là các tổ. - Từ mỗi tổ chọn các đơn vị đại diện theo cách chọn ngẫu nhiên hoặc máy móc . - Tổng các mẫu đạt dược ta gọi là mẫu ngẫu nhiên có phân tổ. 8/22/2021 146
  146. • Tổng thể mẫu n đơn vị được phân bổ cho các tổ với số đơn vị mẫu tương ứng n1, n2, n3, n4, , nk •(n1 + n2 + n3 + + nk) = n • Số đơn vị được chọn từ mỗi tổ có thể tương ứng với tỷ trọng của tổ đó trong tổng thể chung, gọi là chọn phân tổ theo tỷ lệ, hoặc có thể không tương ứng với tỷ trọng đó. 8/22/2021 147
  147. Trường hợp chọn mẫu phân tổ theo tỷ lệ : Số đơn vị mẫu ở từng tổ, ni , có thể được xác định theo phương pháp tỷ lệ, nghĩa là : •ni : n = Ni : N •Trong đó : ni - Số đơn vị được lấy mẫu ở tổ thứ i. • Ni - Số đơn vị của tổ thứ i 8/22/2021 148
  148. Ước lượng trung bình tổng thể: 2 •Gọi Xi và Si ( i = 1, 2, , k) là số trung bình và phương sai mẫu hiệu chỉnh tổ thứ i,  là trung bình của tổng thể chung. Ta có : •ước lượng điểm của  là: 1 k XN= .  X i i N 1 8/22/2021 149
  149. Ước lượng khoảng cho  với độ tin cậy (1 - ) là : X −  X + Z / 2 S X Z / 2 S X •Với K 2 2 : Wi Si 2 = (1− f ) S x  i 1 ni 8/22/2021 150
  150. ni 2  ( X i− ) 2 1 X i S i = ni−1 = : N ; = : W i Ni f i ni N i •Khi các đơn vị mẫu phân phối theo tỉ lệ thì : n ni = =f = f N i N i 8/22/2021 151
  151. Ví dụ : Một huyện có 4200 hộ, được chia làm 3 xã (1, 2 , 3) • Với số hộ lần lượt là 1150, 2120, 930. Một mẫu điều tra gồm 450 hộ được chọn ngẫu nhiên tƯø 3 xã lần lượt là : 123 ; 227 và 100 hộ, nhằm thu thập thông tin về thu nhập trung bình hàng năm. Các giá trị trung bình mẫu và độ lệch chuẩn tính được như sau : 8/22/2021 152
  152. ==16,228tr.d; 4,187 trñ X 1 S1 = 21,593trñ; = 6,195trñ X 2 S2 = 32,711trñ; = 8,243trñ X 3 S3 8/22/2021 153
  153. Hãy ước lượng điểm và ước lượng khoảng về thu nhập trung bình năm của tất cả các hộ của huyện trên với độ tin cậy 95%. • ước lượng điểm cho  là : 1 K X =  X i N i N 1 (16,228x1150) + (21,593x2120) + (32,711x930) = 1150 + 2120 + 930 = 22,586 Trñ 8/22/2021 154
  154. Ước lượng khoảng cho  ta tính: K 2 2 Wi Si 2 = (1− f ) S x  1 ni 2 2 2 1150 2 2120 2 930 2 .4,187 .6,195 .8,243 450 4200 4200 4200 = 1− + + 4200 123 227 100 = 0,28 S x 8/22/2021 155
  155. Với độ tin cậy 95% trung bình tổng thể  là: x − X + Z / 2 S x Z / 2 S X •22,586 – 1,96 x 0,28 <  < 22,586 + 1,96 x 0,28 8/22/2021 156
  156. Ước lượng tỉ lệ tổng thể • Gọi p, pi lần lượt là tỉ lệ các đơn vị có tính chất nào đó mà ta quan tâm của tổng thể và tổ thứ i •Uớc lượng điểm của p được xác định : 1 K K P = =  N i Pi  W i Pi N 1 1 8/22/2021 157
  157. ước lượng khoảng cho p với dộ tin cậy ( 1 - )  P − P P + Z /2 S P Z /2 S P •Với K 2 2 WPii(1− ) = Pi 1− ni S p  −1 1 nNii •Khi phấn phối mẫu theo tỉ lệ thì: K W 2 1− n i PPii( ) •Với 1− N  −1 1 ni 8/22/2021 158
  158. Từ ví dụ trên nếu biết thêm, hộ có thu nhập năm dưới 12 triệu đồng là thuộc diện nghèo đói đến đủ ăn , và số hộ nghèo đói đến đủ ăn tương ứng ở 3 xã theo điều tra là: 8; 15 và 12. • Hãy ước lượng điểm và khoảng cho tỉ lệ số hộ nghèo đói - đủ ăn của toàn huyện với độ tin cậy là 95%. 8/22/2021 159
  159. Giải: 8 15 12 = = 0,065; = = 0,066; = = 0,12; P1 123 P2 227 P3 100 •Ước lượng điểm:  1150x0,065x2120x0,066 + 930x0,12 P = 4200 •Hoặc: 0,065 x 0,274 + 0,066 x 0,505 + 0,12 x 0,221=0,078 8/22/2021 160
  160. Ước lượng khoảng: 2 = S P 2 2 2 1150 2120 930 .0,065(1− 0,065) .0,066(1− 0,066) .0,12(1− 0,12) 450 4200 4200 4200 1− . + + 4200 123−1 227 −1 100 −1 8/22/2021 161