Giáo án Thủy văn công trình - Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn - Đại học Thăng Long

pdf 68 trang hoanguyen 7390
Bạn đang xem 20 trang mẫu của tài liệu "Giáo án Thủy văn công trình - Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn - Đại học Thăng Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_an_thuy_van_cong_trinh_chuong_3_thong_ke_xac_suat_ung_d.pdf

Nội dung text: Giáo án Thủy văn công trình - Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn - Đại học Thăng Long

  1. Khoa Thuỷ văn – Tài nguyên nước Bộ môn Thuỷ văn – Tài nguyên nước THUỶ VĂN CÔNG TRÌNH Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn 1
  2. 3.1 Khái niệm về xác suất và tần suất 1. Các khái niệm cơ bản  Phép thử: Thực hiện một thử nghiệm và quan sát kết quả thực hiện đối với một hiện tượng ngẫu nhiên nào đó trong cùng một điều kiện nhất định.  Kết quả của một phép thử ngẫu nhiên gọi là biến cố ngẫu nhiên, hoặc nói ngắn gọn là biến cố / biến cố cơ bản. Tập hợp các biến cố có thể xẩy ra trong một phép thử gọi là không gian biến cố. 2
  3. 3.1 Khái niệm về xác suất và tần suất Phân loại biến cố  Biến cố chắc chắn: là biến cố nhất định phải xuất hiện trong một phép thử.  Biến cố không thể có: là biến cố không thể xuất hiện trong một phép thử.  Biến cố độc lập: là biến cố mà sự xuất hiện của nó không phụ thuộc vào sự xuất hiện của các biến cố khác  Biến cố phụ thuộc: là biến cố mà sự xuất hiện của nó phụ thuộc vào sự xuất hiện của biến cố khác 3
  4. 3.1 Khái niệm về xác suất và tần suất Phân loại biến cố  Biến cố tổng: biến cố C được gọi là biến cố tổng của hai biến cố A và B nếu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng xuất hiện đều dẫn đến sự xuất hiện của C.  Biến cố tích: Biến cố C được gọi là biến cố tích của hai biến cố A và B khi và chỉkhi cả 2 biến cố A và B đồng thời xuất hiện tạo nên. A A B B C=A+B C=A.B 4
  5. 3.1 Khái niệm về xác suất và tần suất Xác suất  Định nghĩa cổ điển: Xác suất xuất hiện của một biến cố A nào đó bằng tỷ số giữa số biến cố cơ bản thuận lợi cho A xuất hiện trên tổng các biến cố cơ bản của không gian biến cố. Công thức tính xác suất của biến cố A theo định nghĩa cổ điển: m P ( A ) n n là tổng số các biến cố cơ bản của không gian biến cố đang xét; m là số biến cố cơ bản thuận lợi cho biến cố A xuất hiện. 5
  6. 3.1 Khái niệm về xác suất và tần suất  Định nghĩa theo thống kê: Xác suất xuất hiện của một biến cố A nào đó là tần số xuất hiện của biến cố đó khi số lần thực hiện phép thử tăng lên vô hạn. Công thức tính xác suất theo định nghĩa thông kê: m P ( A ) lim n n n là số lần thực hiện phép thử m là số lần xuất hiện biến cố A 6
  7. 3.2 Đại lượng ngẫu nhiên và luật phân bố xác suất của đại lượng ngẫu nhiên 1. Khái niệm đại lượng ngẫu nhiên  Đại lượng ngẫu nhiên (ĐLNN) là một đại lượng mà trong một phép thử nó nhận một giá trị có thể trong tập giá trị hay trong một khoảng trên trục số với xác suất tương ứng của nó. Ký hiệu X = {x1, x2, x3, , xn} Phân loại: o Đại lượng ngẫu nhiên rời rạc: Nếu nó nhận một số giá trị hữu hạn trong khoảng xác định của nó. o Đại lượng ngẫu nhiên liên tục: Nếu nó nhận bất kỳ giá trị trong khoảng xác định của nó 7
  8. 2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất  Giá trị có thể của ĐLNN X1 X2 X3 X Xn Xác suất (P) P1 P2 P3 P Pn P x X x x f ( x ) lim x 0 x 8
  9. 2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất  x f ( x ) dx 9
  10. Ví dụ:  Hàm mật độ xác suất chuẩn có dạng: 2 1 ( x m x ) f ( x ) exp 2 2  x 2 10
  11. 3. Tính chất và đồ thị của hàm PPXS PPXS dạng F(x) = P(X≤ x) PPXS dạng F(x) = P(X ≥ x) 1. Giá trị F(x) ≥0 nhận giá trị trong 1. Giá trị F(x) ≥0 nhận giá trị trong khoảng [0,1] khoảng [0,1] - F(-∞) = P(x≤-∞) = 0; - F(-∞) = P(x≥-∞) = 1; F(+∞) = P(x≤+∞) = 1 F(+∞) = P(x≥+∞) = 0 - Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1) - Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1) 2. F(x) là hàm đồng biến không giảm 2. F(x) là hàm nghịch biến không tăng trên toàn trục số x2≥ x1 thì F(x2) ≥ F( trên toàn trục số x2≥ x1 thì F(x2) ≤ F( x1). Đồ thị luân đi lên x1). Đồ thị luân đi xuống 3. F(x) = P(X≤ x) liên tục trái tại mỗi 3. F(x) = P(X≤ x) liên tục trái tại mỗi điểm xo bất kỳ trên trục số điểm xo bất kỳ trên trục số lim F(x) = F(xo) lim F(x) = F(xo) x x o o x x o o 11
  12. 4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 1: Kỳ vọng toán của ĐNN là mô men gốc bậc nhất của hàm mật độ xác suất ký hiệu mx = M[X] biểu thị mức độ tập trung của ĐLNN x - Với ĐLNN liên tục mx = x. f ( x ) dx n x p ( x ) - Với ĐLNN rời rạc mx  i i i 1 1 nếu xác suất p(xi) phân bố đều thì p(xi) = và kỳ vọng toán sẽ là: n 12
  13. 4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 3. Hệ số thiên lệch Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba: + Đối với ĐLNN liên tục  ( x m ) 3 f ( x ) dx 3 x +Đối với ĐLNN rời rạc n  ( x m ) 3 p ( x ) 3  i x i i 1 Hệ số thiên lệch ký hiệu Cs  3 C s 3  x 13
  14. 4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 2. Phương sai và khoảng lệch quân phương biểu thị mức độ phân tán của ĐLNN 2 - Phương sai ký hiệu Dx =M[ (x – mx) ] là kỳ vọng của kỳ vọng toán. + Đối với ĐLNN liên tục ( x m ) 2 f ( x ) dx D x x n 2 + Đối với ĐLNN rời rạc ( x m ) p ( x ) D x  i c i i 1 - Khoảng lệch quân phương  x D x - Hệ số phân tán: là đặc trưng không thứ nguyên biểu thị độ phân tán của ĐLNN so với kỳ vọng ký hiệu C v  x C v m x 14
  15. 4. Các đặc trưng biểu thị của đại lựơng ngẫu nhiên (ĐLNN) 3. Hệ số thiên lệch Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba: + Đối với ĐLNN liên tục +Đối với ĐLNN rời rạc Hệ số thiên lệch ký hiệu Cs 15
  16. 3.3 Khái niệm về mẫu và tổng thể, phương pháp chọn mẫu  Tổng thể Số lượng các giá trị có thể mà ĐLNN có thể nhận được là lớn vô cùng. Tập hợp tất cả các giá trị mà ĐLNN X có thể nhận được gọi là tổng thể. Ký hiệu: N  Mẫu Trong nghiên cứu không thể nào NC hết tất cả các giá trị của tổng thể mà chỉ NC trên một tập giá trị với số lượng rất nhỏ. Tập hợp hữu hạn các số liệu thu thập được của tổng thể gọi là mẫu. Ký hiệu: n 16
  17. 3.3 Khái niệm về mẫu và tổng thể, phương pháp chọn mẫu  Các yêu cầu của mẫu trong thống kê: o Tính đại biểu: mẫu được chọn có những tính chất của tổng thể. Muốn vậy, dung lượng mẫu phải đủ lớn đảm bảo sai số lấy mẫu; mẫu phải bao gồm các giá trị số đặc trưng lớn, nhỏ và trung bình o Tính độc lập: các số liệu của mẫu không phụ thuộc lẫn nhau o Tính đồng nhất: cùng loại, cùng nguyên nhân hình thành hoặc cùng điều kiện xuất hiện 17
  18. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất  Khái niệm Trong thống kê toán thường chỉ thu được hữu hạn các gía trị của ĐLNN (mẫu có dung lượng n) tức là thu được các giá trị rời rạc từ tổng thể mặc dù ĐLNN có thể là liên tục. Do vậy có thể dùng các công thức định nghĩa của ĐLNN rời rạc để tính toán. Các hiện tượng thủy văn là ĐLNN liên tục, các giá trị thu được rời rạc vì vậy trong thủy văn qui ước cách gọi riêng: Xác suất gọi là Tần suất và theo đó có Hàm mật độ xác suất-Hàm mật độ tần suất; Hàm PPXS- Hàm tần suất tích lũy 18
  19.  Hàm phân bố xác suất của đại lượng ngẫu nhiên dùng trong Thủy văn Hàm phân bố xác suất F(x) là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị lớn hơn hoặc bằng một giá trị x, trong đó x là biến số nhận các giá trị có thể trên miền xác định của nó. F(x) = P(X x) 19
  20. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Đồ thị hàm tan suat tich luy 1 F(x) 0 x 20
  21. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Tính chất hàm phân bố xác suất:  Luôn dương và nhận giá trị trong khoảng [0,1]  F(- )=1  F( )=0  Là hàm nghịch biến và không tăng trên toàn trục số  x2 x1 thì F(x2) F(x1)  Liên tục bên phải tại mỗi điểm x0 F x F x lim 0 x x 0 0 21
  22. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Hàm mật độ xác suất  Công thức: P x X x x f ( x ) lim x 0 x  Tính chất:  1. F x f x dx x  2. Hàm f(x) luôn dương và biến đổi từ 0 đến 1  3. f x dx 1 22
  23. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Đồ thị hàm mật độ xác suất dạng quả chuông f(x) x 23
  24. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Đặc điểm của đồ thị hàm mật độ xác suất Hoàn toàn nằm trên trục hoành Hình dạng đồ thị hàm mật độ tần suất có dạng hình quả chuông Hàm mật độ xác suất nhận trục 0x làm tiệm cận ngang Có một giá trị cực đại 24
  25. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất  Hàm tần suất luỹ tích/Hàm phân bố xác suất Trong thống kê toán học, thường chỉ thu được mẫu có dung lượng n (rời rạc). Mẫu n đó được coi là đại lượng ngẫu nhiên rời rạc. F(xi) = P(X xi) Được gọi là hàm tần suất luỹ tích. Đồ thị của nó thường được gọi là “đường tần suất” 25
  26. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Hàm mật độ tần suất/Hàm mật độ xác suất Là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị nằm trong khoảng từ x đến x-∆x  Công thức: p(xi) = P(xi) - P(xi - x) (Giống như hàm mật độ xác suất). 26
  27. 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất MẪU TỔNG THỂ (Vẽ theo số liệu của mẫu) p(xi) Hàm mật độ tần suất f(x) Hàm mật độ xác suất P Hàm tần suất luỹ tích F(x) 1 1 Hàm phân phối xác suất F(xi) 27 xi-1 xi x xi x
  28. Sự khác nhau giữa tần suất và xác suất? 28
  29. 3.5 Ước lượng các tham số thống kê 1. Tham số biểu thị xu thế tập trung - Số đông (X : là trị số có xác suất xuất hiện lớn đ) nhất(tương ứng với giá trị cực đại của hàm mật độ tần suất). -Trị số trung bình: là ước lượng không chệch của kỳ vọng toán của đại lượng ngẫu nhiên(n là dung lượng mẫu) n 1 n x x p ( x ) hoặc x x  i i  i n i 1 i 1 29
  30. 3.5 Ước lượng các tham số thống kê 2. Tham số biểu thị xu hướng phân tán - Khoảng lệch quân phương : x 1 n  ( x x ) 2 x  i n 1 i 1 - Hệ số phân tán Cv:  1 n x C x ( k 1) 2 ; k i v  i i x n 1 1 x 30
  31. 3.5 Ước lượng các tham số thống kê 3. Tham số biểu thị tính đối xứng: Hệ số thiên lệch Cs n n ( x x ) 3 ( k 1) 3  i  i 1 1 x i C s ; k i ( n 3)( x C ) 3 3 x v ( n 3)C v 31
  32. 3.5 Ước lượng các tham số thống kê Đường quá trình mưa năm trạm A 2500 2000 1500 1000 Mưa năm 500 Trung bình 1970 - 2002 Trung bình 1985 - 1991 0 1970 1975 1980 1985 1990 1995 2000 2005 X của trạm A??? 32 0
  33. 3.5 Ước lượng các tham số thống kê Sai số tuyệt đối Sai số tương đối  Đối với trị số bình quân  x 100 C v  x  x % n n  Đối với hệ số phân tán C 100 v 2  % 1 C 2 %  Cv 1 C v Cv v 2 n 2 n  Đối với hệ số thiên lệch 6 2 4 100 6 2 4  Cs 1 6 C v 5C v  % 1 6C 5C n Cs v v C s n 33
  34. 3.6 Tần suất kinh nghiệm và đường TSKN Khái niệm: Tần xuất kinh nghiệm là xác suất để cho đại lượng ngẫu nhiên X nhận giá trị lớn hơn hoặc bằng x được ước lượng từ mẫu (chuỗi số liệu thực đo). m P ( X x ) i n 34
  35. 3.6 Tần suất kinh nghiệm và đường TSKN Các công thức kinh nghiệm tính tần xuất thường dùng trong thuỷ văn: m a Dạng tổng quát: P ( X x i ) n 1 2 a m 0 ,5 Công thức Hazen (a=0,5): P ( X x i ) 100 % n m 0 ,3 Công thức Chegôđaép (a=0,3): P ( X x i ) 100 % n 0 ,4 Công thức Weibull (a=0): m P ( X x i ) 100 % n 1 35
  36. 3.6 Tần suất kinh nghiệm và đường TSKN  Đường tần suất là đường quan hệ giữa tần suất luỹ tích và giá trị của biến ngẫu nhiên - Đường tần suất kinh nghiệm: là băng điểm điểm biểu diễn tần suất xuất hiện của đại lượng ngẫu nhiên nhận giá trị X ≥ xi , Tần xuất được tính theo các công thức kinh nghiệm - Đường tần suất lý luận:Đường cong trơn phù hợp với đường tần xuất kinh nghiệm gọi là đường tần suất lý luận. Đường tần suất lý luận là đồ thị hàm phân phối xác suất. 36
  37. 3.6 Tần suất kinh nghiệm và đường TSKN Cách vẽ đường tần suất kinh nghiệm: 1. Sắp xếp chuỗi số liệu từ lớn đến nhỏ (đánh số thứ tự) 2. Tính tần suất theo 1 trong 3 công thức kinh nghiệm với m là số thứ tự, n là số số liệu thống kê. 3. Chấm các điểm P ~ xi (điểm kinh nghiệm) 37
  38. 3.6 Tần suất kinh nghiệm và đường TSKN Cách vẽ đường tần suất kinh nghiệm: Thứ tự Q (m3/s) P = m/(n+1) (%) 1 2160 3,23 2 2100 6,45 3 1920 9,68 30 1260 96,77 38
  39. 3.6 Tần suất kinh nghiệm và đường TSKN Cách vẽ đường tần suất kinh nghiệm: 2400 2200 2000 1800 1600 Q Q (m3/s) 1400 1200 1000 0 10 20 30 40 50 60 70 80 90 100 P (%) 39
  40. 3.6 Tần suất kinh nghiệm và đường TSKN Giấy tần suất (Giấy Hazen): FFC 2008 © Nghiem Tien Lam ĐƯỜNG TẦN SUẤT DÒNG CHẢY NĂM - TRẠM BẢN ĐÔN 690 Số liệu Qnăm trạm Bản Đôn 640 TB=265.89, Cv=0.27, Cs=0.72 TB=265.89, Cv=0.27, Cs=0.72 590 540 490 440 390 340 Lưu Lưu lượng, Q(m³/s) 290 240 190 140 90 0.01 0.1 1 10 20 30 40 50 60 70 80 90 99 99.9 99.99 Tần suất, P(%) © FFC 2008 40
  41. 3.7 Đường Tần suất lý luận Đường tần suất kinh nghiệm chỉ phản ánh được quy luật phân bố xác suất của hiện tượng thuỷ văn trong phạm vi các giá trị thực nghiệm. Đường tần suất lý luận là đồ thị một hàm phân bố xác suất toán học mô tả phân bố xác suất của đại lượng ngẫu nhiên nhằm ngoại suy các giá trị nằm ngoài các giá trị thực nghiệm. 41
  42. 3.7 Đường Tần suất lý luận Luật phân bố xác suất Pearson III y Hàm mật độ có dạng: y0 a x x d d a d y y 0 1 e a xđ x Trong đó • y0: là giá trị lớn nhất của hàm tương ứng với số đông xđ ( 1) 2C 4 s ; ; y 2 0 C e  ( ) C v s Giá trị hàm  ( ) có bảng tra sẵn 42
  43. • d: bán kính lệch (khoảng cách giữa trị số bình quân và số đông) C v .C s d  x 2 • a: khoảng cách từ vị trí số đông đến giá trị nhỏ nhất 2 C a v  x d C s •Đồ thị của hàm phân phối Pearson III được gọi là đường tần suất lý luận Pearson III (P-III) 43
  44. 3.7 Đường Tần suất lý luận Luật phân bố xác suất Pearson III Đặc điểm: • Một đầu bị chặn tại x0, một đầu nhận trục hoành làm tiệm cận, có 2 C x x v  x 1 số đông. x0 là giá trị nhỏ nhất: 0 C s • Có 3 đặc trưng là tham số xtb, Cv, Cs. • Phân phối lệch phụ thuộc vào bán kính lệch d •d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số bình quân) •d<0: lệch âm (đỉnh của hàm mật độ nằm bên phải trị số bình quân) •d=0: đỉnh của hàm mật độ trùng với vị trí số bình quân • Điều kiện ứng dụng: 2Cv x 0 2Cv Cs k 0 1 - k 0 x 44
  45. 3.7 Đường Tần suất lý luận Hàm phân bố xác suất Pearson III Hàm PPXS Pearson III F(X≥ x) được xác định bằng cách lấy tích phân hàm mật độ. Việc tích phân trực tiếp hàm mật độ rất khó . Trong thực hành tiến hành lập bảng tính (Xp ῀ P) theo công thức x p (  p .C v 1). x Với p tra bảng Fôxtơ – Rưpkin (phụ lục 1) phụ thuộc Cs và P. 45
  46. 3.7 Đường Tần suất lý luận Bảng Fôxtơ – Rưpkin Cs = 0,3; P = 1% 1% = 2,54 Lưu ý: Khi Cs 0) 46
  47. 3.7 Đường Tần suất lý luận Bảng tính đường tần suất lý luận P(%) 0.0 0.1 1 5 50 75 80 90 99 99.9 1 (Cs,P) Kp=.Cv+1 xp=Kp.x 47
  48. 3.7 Đường Tần suất lý luận Luật phân bố xác suất Kritxki - Menken Điều kiện xây dựng: 1. Dùng 3 tham số giống như P-III 2. Chỉ có 1 số đông 3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+ Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ 1 Với a, b: hằng số x b 2 x 1 1 a α f ( x ) x b e 2 σ x Cv b b  ( ) 48
  49. 3.7 Đường Tần suất lý luận Luật phân bố xác suất Kritxki - Menken Điều kiện xây dựng: 1. Dùng 3 tham số giống như P-III 2. Chỉ có 1 số đông 3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+ Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ 1 Với a, b: hằng số x b 2 1 a x 1 f ( x ) x b e α 2 σ x Cv b b  ( ) Cách xác định: X K . X với Kp tra bảng phụ lục 4. 49 p p
  50. Phân biệt P-III với K-M?  2 hàm phân bố đều có dạng hình quả chuông có một số đông và đều dùng 3 đặc trưng thống kê: Xtb, Cv, Cs.  Khi Cs = 2Cv đường tần suất trùng nhau  2 hàm đều có tiệm cận với trục hoành khi x + , đầu kia bị chặn tại x0. Với P-III, x0 có thể âm hoặc dương. Với K-M, x0 = 0. 50
  51. 3.7 Ảnh hưởng của tham số thống kê 1. Hệ số trung bình Xtb 51
  52. 3.8 Ảnh hưởng của tham số thống kê 2. Hệ số phân tán Cv 52
  53. 3.8 Ảnh hưởng của tham số thống kê 3. Hệ số thiên lệch Cs 53
  54. 3.9 Phương pháp vẽ đường tần suất lý luận 1. Phương pháp đường thích hợp • Xác định các đặc trưng thống kê: Xtb, Cv, Cs • Vẽ đường tần suất kinh nghiệm • Lựa chọn đường phân bố xác suất (P-III hoặc K-M) • Xây dựng đường tần suất lý luận • Kiểm tra sự phù hợp giữa 2 đường kinh nghiệm và lý luận • Nếu chưa phù hợp thì giả thiết lại các đặc trưng thống kê 54
  55. 3.9 Phương pháp vẽ đường tần suất lý luận 2. Phương pháp 3 điểm • Vẽ đường tần suất kinh nghiệm • Lựa chọn 3 điểm trên đường TSKN (x ,p );(x ,p );(x ,p ) 1 1 2 2 3 3 Nên chọn 3 điểm đã có sẵn bảng tra (X1%, X50%, X99%), (X3%, X50%, X97%), (X5%, X50%, X95%), (X10%, X50%, X90%) x x 2 x   2 • Tính hệ số lệch S: S 1 3 2 1 3 2 x 1 x 3  1  3 • Tra quan hệ S = f(Cs) được Cs x 1 x 3 • Tra 2 và 1 3 theo Cs, tính   1  3 • Tính Xtb=X50%-50% • Tính Cv = /Xtb 55 • Có 3 tham số Xtb, Cv, Cs vẽ đường tần suất lý luận
  56. 3.10 Phân tích tương quan tuyến tính 1. Khái niệm chung. Khi NC các hiện tương thủy văn thường gặp trường hợp tài liệu có được quá ngắn. Phân tích các đặc trưng Thủy văn thấy chúng có mối quan hệ: 1) Quan hệ hàm số: Hai chuỗi X, Y có quan hệ hàm số Y = f(X). Mỗi một giá trị X, xác định được giá trị Y. Y 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 56 X
  57. 3.10 Phân tích tương quan tuyến tính Y 16 2) Không có quan hệ: Không tìm 14 Không có quan hệ 12 được mối liên hệ nào giữa X và Y 10 3) Quan hệ tương quan: Tập hợp 8 6 nhiều số liệu thì quan hệ giữa X 4 và Y có tính quy luật và tạo thành 2 0 một xu thế nào đó. 0 2 4 6 8 10 12 X Q(m3/s) Y3000 6400 2500 6350 2000 6300 1500 6250 1000 6200 500 0 6150 900 1100 1300 1500 1700 1900 2100 9400 9450 9500 9550 9600 9650 9700 9750 9800 57 X Qb (m3/s)
  58. 3.10 Phân tích tương quan tuyến tính Đường hồi quy: Giả sử có hai đại lượng X và Y có quan hệ thống kê với nhau, trong đó Y là biến phụ thuộccòn X là biến độc lập. Giả sử tiến hành n lần thí nghiệm hoặc quan trắc, sẽ nhận được n cặp số liệu như sau: (x1, y1); (x2, y2); ; (xi, yi); ; (xn yn) Yêu cầu thiết lập quan hệ tương quan tuyến tính giữa biến phụ thuộc Y theo biến độc lập X theo dạng tương quan thẳng (tương quan tuyến tính). 58
  59. 3.10 Phân tích tương quan tuyến tính 10 Y 9 y b 0 b 1 x 8 7 Hµm mËt ®é x¸c suÊt 6 5 4 3 2 y 1 1 0 0 2 4 6 8 10 X Tương ứng với giá trị xi là giá trị trung bình của các đại lượng y (trị số bình quân có điều kiện). Đường phối hợp tốt nhất biểu thị quan hệ giữa xi và trị số bình quân có điều kiện là đường thẳng hồi quy. Phương trình của đường thẳng hồi quy: y = b0 + b1x là phương trình hồi quy 59 tuyến tính
  60. 3.10 Phân tích tương quan tuyến tính a. Xác định phương trình hồi quy tuyến tính bằng giải tích Khoảng lệch giữa điểm thực đo (xi, yi) với đường thẳng hồi quy là: yi - y = yi – (b0+b1xi) Theo phương pháp bình phương tối thiểu, muốn cho đường thẳng phối hợp tốt nhất thì tổng bình phương của khoảng lệch phải nhỏ nhất, nghĩa là: n n 2 (y y ) 2 y (b b x ) min  i  i 0 1 i  1 1 60
  61. 3.10 Phân tích tương quan tuyến tính a. Xác định phương trình hồi quy tuyến tính bằng giải tích Tức lại đạo hàm riêng theo b0 và b1 phải bằng 0  ( y (b b x )) 2  i 0 1 i 0  b 0 2  ( y (b b x ))  i 0 1 i 0  b1 Giải hệ trên ta có nghiệm: [(y y )(x x )]  i i [(y y )(x x )] b y .x  i i 0 2 b (x x ) 1 2  i (x x )  i 61
  62. 3.10 Phân tích tương quan tuyến tính  Thay b0, b1 vào được pt hồi quy tuyến tính Y theo X  Phương trình hồi quy tuyến tính X theo Y 62
  63. 3.10 Phân tích tương quan tuyến tính a. Xác định phương trình hồi quy tuyến tính bằng giải tích Hệ số tương quan r biểu thị mức độ tương quan chặt chẽ giữa hai biến X và Y. [(y y )(x x )]  i i r được tính theo công thức sau: r (x x ) 2 ( y y ) 2  i  i [(k 1)(k 1)] x y Hoặc  y i x i i i r ; k xi ; k yi (k 1) 2 (k 1) 2 x y  x i  y i Giá trị 0 ≤ r ≤ 1. Đối với hiện tượng thuỷ văn, hai đại lượng X và Y được coi là có quan hệ chặt chẽ với nhau khi 63
  64. 3.10 Phân tích tương quan tuyến tính a. Xác định phương trình hồi quy tuyến tính bằng giải tích Phương trình hồi quy viết gọn theo hệ số tương quan:  y y y r (x x ) i  x n Với: (x x ) 2  i i 1 σ x n 1 n 2 (y y )  i i 1 σ y n 1 64
  65. 3.9 Phân tích tương quan tuyến tính b. Xác định phương trình hồi quy tuyến tính bằng đồ giải 1. Chấm điểm quan hệ thực nghiệm giữa hai đại lượng X và Y. 2. Qua trung tâm nhóm điểm quan hệ kẻ đường thẳng sao cho phù hợp nhất với các điểm kinh nghiệm và coi đường đó là đường hồi quy tuyến tính có dạng: y=b0+b1x. 3. Xác định giá trị b0 và b1 bằng cách chọn hai điểm bất kỳ trên đường thẳng đã vẽ có toạ độ là (x1, y1) và (x2, y2). Lập hệ phương trình: y1=b0+b1x1 y2=b0+b1x2 65 Giải hệ phương trình trên sẽ tìm được b0 và b1.
  66. 3.9 Phân tích tương quan tuyến tính b. Xác định phương trình hồi quy tuyến tính bằng đồ giải 20Y y = 1.7899x + 2.5561 = 0.946 18 16 14 Đường hồi quy xác định 12 theo phương pháp đồ giải Đường hồi quy xácđịnh bằng y=2x+2 10 phương pháp giải tích y=1,79x+2,56 8 =0,946 6 4 0 1 2 3 4 5 6 7 8 9 X 66
  67. 3.10 Phân tích tương quan tuyến tính Bài tập thực hành: Lưu vực A tiến hành đo đạc Q từ (1990 – 2000). Lưu vực B tương tự liền kề tiến hành đo đạc Q từ (1990 – 2003). Kéo dài dòng chảy năm lưu vực A từ số liệu lưu vực B theo phương pháp tương quan. Năm 1990 1991 1992 1993 1994 1995 1996 A 255 245 244 233 238 240 247 B 219 218 217 210 215 213 216 Năm 1997 1998 1999 2000 2001 2002 2003 A 228 262 243 249 ? ? ? B 211 222 215 219 217 221 215 67
  68. Câu hỏi thảo luận chương 3 1. Phân biệt khái niệm xác suất và tần suất 2. Khái niệm về đại lượng ngẫu nhiên, mẫu, tổng thể, nguyên tắc chọn mẫu 3. Khái niệm phân bố tần suất đại lượng ngẫu nhiên rời rạc, mật độ tần suất (liên tục), đường tần suất kinh nghiệm, lý luận, các hàm phân bố PIII và K-M 4. Các công thức tính tần suất kinh nghiệm. 5. Các tham số thống kê và ảnh hưởng của tham số thống kê đến đường tần suất, ứng dụng. 6. Các phương pháp vẽ đường tần suất 7. Khái niệm về tương quan thống kê, đường hồi quy, cách xác định, hệ số 68 tương quan