Tìm hiểu về vấn đề hồi quy phi tuyến và ứng dụng trong dự báo lưu lượng giao thông

pdf 9 trang Gia Huy 4820
Bạn đang xem tài liệu "Tìm hiểu về vấn đề hồi quy phi tuyến và ứng dụng trong dự báo lưu lượng giao thông", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftim_hieu_ve_van_de_hoi_quy_phi_tuyen_va_ung_dung_trong_du_ba.pdf

Nội dung text: Tìm hiểu về vấn đề hồi quy phi tuyến và ứng dụng trong dự báo lưu lượng giao thông

  1. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TÌM HIỂU VỀ VẤN ĐỀ HỒI QUY PHI TUYẾN VÀ ỨNG DỤNG TRONG DỰ BÁO LƯU LƯỢNG GIAO THÔNG Giảng viên hướng dẫn: TS. Nguyễn Mạnh Hùng Sinh viên thực hiện: Bùi Đức Thắng Nguyễn Thị Hồng Ngân Lớp: Xây dựng CĐ ô tô và SB K58 Xây dựng đường bộ 1 K58 Tóm tắt: Ý tưởng của đề tài xuất phát từ việc phát triển hệ thống giao thông thông minh (ITS) đang được tiến hành ở nhiều thành phố trên thế giới, lấy việc sử dụng hệ thống thiết bị điện tử tin học để thu thập dữ liệu, xử lý dữ liệu lớn làm căn bản. Trong quá trình đó, có một lượng lớn dữ liệu về giao thông sinh ra và có thể được sử dụng để phát triển các công cụ gợi ý, dự báo có ích cho quá trình phát triển ITS. Trong nghiên cứu này, chúng tôi tìm hiểu về kỹ thuật hồi quy phi tuyến và ứng dụng để xây dựng công cụ dự báo lưu lượng giao thông. Từ khóa: Hồi quy tuyến tính nhiều chiều, hồi quy phi tuyến, phương pháp Gauss- Newton, hệ thống giao thông thông minh - ITS, mô hình dự báo lưu lượng giao thông 1. ĐẶT VẤN ĐỀ Như chúng ta đã biết hệ thông giao thông thông minh (ITS) là một công nghệ đang được nhiều nước trên thế giới tiếp cận một trong số đó có Việt Nam. ITS là việc ứng dụng kỹ thuật công nghệ, bao gồm các thiết bị cảm biến, điều khiển, điện tử, tin học và viễn thông trong lĩnh vực giao thông để điều hành và quản lý hệ thống giao thông vận tải. Trong quá trình này sản sinh ra nhiều dữ liệu có thể sử dụng để xây dựng các công cụ hỗ trợ, góp phần vào việc xây dựng thành công hệ thống giao thông thông minh. Tại Việt Nam, giao thông luôn là một trong những vấn đề nhức nhối của xã hội. Các hiện tượng tắc đường, ô nhiễm, tai nạn giao thông, thường xuyên xảy ra và tiêu tốn nhiều tiền của xã hội. Ngoài những nguyên nhân khách quan về cơ sở hạ tầng giao thông, ý thức, văn hóa của người tham gia giao thông, sự đan xen giữa nhiều loại hình 68 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019
  2. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI vận tải trên cùng tuyến đường, quy hoạch giao thông, chúng tôi cho rằng các vấn đề giao thông còn xuất phát từ việc thiếu thông tin của người tham gia giao thông. Phát triển hệ thống giao thông thông minh là một quá trình tất yếu, trong quá trình đó sẽ xuất hiện nhiều công cụ mang tính chất gợi ý, dự báo, giúp cho người tham gia giao thông thuận tiện hơn, tránh được những điểm ùn tắc có khả năng phát sinh, tìm kiếm lộ trình tối ưu. Trên tinh thần đó, chúng em muốn tìm hiểu về vấn đề hồi quy phi tuyến và ứng dụng vào xây dựng mô hình hồi quy dự báo lưu lượng giao thông, với vai trò của một công cụ tiện tích đóng góp vào hệ thống ITS. 2. CÁC NỘI DUNG CHÍNH 2.1. Kỹ thuật hồi quy phi tuyến a) Nhìn lai phương pháp hồi quy tuyến tính nhiều chiều Mô hình hồi quy tuyến tính cho n quan sát có thể được viết dưới dạng như sau: trong đó Y là véc tơ biến phụ thuộc, X là ma trận gồm các biến độc lập và Z là véc tơ nhiễu ngẫu nhiên với E[Z] = 0, là véc tơ tham số của mô hình. Ta cần xác định ước lượng B cho bằng cách cực tiểu hóa tổng bình phương sai số : Khi đó ta xác định được ước lượng . Ta phải tính ma trận nghịch đảo, trong quá trình này có sai số trong tính toán .Vì vậy để tránh sai số một trong những phương pháp đơn giản là ta sử dụng phân tích QR.Từ một ma trận X đã biết ta luôn biến đổi được thành tích: ở đó là ma trận trực giao (tức là ) và là ma trận với các phần tử 0 nằm dưới đường chéo chính. Ta viết Kỷ yếu nghiên cứu khoa học sinh viên năm 2019 69
  3. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI và trong đó là cột đầu tiên của và là ma trận tam giác trên . Khi đó chúng ta thu được: Để tìm ước lượng bình phương cực tiểu , ta giải hệ phương trình tam giác bằng phương pháp thế ngược. b) Phương pháp hồi quy phi tuyến Xét mô hình hồi quy thể hiện mối quan hệ giữa biến phụ thuộc Y và các biến độc lập X thông qua quan hệ hàm với tham số θ và nhiễu ( ): Trong thực tế hàm thường là hàm phi tuyến và ta có mô hình hồi quy phi tuyến tương ứng. Để xây dựng mô hình hồi quy phi tuyến, một trong những phương pháp đơn giản là biến đổi về dạng tuyến tính. Trong nhiều trường hợp, quá trình tuyến tính hóa vô tình bỏ qua nhiễu và các giả thiết về nó. Điều này làm cho mô hình được xây dựng không đảm bảo phù hợp với bộ dữ liệu. Vì vậy ta nên giữ nguyên dạng hàm phi tuyến và sử dụng phương pháp khác để xây dựng mô hình, chẳng hạn sử dụng phương pháp Gauss-Newton. Phương pháp Gauss-Newton: + Đầu tiên, ta chọn giá trị xuất phát cho véc tơ tham số là . + Xấp xỉ tuyến tính cho hàm hồi quy tại lân cận θ0: với . Kết hợp tất cả quan sát, chúng ta viết véc tơ đáp ứng kỳ vọng ở đó là ma trận đạo hàm kích thước với các phần tử là . Kết quả này tương đương với việc xấp xỉ các độ lệch, , bởi 70 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019
  4. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI trong đó và . + Gia số Gausstính được bằng cách cực tiểu hóa tổng bình phương độ lệch , theo thuật toán dưới đây: + Chuyển sang giá trị tham số tốt hơn và thực hiện bước lặp tiếp theo bằng cách tính các độ lệch mới , ma trận đạo hàm mới , và gia số mới. Quá trình này được thực hiện lặp đi lặp lại cho đến khi hội tụ, tức là cho đến khi gia số nhỏ đến mức không có ảnh hưởng đáng kể đến các thành phần của véc tơ tham số. Sự hội tụ trong phương pháp Gauss-Newton Sự hội tụ của quá trình lặp trong phương pháp Gauss-Newton phụ thuộc vào sự lựa chọn các giá trị xuất phát cho các tham số. Nếu lựa chọn không tốt, ta có thể không nhận được dãy kết quả hội tụ. 2.2. Ứng dụng trong dự báo lưu lượng giao thông Xét bài toán xây dựng mô hình hồi quy để mô tả biến thiên của lưu lượng giao thông theo thời gian. Dữ liệu được trích dẫn từ một bài báo quốc tế (xem [3]), được cho ở dưới đây: Bảng 1: Lưu lượng giao thông trên một tuyến đường một chiều Giờ Lưu lượng Giờ Lưu lượng Giờ Lưu lượng Giờ Lưu lượng 1 416 7 445 13 721 19 754 2 212 8 1412 14 772 20 543 3 121 9 1322 15 913 21 431 4 17 10 1121 16 1005 22 429 5 12 11 925 17 802 23 423 6 132 12 823 18 743 24 419 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019 71
  5. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI Hình 1. Biểu đồ phân tán thể hiện sự biến thiên lưu lượng giao thông theo giờ 2.2.1. Lựa chọn hàm hồi quy + Nhìn vào biểu đồ ta thấy diễn biến của lưu lượng giao thông theo thời gian của tuyến đường tuy phức tạp nhưng phản ánh đặc điểm chung của nhiều tuyến đường. Để đơn giản ta xét trong ba giai đoạn:  Giai đoạn I từ 1 giờ đến 7 giờ: Số lượng phương tiện giảm dần, vì phần lớn người dân đang ở nhà, từ khoảng 400 xe lúc 1 giờ sáng, đạt cực tiểu khoảng 10 xe lúc 4- 5 giờ, sau đó tăng lên đến tầm 400 xe lúc 7 giờ sáng.  Giai đoạn II từ 7 giờ đến 13 giờ: Số lượng xe tăng nhanh đến khoảng 1400 lúc 8 giờ sáng, vì đó là thời điểm người dân đổ ra đường đi làm, sau đó giảm dần đến khoảng 700 xe lúc 13 giờ.  Giai đoạn III từ 13 giờ đến 24 giờ: lượng xe tăng chậm đến khoảng 1000 xe lúc 16 - 17 giờ chiều, đó là thời điểm mọi người trở về nhà từ nơi làm việc, sau đó giảm dần đến khoảng 400 xe lúc 24 giờ. + Dữ liệu (trong mỗi giai đoạn) có thể mô tả được bởi một hàm đỉnh. Trong nghiên cứu này, chúng ta sử dụng hàm Lorentz để xây dựng đường phù hợp với dữ liệu. Hàm Lorentz là một hàm đỉnh được xác định bởi công thức: w + Kết hợp cả ba giai đoạnf ta x thu được mô hình tổng quát thể hiện sự biến đổi của w 4x x lưu lượng giao thông theo thời gian: a a a3 x y b xc b xc b3 xc3 72 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019
  6. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI trong đó là thời gian (tính theo giờ). Ta sẽ phải đi tìm các ước lượng cho 10 tham số từ dữ liệu thu thập được. y2.2.2.;ab Lựac;a chọnbc giá;a trị3b xuất3c3 phát cho các tham số Số lượng tham số nhiều, ta gặp khó khăn trong việc xác định các giá trị xuất phát cho các tham số vì khó đạt được sự hội tụ. Vì vậy ta sẽ xác định các tham số trong từng giai đoạn. a f x y 1 Giai đoạn 1: Hàm hồi quy được xác định bởi: 0 2 2 b1 x 4 . 5 Dữ liệu được sử dụng cho việc ước lượng là x 1 2 3 4 5 6 7 21 22 23 24 y 416 212 121 17 12 132 445 431 429 423 419 Quá trình tính toán các tham số được mô tả trong bảng tính dưới đây: Lần lặp 0 500 -1000 1 1 446.21 -1197.26 1.41 2 445.62 -1365.45 1.66 3 443.11 -1335.53 1.66 4 443.08 -1334.45 1.66 5 443.09 -1334.63 1.66 6 443.08 -1334.52 1.66 Bảng 2, Hình 2. Kết quả tính toán và hàm hồi quy giai đoạn 1 a f x y 2 Giai đoạn 2: Hàm hồi quy được xác định bởi: 0 2 2 b2 x 8 Dữ liệu được sử dụng cho việc ước lượng là x 1 7 8 9 10 11 12 13 21 22 23 24 y 416 445 1412 1322 1121 925 823 721 431 429 423 419 Quá trình tính toán các tham số được mô tả trong bảng tính dưới đây: Kỷ yếu nghiên cứu khoa học sinh viên năm 2019 73
  7. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI Lần lặp 0 300 15000 5 1 350.72 13613.92 3.99 2 343.17 15097.35 4.36 3 343.01 15255.78 4.38 4 343.15 15237.66 4.38 5 343.14 15237.53 4.38 6 343.15 15235.81 4.38 Bảng 3, Hình 3. Kết quả tính toán và hàm hồi quy giai đoạn 2 a f x y 3 Giai đoạn 3: Hàm hồi quy được xác định bởi: 0 2 2 b3 x 16 Dữ liệu được sử dụng cho việc ước lượng là x 1 7 13 14 15 16 17 18 19 20 21 22 23 24 y 416 445 721 772 913 1005 802 743 754 543 431 429 423 419 Quá trình tính toán các tham số được mô tả trong bảng tính dưới đây: Lần lặp 0 500 5000 2 3 3 1 370.64 4133.15 2.36 2 357.20 4937.41 2.82 3 350.27 5490.01 3.01 4 350.41 5505.32 3.01 5 350.41 5505.26 3.01 6 350.40 5505.91 3.01 Bảng 4, Hình 4. Kết quả tính toán và hàm hồi quy giai đoạn 3 2.2.3. Ước lượng tham số cho mô hình đầy đủ Với các phân tích ở trên, ta đi xác định hàm hồi quy 74 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019
  8. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI a a a f x y 1 2 3 0 22 2 2 2 2 bx.1 4 5 bx 2 8 bx 3 16 với các giá trị xuất phát cho các tham số là: Kết quả tính toán được cho ở bảng dưới đây: 4 4 3 3 3 Lần lặp 0 400 -1500 1.5 15000 4 5000 3 3 3 1 511.04 -6605.93 3.69 16390.17 3.95 -4249.26 0.86 5 439.23 -5284.21 -1.96 12912.47 3.58 947.48 1.48 10 432.15 -6566.46 -2.48 13148.75 3.61 1156.05 1.63 15 431.47 -6513.51 -2.47 13146.96 3.61 1161.01 1.63 18 431.51 -6519.83 -2.47 13154.13 3.61 1159.76 1.63 19 431.51 -6518.94 -2.47 13153.43 3.61 1160.13 1.63 20 431.50 -6518.73 -2.47 13153.41 3.61 1160.02 1.63 Bảng 4. Kết quả tính toán cho mô hình đầy đủ Hình 5. Hàm hồi quy cho mô hình đầy đủ Kỷ yếu nghiên cứu khoa học sinh viên năm 2019 75
  9. TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI 3. KẾT LUẬN - Báo cáo tìm hiểu về kỹ thuật hồi quy phi tuyến Gauss-Newton, đây là một phương pháp hữu hiệu để xây dựng mô hình phù hợp với dữ liệu quan sát. Nghiên cứu đã xây dựng thành công mô hình dự báo lưu lượng giao thông dựa trên phương pháp này. - Mục tiêu ban đầu của chúng em là quá trình xây dựng mô hình được thực hiện đồng thời với việc thu thập dữ liệu và tự động hóa. Tuy nhiên, trong quá trình nghiên cứu chúng em nhận thấy rằng, việc lựa chọn giá trị xuất phát ban đầu cho các tham số là không đơn giản và phải thực hiện bằng tay. Điều này dẫn đến câu hỏi: “Liệu rằng việc chọn các giá trị xuất phát ban đầu có thể thực hiện tự động hay không?”. Để trả lời câu hỏi đó, chúng ta cần mở rộng nghiên cứu trên nhiều bộ dữ liệu khác nhau. Tài liệu tham khảo [1]. Trần Văn Long (chủ biên), Xác suất thống kê - Tập I, NXB ĐH GTVT, 2017 [2]. Trần Văn Long (chủ biên), Xác suất thống kê - Tập II, NXB ĐH GTVT, 2017 [3]. CUI Jian-ming, Research on Data Fitting of key Model for Traffic Flow, International Journal of Digital Content Technology and its Applications, Volume 4, Number 5, August, 2010. 76 Kỷ yếu nghiên cứu khoa học sinh viên năm 2019