Ứng dụng mạng neuron để dự báo mưa kết hợp mạng cảm biến không dây

pdf 11 trang Gia Huy 25/05/2022 660
Bạn đang xem tài liệu "Ứng dụng mạng neuron để dự báo mưa kết hợp mạng cảm biến không dây", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfung_dung_mang_neuron_de_du_bao_mua_ket_hop_mang_cam_bien_kho.pdf

Nội dung text: Ứng dụng mạng neuron để dự báo mưa kết hợp mạng cảm biến không dây

  1. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 10 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh ỨNG DỤNG MẠNG NEURON ĐỂ DỰ BÁO MƯA KẾT HỢP MẠNG CẢM BIẾN KHƠNG DÂY APPLYING NEURAL NETWORK FOR RAIN FORECAST WITH WIRELESS SENSOR NETWORK Trần Kim Toại, Dương Cao Trọng Nhân, Võ Minh Huân Trường Đại học Sư phạm Kỹ thuật TP.HCM, Việt Nam Ngày tồ soạn nhận bài 12/5/2021, ngày phản biện đánh giá 31/5/2021, ngày chấp nhận đăng 28/6/2021. TĨM TẮT Trong thời gian gần đây, các thuật tốn máy học được ứng dụng rộng rãi cho việc giải quyết các bài tốn dự đốn phức tạp trong đĩ cĩ dự báo thời tiết. Với những ưu điểm vượt trội như tính linh hoạt, độ chính xác cao, đa dạng về ứng dụng, xử lý dữ liệu cĩ tính biến động theo thời gian, các thuật tốn máy học mang tính khách quan và đáp ứng được nhiều yêu cầu của thực tiễn hơn so với các phương pháp trước đây. Mục đích nghiên cứu mà tác giả muốn hướng đến là thiết kế hệ thống dự báo mưa dựa trên mạng nơron nhân tạo kết hợp với mạng cảm biến khơng dây. Mạng nơron nhân tạo sẽ xử lý các thơng số mơi trường được thu thập từ mạng cảm biến để đưa ra dự báo về sự kiện mưa. Mơ hình mạng nơron sẽ được xây dựng và lựa chọn các thơng số phù hợp bằng các sai số dự đốn. Hiệu suất của hệ thống dự báo thời tiết với mơ hình mạng nơron đã xây dựng sẽ được kiểm chứng thơng qua quá trình thực nghiệm với lượng dữ liệu được thu thập từ thực tế. Hệ thống cĩ thể cập nhật liên tục các thơng số mơi trường tại nhiều địa điểm. Cơ sở dữ liệu sẽ luơn được cập nhật liên tục với các thơng số được thu thập theo thời gian thực và đa dạng vì dữ liệu sẽ được thu thập tại nhiều địa điểm lắp đặt các nút cảm biến trong một khu vực lớn triển khai mạng cảm biến khơng dây để tăng thêm độ tin cậy cho kết quả dự báo. Đồng thời, cơ sở dữ liệu cũng sẽ dựa trên những thơng số được lấy từ các website lưu trữ lịch sử thời tiết làm cơ sở cho tập huấn luyện của mơ hình hệ thống. Ngồi ra, kết quả dự báo của hệ thống sẽ sự kiện thời tiết sắp tới theo mơ hình phân loại (mưa hay khơng mưa) thay vì các thơng số thời tiết, như vậy sẽ dễ dàng hơn cho người dùng hoặc các hệ thống tự động vì nếu kết quả dự báo là các thơng số thời tiết thì ta phải phân tích các thơng số dự đốn này sau đĩ mới cĩ thể gửi đến người dùng. Với kết quả dự báo là sự kiện mưa mà tác giả đang hướng đến, từ phía người dùng hay các hệ thống tự động cĩ thể đưa ra quyết định thực thi hay khơng các tác vụ như tưới tiêu, phun sương, để đảm bảo nơng sản trong các ứng dụng nơng nghiệp chính. Từ khĩa: Mạng thần kinh nhân tạo; Mạng cảm biến khơng dây; Máy học; Dự báo thời tiết; nơng nghiệp thơng minh. ABSTRACT In recent times, machine learning algorithms are widely applied to solve complex nonlinear problems including weather forecasting. With outstanding advantages such as flexibility, high accuracy, variety of applications, data processing with time fluctuations, machine learning algorithms are objective and meet many practical requirements than the previous methods. The research aims to design a rain forecasting system based on artificial neural networks combined with wireless sensor networks. The neural network processes the environmental parameters collected from the sensor network to make the rain event forecast. A neural network model will be built and selected suitable parameters based on prediction errors. Predictive error is the difference between the real value and the forecasted value to assess the quality or suitability of the forecasting model. The performance of the weather forecasting Doi:
  2. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 11 system with the built neural network model will be verified through an experimental process with the amount of data collected from reality. The system can continuously update the environmental parameters in many locations. The database will always be constantly updated with various real-time and diverse parameters as data will be collected at multiple sensor nodes installed in a large network deployment area to added reliability for forecast results. At the same time, the database will also be based on parameters taken from weather history storage websites as the basis for the training set of the system model. In addition, the forecast results of the system will be of upcoming weather events according to the classification model (rain or no rain) instead of weather parameters, so it will be easier for users or systems to make a decision because if the forecast results are weather parameters, we have to analyze these predictive parameters before sending them to the user. From the user side, the automated systems can make decisions based on forecasting the rain event whether to execute tasks such as irrigation or misting and assurance of agro-products in agricultural applications. Keywords: Neural Network; Wireless Sensor Network; Machine Learning; Weather Forecasting; smart agriculture. Cĩ rất nhiều nghiên cứu đã khai thác về vấn 1. TỔNG QUAN đề này và cho chúng ta thấy được sự đa dạng Ngày nay, sản xuất nơng nghiệp ở Việt về ứng dụng của các thuật tốn để giải quyết Nam vẫn phụ thuộc rất nhiều vào thời tiết. Sự các bài tốn trong thực tế. thay đổi thất thường của các yếu tố thời tiết sẽ ảnh hưởng trực tiếp đến hoạt động sản Ref. [8] cho chúng ta thấy được sự hiệu xuất nơng nghiệp, nhất là trồng trọt. Vậy nên quả của mạng cảm biến và máy học để xử lý những thơng tin, thực hiện dự đốn. Ngồi ra, nếu những thay đổi thời tiết cĩ thể được dự đốn với độ chính xác đáng tin cậy thì chúng những nghiên cứu sau đây cũng đã đề cấp rất ta cĩ thể sử dụng những dự đốn này để giúp nhiều đến sự kết hợp của mạng cảm biến người nơng dân cũng như các hệ thống nơng khơng dây và các mơ hình máy học [9-12]. nghiệp tự động đưa ra quyết định điều chỉnh Bên cạnh đĩ, những nghiên cứu về dự phù hợp giúp cho sản phẩm nơng nghiệp đốn được sử dụng rất nhiều trong vấn đề luơn ở trong mơi trường tốt nhất để phát triển, thiên tai, lũ lụt. Cĩ thể kể đến một vài đề tài cũng như tránh được ảnh hưởng hoặc giảm đã sử dụng mạng cảm biến kết hợp với mơ thiểu thiệt hại từ thời tiết xấu [1]. hình Neural Network để giải quyết bài tốn Mặc dù khoa học dự báo thời tiết ra đời dự báo lũ lụt, thiên tai [13-17]. Ngồi những đã ra đời từ rất lâu nhưng hiện nay chất ứng dụng về dự báo lũ lụt, dự báo những lượng cơng tác dự báo thời tiết vẫn đang thơng số thời tiết hằng ngày trong thời gian khơng ngừng được các nhà khoa học nghiên gần với mơ hình mạng Neural Network cũng cứu và cải thiện. Cĩ rất nhiều phương pháp đã được áp dụng từ rất lâu như Ref [18-19]. đang được triển khai hiện nay. Các thuật tốn Ngồi những ứng dụng về dự báo, các thuật máy học đang được sử dụng rộng rãi để giải tốn máy học cịn cĩ thể sử dụng để lọc dữ quyết các bài tốn dự đốn ở khắp nơi trên liệu và giảm thiểu dữ liệu lưu trữ khơng cần thế giới. Được biết đến và ứng dụng nhiều thiết [20]. phải kể đến những thuật tốn như Neural Thuật tốn máy học đang được ứng dụng Network, Support Vector Machine (SVM), để xử lý rất nhiều vấn đề trong thực tế với Naive Bayes, Linear Regression v.v. [2]. nhiều lĩnh vực khác nhau. Bên cạnh đĩ, các Trong đĩ thuật tốn Neural Network đang nghiên cứu trên về dự báo đa phần đều sử được sử dụng rất phổ biến trong dự đốn ơ dụng cơ sở dữ liệu được lấy từ các website nhiễm mơi trường, dự đốn thời tiết, dự đốn lưu trữ lịch sử thời tiết từ nhiều năm về trước mơi trường gây hại cho cây trồng, v.v. [3-7]. và kết quả dự báo từ hệ thống mà các nghiên
  3. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 12 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh cứu này xây dựng là các thơng số thời tiết Nghiên cứu thực hiện một hệ thống dự (nhiệt độ, độ ẩm, tốc độ giĩ, số giờ nắng ). báo thời tiết với độ chính xác cao, cung cấp Xây dựng hệ thống cĩ thể cập nhật liên tục một cơng cụ hữu hiệu cho nơng dân và các các thơng số mơi trường tại nhiều địa điểm là hệ thống nơng nghiệp tự động để giảm thiểu cần thiết. Cơ sở dữ liệu sẽ luơn được cập các tác động tiêu cực từ thời tiết với mơi nhật liên tục với các thơng số được thu thập trường phát triển sản phẩm nơng nghiệp. theo thời gian thực và đa dạng vì dữ liệu sẽ 2. CƠ SỞ LÝ THUYẾT được thu thập tại nhiều địa điểm lắp đặt các nút cảm biến trong một khu vực lớn triển Hệ thống thu thập và phân tích dữ liệu khai mạng cảm biến khơng dây. Ngồi ra, kết bao gồm mạng cảm biến khơng dây dùng để quả dự báo của hệ thống sẽ sự kiện thời tiết thu thập dữ liệu sử dụng chuẩn truyền dữ liệu sắp tới theo mơ hình phân loại (mưa hay khơng dây Zigbee được đề cập mục 2.1 và 2.2. khơng mưa) thay vì các thơng số thời tiết. Mạng thần kinh nhân tạo xử lý dữ liệu và đưa Như vậy sẽ dễ dàng hơn cho người dùng ra quyết định dự báo được phân tích mục 2.3. hoặc các hệ thống tự động vì nếu kết quả dự 2.1 Mạng cảm biến khơng dây báo là các thơng số thời tiết thì hệ thống phải phân tích các thơng số dự đốn này sau đĩ Mạng cảm biến khơng dây là hệ thống mới cĩ thể gửi đến người dùng. Với kết quả các nút cảm biến kết nối với nhau bằng sĩng dự báo là sự kiện mưa mà nghiên cứu đang vơ tuyến và từ đĩ hình thành một mạng lưới hướng đến, từ phía người dùng hay các hệ liên kết, trong đĩ các nút này thường là các thống tự động cĩ thể đưa ra quyết định thực thiết bị nhỏ gọn, giá thành thấp và cĩ khả thi hay khơng các tác vụ như tưới tiêu, phun năng thu thập các thơng số mơi trường xung sương, để đảm bảo nơng sản trong các ứng quanh khu vực lắp đặt. Các điểm cảm biến dụng nơng nghiệp. này được lắp đặt số lượng lớn và phân bố một cách khơng cĩ hệ thống trên một diện Hệ thống dự báo mưa mà tác giả đề xuất tích rộng, cĩ thời gian hoạt động lâu dài và bao gồm một thiết bị cĩ thể cập nhật dữ liệu sử dụng nguồn năng lượng hạn chế [21]. mơi trường theo thời gian thực và một thuật tốn máy học để dự đốn sự kiện mưa trong Một nút cảm biến được cấu tạo bởi 4 tương lai. Các dữ liệu mơi trường bao gồm thành phần cơ bản sau : bộ xử lý, bộ cảm nhiệt độ, độ ẩm sẽ được thu thập từ xa sau đĩ biến, bộ thu phát khơng dây và nguồn cung xử lý trên máy tính. Mơ hình máy học Neural cấp. Tuỳ theo mục đích ứng dụng, nút cảm Network cùng với thuật tốn Back biến cịn cĩ thể cĩ các thành phần bổ sung Propagation sẽ được triển khai để xử lý dữ như hệ thống định vị và thiết bị di động [22]. liệu mơi trường, từ đĩ sẽ đưa ra dự đốn sự 2.2 Cơng nghệ truyền thơng khơng dây kiện mưa vào ngày tiếp theo. Với sự kiện đã Zigbee được dự đốn sẽ là cơ sở để đưa ra những quyết định tức thời một cách thuận tiện trong Cơng nghệ ZigBee được xây dựng dựa nhiều lĩnh vực như nơng nghiệp (điều khiển trên tiêu chuẩn 802.15.4 của tổ chức IEEE. tưới tiêu, bĩn phân, điều chỉnh nhiệt độ), Tiêu chuẩn 802.15.4 này sử dụng tín hiệu cơng nghiệp (điều khiển động cơ, vận hành radio cĩ tần sĩng ngắn [23]. Mục tiêu của hệ thống làm mát), v.v. Bên cạnh đĩ, những cơng nghệ ZigBee là nhắm tới việc truyền tin đánh giá về hiệu quả khi áp dụng mơ hình với mức tiêu hao năng lượng nhỏ và cơng Neural Network vào hệ thống dự báo và hiệu suất thấp cho những thiết bị chỉ cĩ thời gian năng của mơ hình này so với các mơ hình hoạt động từ vài tháng đến vài năm mà thuật tốn dự đốn phổ biến khác như: SVM, khơng yêu cầu cao về tốc độ truyền tin [24]. Logistic Regression, Naive Bayes, v.v. cũng 2.3 Mạng thần kinh nhân tạo sẽ được thể hiện. Mạng thần kinh nhân tạo (Artificial Neural Network) là mơ hình xử lý thơng tin
  4. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 13 được mơ phỏng dựa trên hoạt động của hệ mơ hình mạng nơron truyền thẳng nhiều lớp. thống thần kinh của sinh vật, bao gồm số Sau khi huấn luyện, kết quả đầu ra của mơ lượng lớn các Neuron được gắn kết để xử lý hình chính là kết quả dự báo sự kiện mưa. thơng tin và kết nối với nhau thơng qua các 3.2 Sơ đồ phần cứng hệ thống và lưu đồ liên kết (gọi là trọng số liên kết), làm việc hoạt động như một thể thống nhất để giải quyết một vấn đề cụ thể nào đĩ [25-26]. Sơ đồ chi tiết hệ thống phần cứng sẽ gồm các khối được thể hiện ở hình sau: Mạng nơron nhân tạo là hệ thống bao gồm nhiều nơron nhân tạo kết hợp với nhau. Mỗi nơron cĩ các đặc tính đầu vào, đầu ra và Thuật tốn dự đốn thực hiện một số chức năng tính tốn cục bộ. Mạng nơron cĩ khả năng học, khái quát hĩa ZIGBEE UART WiFi tập dữ liệu học thơng qua việc gán và hiệu KHỐI KHỐI ĐIỀU TRUYỀN KHIỂN chỉnh các trọng số liên kết [27-29]. Nút CB 1 NHẬN DỮ LIỆU Nút CB 2 3. THIẾT KẾ HỆ THỐNG KHỐI NGUỒN 3.1 Tổng quan hệ thống Các dữ liệu thời tiết để cập nhật cho tập Hình 2. Sơ đồ phần cứng hệ thống dữ liệu đầu vào của mơ hình được đo lường Chức năng thành phần của hệ thống trực tiếp bằng các cảm biến nhiệt độ, độ ẩm. được trình bày trong hình 2: Tuy nhiên, ở các vị trí khác nhau thì thơng số Khối nguồn cĩ chức năng cung cấp thời tiết sẽ cĩ sự thay đổi nhất định, vì vậy nguồn cho tất cả các mạch trong hệ thống. nhiều nút cảm biến Khối xử lý trung tâm sẽ liên lạc giữa khối truyền nhận dữ liệu thơng qua chuẩn Prediction result truyền thơng UART và với máy chủ thơng 0 – No rain 1- rain qua WiFi. Tập hợp các giá trị thu thập được từ cảm biến sau đĩ lần lượt gửi về máy chủ. Đồng thời, khối trung tâm cũng sẽ gửi tín hiệu đến khối điều khiển sau khi máy chủ Nhiệt độ, Độ ẩm đưa ra dự đốn. khơng khí Khối truyền nhận nhận dữ liệu là một trạm trung gian để nhận dữ liệu từ các nút cảm biến cũng như truyền dữ liệu đến khối xử lý trung tâm. Hình 1. Sơ đồ hoạt động của hệ thống được Nút cảm biến cĩ chức năng thu thập các đặt ở nhiều vị trí khác nhau . giá trị nhiệt độ, độ ẩm khơng khí ở nhiều khu vực khác nhau. Hình 1 trình bày sơ đồ hoạt động của hê thống thu thập và xử lý dữ diệu. Các thơng số Máy chủ xử lý các dữ liệu nhận từ khối nhiệt độ, độ ẩm của từng nút cảm biến sẽ xử lý trung tâm và đưa tới đầu vào của mơ được gửi đến bộ xử lý trung tâm, việc truyền hình thuật tốn dự đốn và huấn luyện mơ nhận dữ liệu sẽ thơng qua thiết bị phần cứng hình dựa trên những dữ liệu được cung cấp. cĩ thể giao tiếp theo chuẩn khơng dây với Đồng thời đưa ra kết quả dự đốn sau khi khoảng cách phù hợp. Bộ xử lý trung tâm sẽ hồn thành huấn luyện mơ hình. đưa dữ liệu đến máy chủ – nơi thực hiện quá Khối điều khiển sẽ nhận tín hiệu từ khối trình huấn luyện của thuật tốn lan truyền xử lý trung tâm để thực thi đĩng mở các thiết ngược. Dữ liệu trên máy chủ sẽ là đầu vào của
  5. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 14 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh bị sau khi thuật tốn đưa ra kết quả dự báo về Nơron Giá trị của nơron sự kiện mưa sắp tới. 1: Nhiệt Nơron 1 lớp ra chính là kết độ T1 quả dự báo của mơ hình tương Lưu đồ của hệ thống sẽ gồm các bước ứng với 0 là Nơron khơng mưa, 1 là 2: Độ Nơron 2 cĩ mưa được thể hiện như hình 3. ẩm T1 1000 nơron tương Số lượng nơron lớp Nơron ứng với 1000 thơng 1: Giá Bắt đầu ẩn sẽ được xác định số nhiệt độ và độ ẩm trị 0 ở 500 thời điểm bằng thực nhiệm hoặc 1 khác nhau Nơron 999: Nơron n Thu thập dữ liệu Nhiệt độ -1 T500 Nơron 1000: Nơron n Độ ẩm Huấn luyện mơ hình T500 Kiểm thử mơ hình Hình 4. Mơ hình Neural Network thực nghiệm Mơ hình dự 3.4 Huấn luyện mơ hình mạng đốn với sai số nhỏ nhât Lưu đồ huấn luyện mơ hình mạng neuron được trình bày trong hình 5. Kết thúc Bắt đầu Hình 3. Lưu đồ hệ thống 3.3 Xây dựng mơ hình dự báo Đọc dữ liệu từ file JSON, CSV Các bước xây dựng một mạng Neuron và chuẩn hĩa bao gồm: Tách dữ liệu thành 2 phần Bước 1: Chuẩn hĩa dữ liệu đầu vào và phân trainning dataset và testing chia tập dữ liệu. dataset Bước 2: Thiết kế cấu trúc mạng Sử dụng training data là đầu vào của mơ hình mạng Neural Bước 3: Khởi tạo giá trị ngẫu nhiên cho trọng Network số. Xử lý và huấn luyện mơ hình Bước 4: Thực hiện giai đoạn lan truyền tiến mạng bằng thuật tốn Back đi qua tồn bộ các lớp của mạng. Probagation Bước 5: Tính sai số trên bộ học ở đầu ra và Sử dụng testing dataset để kiểm quyết định xem cĩ học tiếp hay khơng, nếu tra độ chính xác của mơ hình học tiếp thì chuyển đến bước 5 nếu khơng thì giữa dữ liệu thực tế và dự đốn dừng vịng lặp. Kết thúc Bước 6: Tính sai số trên từng nút của mỗi lớp để cập nhật trọng số và tiếp tục lặp lại bước 3. Hình 5. Lưu đồ huấn luyện Neural Network Hình 4 dưới đây là cấu trúc của mạng Tập dữ liệu ban đầu được chia thành 2 tập nơron truyền thẳng với 3 lớp (1 lớp vào, 1 dữ liệu thành phần, bộ dữ liệu thứ nhất dùng lớp ẩn, 1 lớp ra) sau khi đã lựa chọn: làm dữ liệu đầu vào cho bài tốn dự báo, bộ dữ liệu thứ hai dùng để kiểm tra kết quả của phương pháp dự báo. Trong bài tốn dự báo sử dụng mạng nơron nhân tạo, bộ số liệu thứ nhất sẽ được đưa vào mạng để huấn luyện. Sau mỗi lần lặp của quá trình huấn luyện, mạng sẽ lưu lại ma trận trọng số và đối chiếu sai số của mạng với sai số cho phép ban đầu.
  6. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 15 Kết quả của quá trình huấn luyện là mơ hình mạng đã được huấn luyện với tập dữ liệu chính là ma trận trọng số cĩ sai số nhỏ nhất. 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1 Tiền xử lý dữ liệu Dữ liệu cần thiết để làm đầu vào cho mơ hình dự đốn là nhiệt độ: đơn vị là ºC và độ ẩm khơng khí: đơn vị là %. Để kết quả dự đốn cĩ độ tin cậy cao tác giả sẽ sử dụng hai nguồn dữ liệu để xây dựng cơ sở dữ liệu cho mơ hình mạng huấn luyện. Bên cạnh dữ liệu Hình 7. Thơng số thời tiết csv file từ các website lưu trữ lịch sử thời tiết. Cơ sở Các giá trị của hai thơng số này tương dữ liệu cũng sẽ được cập nhật liên tục với các đối chênh lệch nhau. Sự chênh lệch này yêu dữ liệu được thu thập theo thời gian thực từ cầu phải chuẩn hĩa dữ liệu đầu vào để các các nút cảm biến được triển khai mơ hình thơng số đầu vào của mạng cĩ vai trị như mạng cảm biến khơng dây. nhau và chúng ảnh hưởng đến kết quả đầu ra Hai nút cảm biến sẽ được đặt ở 2 khu ở mức độ nhất định. vực cách xa nhau khoảng 500m và thu thập 4.2 Lựa chọn dữ liệu dữ liệu liên tục với thời gian cách nhau là 5 phút giữa các lần đo, sau đĩ gửi đến khối xử Các dữ liệu nhiệt độ, độ ẩm sẽ được chia lý trung tâm, dữ liệu tại đây sẽ được lưu trữ thành 2 tập dữ liệu bao gồm Training dataset lên máy chủ dưới dạng file json như được và Testing dataset như được biểu diễn trong trình bày trong hình 6 và sẵn sàng để đưa đến Bảng 1. Training dataset dùng để làm đầu đầu vào của mơ hình huấn luyện dự báo. vào để thực thi thuật tốn huấn luyện mơ hình mạng. Testing dataset dùng để đánh giá độ chính xác của mơ hình mạng sau khi huấn luyện Bảng 1. Bảng phân chia dữ liệu huấn luyện và kiểm thử Dataset Training Testing dataset dataset Website 5000 data 2000 data (70%) (30%) Hình 6. Thơng số thời tiết json file Sensor 65000 data 28000 data Ngồi ra, dữ liệu nhiệt độ và độ ẩm (70%) (30%) khơng khí trên website dự báo thời tiết tại Hai tập dữ liệu này sẽ tập hợp các dữ thành phố Hồ Chí Minh cũng sẽ là đầu vào liệu được lấy từ 2 nguồn sau: của mơ hình huấn luyện dự báo. Các dữ liệu này được thu thập với thời gian cách nhau là Dữ liệu nhiệt độ, độ ẩm từ cơ sở dữ liệu 1 tiếng và được lưu dưới dạng file csv trong trên website dự báo thời tiết tại thành phố Hồ hình 7. Chí Minh (từ 0h 1/4/2020 đến 0h 1/9/2020) và lưu trữ ở máy chủ dưới dạng file csv. Dữ liệu nhiệt độ, độ ẩm từ các nút cảm biến được thu thập tại các khu vực đặt nút
  7. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 16 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh cảm biến (từ 0h 20/4/2020 đến 0h 25/7/2020) học sẽ diễn ra lâu hơn dẫn đến việc tiêu tốn và lưu trữ trên máy chủ dưới dạng file json. tài nguyên phần cứng. 4.3 Thực nghiệm thuật tốn Với kết quả trên, ta thực hiện huấn luyện Tập dữ liệu training dataset ở bảng 1 sẽ mơ hình 100 noron ẩn với 100 vịng lặp để được chia thành các mảng dữ liệu. Mỗi tập sẽ quan sát được quá trình huấn luyện của mạng. cĩ 1000 dữ liệu nhiệt độ, độ ẩm ở 500 thời Đồng thời theo dõi kết quả ở từng lần lặp để điểm khác nhau và sẽ được phân chia vào 2 đánh giá quá trình học. nhĩm trên. Các tập dữ liệu này sẽ lần lượt được đưa vào để huấn luyện cho mạng bao gồm 70 tập dữ liệu để tăng khả năng học của mạng với nhiều trường hợp thời tiết khác nhau. Đầu ra mong muốn của mơ hình này là 0 (khơng mưa) và 1 (cĩ mưa) sẽ được so sánh với đầu ra huấn luyện của mơ hình sau mỗi vịng lặp để tính tốn sai số của mạng ở mỗi lần lặp. Sai số hàm lỗi và đầu ra huấn luyện sẽ được cập nhật sau mỗi vịng lặp huấn Hình 8. Hàm mất mát Cross Entropy với 100 luyện khi ma trận trọng số đã được thay đổi ở vịng lặp lần lặp trước. Ma trận trọng số sẽ được khởi Với kết quả ở hình 8, ta cĩ thể thấy hàm tạo ngẫu nhiên ở lần lặp đầu tiên. mất mát giảm từ 2.77287201 xuống Bảng 2. Huấn luyện mơ hình mạng với số 0.05124195 sau 100 lần lặp của quá trình nơron lớp ẩn khác nhau huấn luyện. Hàm mất mát của mơ hình đang Số liệu của Số liệu dự báo ứng với số lượng nơron lớp ẩn dần tiến đến cực tiểu lý tưởng là 0 qua các mơ hình mạng 10 50 100 200 500 lần lặp huấn luyện. Đầu ra mơ 0.988663 0.988876 0.988851 0.988048 0.987697 Với đầu ra dự đốn lý tưởng của nút ra hình (rain 09 55 99 23 83 dự đốn mưa là 1 và nút ra dự đốn khơng node) mưa là 0. Sau 100 lần lặp của quá trình huấn Đầu ra mơ 0.013191 0.012658 0.012153 0.012960 0.013509 hình (no rain 32 71 56 3 66 luyện, ta thấy đầu ra của mạng giảm từ 0.518 node) xuống 0.013 với nút đầu ra dự đốn khơng Sai số hàm 0.048 0.047 0.046 0.049 0.05 mưa và tăng từ 0.519 lên 0.987 với nút đầu ra mất mát dự đốn cĩ mưa. Với kết quả ở hình 9, ta cĩ Sai số MSE 0.000102 0.000096 0.000093 0.000105 0.000112 thể thấy các nút đầu ra của mạng đang tiến Sai số MAE 0.0101 0.0098 0.0096 0.0102 0.0106 dần đến dự đốn lý tưởng sau mỗi vịng lặp Sai số RMSE 0.0101 0.0098 0.0097 0.0103 0.0106 huấn luyện. Thực nghiệm trong bảng 2 cho thấy, số nơron lớp ẩn là 100 nơron dự báo tốt nhất với sai số thấp nhất trên cả 3 phương pháp đánh giá sai số MSE, RMSE và MAE. Trong 3 phương pháp trên thì phương pháp tính sai số MSE cho sai số thấp nhất. Từ bảng 2, ta thấy nếu số lượng nơron lớp ẩn quá ít hoặc quá nhiều thì mạng sẽ cho độ chính xác khơng cao. Đặc biệt số lượng nơron lớp ẩn quá lớn thì sai số giảm khơng đáng kể và quá trình
  8. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 17 Hình 9. Đầu ra mơ hình với 100 vịng lặp Support Vector Machine 0.005 4.4 Kiểm thử thuật tốn K – Nearest Neighbor 0.003 Tập dữ liệu testing dataset sẽ được chia thành 30 tập test với mỗi tập test là 1000 dữ Decision Tree 0.008 liệu nhiệt độ và độ ẩm ở 500 thời điểm khác Random Forest 0.028 nhau. Ta sẽ thực hiện 30 lần kiểm thử tương Logistic Regression 0.048 ứng với 30 tập test này bằng mơ hình mạng đã được huấn luyện để đánh giá khả năng dự So sánh kết quả độ chính xác của các đốn của mạng sau khi đã huấn luyện. thuật tốn ở bảng 5 với thời gian huấn luyện ở bảng 4, ta cĩ thể thấy rằng các thuật tốn Bảng 3. Kiểm thử với tập dữ liệu testing cĩ thời gian huấn luyện dài sẽ cho kết quả dự dataset đốn tốt hơn so với các mơ hình thuật tốn cĩ Confusion Predict: Predict: thời gian huấn luyện ngắn. Mơ hình thuật matrix No Yes tốn Neural Network với thời gian huấn Actual: No 13 0 luyện là 0.57 giây tương ứng với độ chính xác là 90%. Kế tiếp là Logistic Regression Actual: Yes 3 14 với 0.048 tương ứng với 86.6%. Các thuật Với bảng 3, ta cĩ 27 lần dự đốn đúng tốn Naive Bayes, SVM, KNN, Decision trên tổng số 30 lần kiểm thử. Trong đĩ, 13 Tree cĩ tỉ lệ thấp hơn, dao động từ 76.6% đại diện cho số lần dự đốn đúng rằng mưa đến 83.3% nhưng cĩ thời gian huấn luyện sẽ khơng xảy ra và 14 là số dự đốn đúng ngắn hơn so với 2 mơ hình thuật tốn trước, rằng mưa sẽ xảy ra. Ngược lại, ta cĩ 3 dự dao động từ 0.003 – 0.008 giây. Điều này cho đốn sai trên tổng số 30 lần kiểm thử. Trong ta thấy rằng thời gian huấn luyện mơ hình sẽ đĩ, 3 là số lần dự đốn khơng mưa nhưng tỷ lệ nghịch với độ chính xác của mơ hình thực tế là mưa đã xảy ra và 0 là số lần dự thuật tốn. đốn cĩ mưa nhưng thực tế là mưa đã khơng Bảng 5. Phần trăm dự đốn của các thuật tốn xảy ra. Algorithm Accuracy (%) 4.5 So sánh thuật tốn Neural Network 90 Để chứng minh tính hiệu quả của thuật Naive Bayes 76.6 tốn lan truyền ngược với mơ hình mạng nơron nhiều lớp, tác giả tiến hành huấn luyện Support Vector Machine 80 và kiểm thử so sánh với các thuật tốn khác K – Nearest Neighbor 76.6 như Nạve Bayes, Support Vector Machine, K – Nearest Neighbor, Decision Tree, Decision Tree 83.3 Random Forest, Logistic Regression [2] với Random Forest 60 cùng tập dữ liệu huấn luyện. Kết quả đánh Logistic Regression 86.6 giá so sánh được trình bày trong Bảng 4 với so sánh thời gian huấn luyện và Bảng 5 với Tuy nhiên, mơ hình thuật tốn Random phần trăm độ chính xác. Forest cĩ thời gian huấn luyện lâu hơn các Bảng 4. Thời gian huấn luyện của các thuật thuật tốn Naive Bayes, SVM, KNN, tốn Decision Tree nhưng độ chính xác dự đốn Algorithm Training time lại khá thấp với 60%. Điều này chứng tỏ (s) Random Forest chưa huấn luyện hiệu quả với Neural Network 0.57 các thơng số đã chọn hoặc mơ hình này chưa thích hợp để xử lý các thơng số dữ liệu về Naive Bayes 0.007 thời tiết.
  9. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 18 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 5. KẾT LUẬN 86.6%. Các thuật tốn Naive Bayes, SVM, Trong bài báo này, tác giả đa xây dựng KNN, Decision Tree cĩ tỉ lệ thấp hơn, dao một mơ hình thu thập dữ liệu ổn định, tiêu động từ 76.6% đến 83.3%. tốn ít năng lượng, các điểm thu thập hoạt LỜI CÁM ƠN động ở nhiều khu vực khác nhau. Các thực Bài báo được thực hiện với sự hỗ trợ nghiệm cho thấy, nếu như được huấn luyện kinh phí từ dự án số: T2020-48TĐ, bởi tốt trên tập các dữ liệu đầy đủ và hồn thiện Trường Đại học Sư phạm Kỹ thuật TP.HCM, với các tham số được lựa chọn cẩn thận thì Việt Nam. kết quả dự báo đạt độ chính xác cao tới 90% với mơ hình sử dụng mạng neuron so với các mơ hình khác như Logistic Regression với TÀI LIỆU THAM KHẢO [1] National strategy on climate change. Internet: Strategies details (chinhphu.vn), 23/12/2020. [2] S. Ray. A Quick Review of Machine Learning Algorithms. 2019 International Conference on Machine Learning, Big Data, Cloud and Parallel Computing (COMITCon), 2019, pp. 35-39. [3] M. J. Kennedy. Review of applications of artificial neural networks in biotechnology, Proceedings 1993 The First New Zealand International Two-Stream Conference on Artificial Neural Networks and Expert Systems, 1993, pp. 252-254. [4] T. Schmidt, H. Rahnama and A. Sadeghian. A review of applications of artificial neural networks in cryptosystems, 2008 World Automation Congress, 2008, pp. 1-6. [5] Y. Li and W. Ma. Applications of Artificial Neural Networks in Financial Economics: A Survey, 2010 International Symposium on Computational Intelligence and Design, 2010, pp. 211-214. [6] B. Milovanovic, M. Agatonovic, Z. Stankovic, N. Doncov and M. Sarevska. Application of neural networks in spatial signal processing (invited paper), 11th Symposium on Neural Network Applications in Electrical Engineering, 2012, pp. 5-14. [7] R. Meenal and A. I. Selvakumar, Review on artificial neural network based solar radiation prediction, 2017 2nd International Conference on Communication and Electronics Systems (ICCES), 2017, pp. 302-305. [8] T. Truong, A. Dinh and K. Wahid. An IoT environmental data collection system for fungal detection in crop fields, 2017 IEEE 30th Canadian Conference on Electrical and Computer Engineering (CCECE), 2017, pp. 1-4. [9] V. F. Silva, D. F. Macedo and J. L. Leoni. Spectrum Decision in Wireless Sensor Networks Employing Machine Learning, 2014 Brazilian Symposium on Computer Networks and Distributed Systems, 2014, pp. 386-393. [10] H. Ahmadi and R. Bouallegue. Comparative study of learning-based localization algorithms for Wireless Sensor Networks: Support Vector regression, Neural Network and Nạve Bayes, 2015 International Wireless Communications and Mobile Computing Conference (IWCMC), 2015, pp. 1554-1558. [11] S. K. and V. Vaidehi. Clustering and Data Aggregation in Wireless Sensor Networks Using Machine Learning Algorithms, 2018 International Conference on Recent Trends in Advance Computing (ICRTAC), 2018, pp. 109-115. [12] T. Hemalatha, M. V. Ramesh and V. P. Rangan. Effective and Accelerated Forewarning of Landslides Using Wireless Sensor Networks and Machine Learning, in IEEE Sensors Journal, vol. 19, no. 21, pp. 9964-9975, 1 Nov.1, 2019. [13] J. K. Roy, D. Gupta and S. Goswami. An improved flood warning system using WSN and Artificial Neural Network. 2012 Annual IEEE India Conference, 2012, pp. 770-774.
  10. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 19 [14] I. R. Widiasari, L. E. Nugroho and Widyawan. Deep learning multilayer perceptron (MLP) for flood prediction model using wireless sensor network based hydrology time series data mining. 2017 International Conference on Innovative and Creative Information Technology (ICITech), 2017, pp. 1-5. [15] S. Madan, P. Kumar, S. Rawat and T. Choudhury. Analysis of Weather Prediction using Machine Learning & Big Data, 2018 International Conference on Advances in Computing and Communication Engineering (ICACCE), 2018, pp. 259-264. [16] G. Verma, P. Mittal and S. Farheen. Real Time Weather Prediction System Using IOT and Machine Learning, 2020 6th International Conference on Signal Processing and Communication (ICSC), 2020, pp. 322-324. [17] R. K. Grace and B. Suganya. Machine Learning based Rainfall Prediction, 2020 6th International Conference on Advanced Computing and Communication Systems (ICACCS), 2020, pp. 227-229. [18] Mohsen Hayati, Zahra Mohebi. Application of Artificial Neural Networks for Temperature Forecasting. World Academy of Science, Engineering and Technology, Vol 4, Issue 1, pp. 662-666, 2007. [19] A. Molano-Jimenez, A. D. Orjuela-Cađĩn and W. Acosta-Burbano. Temperature and Relative Humidity Prediction in Swine Livestock Buildings, 2018 IEEE Latin American Conference on Computational Intelligence (LA-CCI), 2018, pp. 1-4. [20] L. P. Dinesh Kumar, S. Shakena Grace, A. Krishnan, V. M. Manikandan, R. Chinraj and M. R. Sumalatha. Data filtering in wireless sensor networks using neural networks for storage in cloud, 2012 International Conference on Recent Trends in Information Technology, 2012, pp. 202-205. [21] H. Sharma and S. Sharma. A review of sensor networks: Technologies and applications, 2014 Recent Advances in Engineering and Computational Sciences (RAECS), 2014, pp. 1-4. [22] Ian F. Akyildiz and Mehmet Can Vuran. Wireless Sensor Network. John Wiley & Sons Ltd, 2010, pp. 10-15. [23] Jose A. Gutierrez; Edgar H. Callaway; Raymond L. Barrett. IEEE Std 802.15.4 Technical Overview. Low-Rate Wireless Personal Area Networks: Enabling Wireless Sensors with IEEE 802.15.4, 2007. [24] C. M. Ramya, M. Shanmugaraj and R. Prabakaran. Study on ZigBee technology. 2011 3rd International Conference on Electronics Computer Technology, 2011, pp. 297-301. [25] A. Sperduti. An overview on supervised neural networks for structure. Proceedings of International Conference on Neural Networks, 1997, pp. 2550-2554. [26] M. Chen, U. Challita, W. Saad, C. Yin and M. Debbah. Artificial Neural Networks-Based Machine Learning for Wireless Networks: A Tutorial. IEEE Communications Surveys & Tutorials, vol. 21, no. 4, pp. 3039-3071, 2019. [27] A. Menon, S. Singh and H. Parekh. A Review of Stock Market Prediction Using Neural Networks, 2019 IEEE International Conference on System, Computation, Automation and Networking (ICSCAN), 2019, pp. 1-6. [28] M. Verhelst and B. Moons, Embedded Deep Neural Network Processing: Algorithmic and Processor Techniques Bring Deep Learning to IoT and Edge Devices. IEEE Solid-State Circuits Magazine, vol. 9, no. 4, pp. 55-65, Fall 2017. [29] S. C. Sreenivasa, S. K. Agarwal and R. Kumar. Short term wind forecasting using logistic regression driven hypothesis in artificial neural network. 2014 6th IEEE Power India International Conference (PIICON), 2014, pp. 1-6. Tác giả chịu trách nhiệm bài viết: Võ Minh Huân
  11. Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 65 (08/2021) 20 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh Trường Đại học Sư phạm Kỹ thuật TP.HCM Email: huanvm@hcmute.edu.vn