So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê
Bạn đang xem tài liệu "So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- so_sanh_cac_phuong_phap_ket_hop_giu_xu_ly_anh_va_may_hoc_tro.pdf
Nội dung text: So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê
- 168 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê Lê Văn Minh Khoa Công nghệ Thông tin và Truyền thông, Đại học Đà Nẵng, Việt Nam vanminh.le246@gmail.com Tóm tắt. Hiện nay, Việt Nam đang là một trong những nước xuất khẩu cà phê hàng đầu thế giới. Thực tế là việc phát triển cây cà phê ở nước ta luôn gặp thách thức về môi trường và bệnh dịch vì khí hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển. Với sự phát triển của công nghệ thông tin và các ngành nghiên cứu chuyên sâu như xử lý ảnh và máy học, việc nhận dạng và đưa ra quyết định dựa trên hình ảnh ngày càng được áp dụng rộng rãi. Điều này thúc đẩy nhóm tác giả nghiên cứu các phương pháp để ứng dụng những thành tựu hiện có trong xử lý ảnh và máy học vào việc nhận dạng bệnh của cây cà phê dựa trên hình ảnh của lá cây. Trong bài báo này, nhóm tác giả tổng hợp và so sánh các giải pháp kết hợp giữa xử lý ảnh và các thuật toán máy học trong bài toán nhận dạng. Nhóm tác giả còn minh họa bằng bài toán nhận dạng các bệnh trên cây cà phê dựa vào hình ảnh của lá cà phê. Từ khóa: máy học; nhận dạng mẫu; xử lý ảnh; trích xuất đặt trưng; tìm đường bao; 1 Giới thiệu 1.1 Nhận dạng bệnh dựa trên lá cà phê Hiện nay, Việt Nam đang là nước đứng thứ hai trên giới về xuất khẩu cà phê[1]. Diện tích trồng cà phê hiện nay khoảng 643.159 ha và sẽ tăng lên trong những năm tiếp theo[2]. Thực tế là việc phát triển cây cà phê ở nước ta luôn gặp thách thức về môi trường và bệnh dịch vì khí hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển. Điều này thúc đẩy giới khoa học nghiên cứu việc xác định các loại bệnh trên cây cà phê. Thông thường, để chẩn đoán bệnh của cây trồng người nông dân sẽ dựa vào kinh nghiệm của mình. Cụ thể là người nông dân sẽ quan sát lá cây cà phê rồi dùng những kinh nghiệm của mình để chẩn đoán bệnh. Việc chẩn đoán bệnh dựa trên kinh nghiệm luôn là vấn đề đối với nông dân vì không phải mọi người dân đều có kiến thức về bệnh của cây trồng, do đó việc phát hiện bệnh bằng kinh nghiệm không kịp thời và tỉ lệ chính xác chưa cao dẫn đến nhiều thiệt hại về kinh tế. Vì vậy cần sử dụng các phương pháp xác định bệnh nhanh chóng để nông dân có những phương pháp xử lý kịp thời. Với sự phát triển của công nghệ thông tin và các ngành nghiên cứu chuyên sâu như xử lý ảnh[3] và máy học[4], việc nhận dạng và đưa ra quyết định dựa trên hình ảnh ngày càng được áp dụng rộng rãi[5]. Điều này thúc đẩy nhóm tác giả nghiên cứu các phương pháp để ứng dụng những thành tựu hiện có trong xử lý ảnh và máy học để nhận dạng bệnh của cây cà phê dựa vào hình ảnh của lá cây. 1.2 Bài toán cần giải quyết Cho tới nay, nhiều nhóm tác giả đã công bố nhiều công trình khác nhau liên quan đến việc kết hợp sự ưu việt của xử lý ảnh và máy học để giải quyết một vấn đề cụ thể nào đó về nhận
- Lê Văn Minh 169 dạng [6]. Nhóm tác giả ở[7] đã trình bày những cống hiến của xử lý ảnh đối với việc phát hiện và điều trị bệnh tiểu đường. Ngay trong lĩnh vực nông nghiệp, nhiều công trình ứng dụng xử lý ảnh vào nhận dạng cũng được sử dụng[8][9][10]. Trong bài báo này, bài toán mà nhóm tác giả phải giải quyết là nhận biết bệnh của cây cà phê dựa vào hình ảnh của lá cà phê. Yêu cầu của bài toán này cụ thể là một chương trình nhận diện hình ảnh của lá cà phê làm đầu vào và trả về kết quả là cây cà phê đó bị bệnh gì. Để tăng tính cống hiến của công trình, nhóm tác còn giả trình bày việc so sánh các giải pháp kết hợp giữa xử lý ảnh và máy học với mục đích là áp dụng vào việc nhận biết bệnh của cây cà phê dựa trên hình ảnh của lá cà phê. Nhóm tác giả kỳ vọng công trình này sẽ hữu ích cho những nghiên cứu sau này khi chọn giải pháp cho bài toán nhận dạng bệnh đối với cây trồng dựa vào hình ảnh của lá cây. Bài báo này được tổ chức như sau: phần hai sẽ đánh giá các nghiên cứu hiện tại liên quan đến vấn đề đang trình bày; phần ba sẽ trình bày giải pháp mà nhóm tác giả đề xuất để so sánh các phương pháp nhằm chọn ra phương pháp tốt nhất; phần bốn sẽ là phần thực nghiệm và đánh giá; cuối cùng là phần kết luận và các thảo luận liên quan đến kết quả thu được. 2 Giới thiệu Nhận định đầu tiên của nhóm tác giả đó là bài toán này thuộc loại bài toán nhận dạng mẫu (pattern recognition)[11][12]. Do đó, trình tự các bước trong bài báo này tương ứng với trình tự các bước giải một bài toán nhận dạng nói chung[13][14]. 2.1 Tiền xử lý Đối tượng làm việc của bài toán này là các tập ảnh, do đó việc tiền xử lý thực chất là xử lý ảnh. Đây cũng là lý do mà nhận dạng mẫu thường gắn liền với xử lý ảnh. Phân tích màu. Như chúng ta đã biết thì có nhiều hệ thống màu thể hiện cho bức ảnh[15][16]. Để đơn giản, nhóm tác giả đề xuất tập trung vào hệ thống màu RGB[17]. Đối với hệ màu này, chúng ta sẽ tổng hợp tất cả các màu khả kiến dựa trên tỉ lệ của ba màu (xanh lục, xanh dương và màu đỏ). Việc phân tích từng kênh màu cũng đóng góp đáng kể cho việc nhận dạng như đã trình bày trong các công trình [18][19][20]. Trong đề tài này, nhóm tác giả cũng thực hiện phân tích màu vì những lá cà phê bị những bệnh khác nhau thì màu sắc cũng khác nhau. Chi tiết trình bày trong phần tiếp theo của bài báo. Phát hiện biên. Phát hiện biên cũng là một kỹ thuật quan trọng trong việc tiền xử lý dữ liệu. Các phương pháp phát hiện biên như canny[21], sobel[22], prewitt[23] cũng góp phần nâng cao độ chính xác của nhận dạng. 2.2 Trích xuất đặc trưng Trích xuất đặc trưng được xem như là bước quan trọng nhất của việc nhận dạng. Bước này quyết định chủ yếu độ chính xác của quá trình nhận dạng. Tuy vậy, việc trích xuất đặc trưng này rất khó và phụ thuộc vào từng bài toán cụ thể. Bài báo này chỉ tập trung vào việc ứng dụng các phương pháp máy học và xử lý ảnh, vì vậy nhóm tác giả chọn một phương pháp trích xuất đặt trưng tổng quát nhất. Phương pháp được chọn là Texture Features. Phương pháp này có thể sử
- 170 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC dụng cho phần lớn bài toán nhận dạng ảnh với kết quả tương đối khả quan. Thực tế thì phương pháp này đã mang lại thành công cho nhiều công trình như[24][25][26]. 2.3 Training và testing Training và testing là hai thuật ngữ quan trọng và thân thiện với tất cả các nhà khoa học trong lĩnh vực máy học, lĩnh vực nhận dạng và thậm chí là khoa học dữ liệu. Trong hai bước này, thông thường thì các phương pháp máy học (còn được gọi với tên là classifier) sẽ được sử dụng để phân lớp các đối tượng nghiên cứu. Trong bài báo này, nhóm tác giả tập trung vào các phương pháp nổi tiếng như: Support Vector Machine[13][27], Bayes[28], Simple Logistic[29]. 3 Đề xuất phương pháp 3.1 Hướng tiếp cận Chúng ta đã biết hiện nay deep learning và convolution neural network là hướng tiếp cận rất hiệu quả để giải quyết các bài toán nhận dạng với ảnh. Trong công trình[30] tác giả đã trình bày những thành tựu và ưu điểm của convolution neural network. Tuy nhiên, convolution neural network nói riêng hay deep learning nói chung yêu cầu dữ liệu lớn với hàng ngàn mẫu thử. Trong công trình này, chúng tôi chỉ thu thập khoảng vài trăm mẫu thử do đó các giải pháp sẽ bị giới hạn về hướng dữ liệu ít. Do đó, trong công trình này tác giả không sử dụng convolution neural network mà thay vào đó là sự kết hợp giữa xử lý ảnh và phương pháp máy học truyền thông thường để xây dựng giải pháp. Trước khi đi vào chi tiết đề xuất, nhóm tác giả trình bày bài toán cụ thể. Bài toán cụ thể như sau: 1. Đầu vào của bài toán là một ảnh của lá cà phê bị bệnh 2. Kết quả trả về là sự dự đoán rằng: lá cà phê đó bị bệnh gì 3. Trong đề tài này, nhóm tác giả chỉ nghiên cứu 6 loại bệnh thông dụng của lá cà phê gồm: Rust Disease, Calcium Deficiency, Protein Deficiency, Iron Deficiency, Kaly Deficiency, Phospho Deficiency, Magnesium Deficiency Nội dung cơ bản của bài báo này là sự kết hợp giữa phương pháp xử lý ảnh và thuật toán máy học để nhận dạng bệnh dựa trên hình ảnh lá cà phê. Do đó, hướng tiếp cận để giải bài toán này cũng bao gồm tất cả các yếu tố này. Cụ thể, nhóm tác giả đề xuất: Nhóm nghiên cứu chuẩn bị khoảng 500 ảnh của lá cà phê bị bệnh và được phân loại (còn được gọi là dán nhãn) nhờ sự giúp đỡ chuyên gia nông nghiệp. Các ảnh đầu vào được áp dụng các thuật toán xử lý ảnh cho bước tiền xử lý. Kết quả của tiền xử lý sẽ được sử dụng để xây dựng vector đặc tính. Vector đặc tính này cùng với phân loại của lá cà phê sẽ được đưa vào thuật toán máy học để train và test. ─ Nhóm tác giả sử dụng ngẫu nhiên 60\% ảnh để train và 40\% ảnh để test. ─ Kết quả đầu ra là tỉ lệ phần trăm độ chính xác của quá trình dự đoán trên tập dữ liệu test.
- Lê Văn Minh 171 3.2 Tiền xử lý Phân tích màu. Trước hết nhóm tác giả phân tích hình ảnh thành 3 kênh màu khác nhau. Nghĩa là sau khi phân tích, chương trình sẽ thu được 3 ảnh xám (gray-scale image) khác nhau tương ứng với 3 kênh màu. Ngoài ra, nhóm tác giả cũng tính trung bình của 3 kênh màu này để thu được kênh màu thứ 4. Hình 1 trình bày 4 ảnh của một lá cà phê sau khi phân tích màu. Fig. 1. Phân tích 1 ảnh màu thành 4 ảnh xám Để có thêm đánh giá định tính nhằm phân biệt sự khác nhau của các ảnh tượng trưng cho các loại bệnh. Nhóm tác giả tính phổ màu (histogram) của từng kênh màu. Hình 2 trình bày phổ màu của 4 ảnh thu được từ bước trên. Phát hiện biên. Dựa trên sự quan sát thực tế, những lá cà phê bị bệnh thường có sự chênh lệch màu sắc bên trong lá,chúng không hoàn toàn xanh như lá cây không bị bệnh. Sự chênh lệch này cũng thể hiện được sự thay đổi hình ảnh khi thực hiện việc phát hiện biên. Điều này thúc đẩy tác giả sử dụng việc phát hiện biên trong bước tiền xử lý với hy vọng tăng độ chính xác của nhận dạng. Hình 3 minh họa cho kết quả sau khi thực hiện phương pháp. Fig. 2. Histogram của ảnh phân tích được
- 172 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Fig. 3. Kết quả sau khi sử dụng thuật toán Canny để tìm đường viền Trích xuất đặc trưng. Như đã trình bày ở phần trước, nhóm tác giả đề xuất sử dụng phương pháp Texture Feature. Thành tựu của Texture Feature đã được trình bày bởi nhóm tác giả \cite{mohanaiah2013image}. Texture Feature trong đề tài này đã được thay đổi một chút để áp dụng vào bài toán của chúng tôi. Cụ thể là tính trung bình độ sáng của ảnh, sau đó chia ảnh thành 4 rồi tính trung bình điểm sáng của từng ảnh nhỏ rồi tiếp tục lặp lại việc chia 4 như thế. Hình 4 trình bày một bước lặp của việc trích xuất đặc trưng dựa trên phương pháp Texture Feature. Trong đó, hình bên trái là hìnhảnh ban đầu, 4 hình bên phải là hình ảnh sau khi chia thành 4 hình khác nhau. Với cách làm này, độ dài của vector sẽ phụ thuộc vào số lần chia. Trong tình huống này, chúng tôi đề xuất giới hạn số lần chia này là 8.
- Lê Văn Minh 173 Fig. 4. Texture Features Extraction Để làm rõ hơn ảnh hưởng của việc áp dụng thuật toán xử lý ảnh đối với độ chính xác của quá trình phân lớp, nhóm tác giả đã đề xuất nhiều phương pháp trích xuất đặc trưng khác nhau và mỗi phương pháp sẽ cho ra một kết quả khác nhau về độ chính xác. Các phương pháp trích xuất như sau: Extraction 1: trích xuất đặc trưng trên cả 3 ảnh xám RGB. Extraction 2: trích xuất đặc trưng trên 4 ảnh gồm: 3 ảnh xám RGB và ảnh trung bình cộng của 3 ảnh này. Extraction 3: trích xuất đặc trưng trên 6 ảnh gồm: 3 ảnh RGB và 3 ảnh Canny của 3 ảnh RGB này. Extraction 4: trích xuất đặc trưng trên 3 ảnh xám RGB và sử dụng thêm histogram của 3 ảnh xám. Extraction 5: trích xuất đặc trưng trên 3 ảnh Canny của 3 ảnh xám RGB và sử dụng thêm histogram của 4 ảnh xám. Extraction 6: trích xuất đặc trưng trên 6 ảnh gồm: 3 ảnh RGB và 3 ảnh Canny và sử dụng thêm histogram của 4 ảnh xám. 3.3 Train và test Nhóm tác giả đề xuất sử dụng các thuật toán máy học để thực nghiệm việc phân loại. Các thuật toán này bao gồm: SimpleLogistic, AttributeSelectedClassifier, J48, NaiveBayes, LWL.
- 174 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC 4 Kết quả Kết quả thực nghiệm cho thấy có mối quan hệ mật thiết giữa tiền xử lý bằng xử lý ảnh và các phương pháp. Như trong hình 5 chúng ta có thể thấy rằng mỗi phương pháp tiền xử lý có thể rất tốt với phương pháp máy học này nhưng không tốt với phương pháp máy học khác. Cũng trong hình này, tác giả đã thực hiện phép toán logarit đối với độ chính xác của kết quả thu được với mục đích làm rõ sự chênh lệch về kết quả khi chọn các thuật toán khác nhau. Vì giá trị lớn nhất của độ chính xác là 100 (đơn vị là %) nên giá trị lớn nhất của trục hoành là 2 (lg(100) = 2). Fig. 5. So sánh kết quả các phương pháp Trong tình huống này, tác giả cũng đã phân tích một trường hợp tốt nhất đó là trường hợp sử dụng thuật toán Logistic đối với phương pháp extraction 6. Kết quả chính xác của phương pháp này lên đến 95%. Hình 6 trình bày ma trận nhầm lẫn của trường hợp này. Đây là trường hợp test với 40% số ảnh trong cơ sở dữ liệu. Fig. 6. Ma trận nhầm lẫn 5 Kết luận Nhóm tác giả đã làm rõ sự tương quan giữa xử lý ảnh (cho việc tiền xử lý) và phương pháp máy học trong nhận dạng mẫu. Nhóm tác giả cũng đưa ra được một trường hợp nghiên cứu cụ thể đó là: nhận dạng bệnh dựa trên hình ảnh của lá cà phê. Đóng góp quan trọng nhất của bài
- Lê Văn Minh 175 báo này là với từng bài toán cụ thể, chúng ta cần chọn phương pháp máy học phù hợp với phương pháp tiền xử lý để thu được kết quả tốt nhất. Về hướng phát triển, nhóm tác giả sẽ mở rộng đề tài này với những phương pháp trích xuất đặc trưng khác thay cho phương pháp Texture Feature. Mặt khác, nhóm tác giả đề xuất mở rộng với phương pháp deep-learning để tăng độ chính xác khi số lượng ảnh nhiều dần. Tài liệu tham khảo 1. D. WORKMAN: “Coffee exports by country” 2017. [Online; accessed July- 2017]. 2. G. NAM: “Cà phê việt nam sẽ chiếm “ngôi vương” của brazil”. 2017. [Online; accessed July-2017] 3. M. D. Abràmoff, P. J. Magalhães, and S. J. Ram: “Image processing with imagej”. Biophotonics international, vol. 11, no. 7, pp. 36–42, 2004Author, F., Author, S., Author, T.: Book title. 2nd edn. Publisher, Location (1999). 4. I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann (2016). 5. H. J. Siegel, L. J. Siegel, F. C. Kemmerer, M. PT Jr, S. HE Jr, and S. D. Smith: “Pasm: A partitionable simd/mimd system for image processing and pattern recognition”. IEEE Transactions on computers, no. 12, pp. 934–947 (1981). 6. T. Acharya and A. K. Ray: Image processing: principles and applications. John Wiley & Sons (2005). 7. T. Walter, J.-C. Klein, P. Massin, and A. Erginay: “A contribution of image processing to the diagnosis of diabetic retinopathy-detection of exudates in color fundus images of the human retina”. IEEE transactions on medical imaging, vol. 21, no. 10, pp. 1236–1243 (2002). 8. A. H. Kulkarni and R. A. Patil: “Applying image processing technique to detect plant diseases”. International Journal of Modern Engineering Research (IJMER), vol. 2, no. 5, pp. 3661–3664 (2012). 9. V. Singh, A. Misra, et al.: “Detection of unhealthy region of plant leaves using image processing and genetic algorithm” in Computer Engineering and Applications (ICACEA), 2015 International Conference on Advances in, pp. 1028–1032, IEEE (2015). 10. J. G. A. Barbedo: “An automatic method to detect and measure leaf disease symptoms using digital image processing”. Plant Disease, vol. 98, no. 12, pp. 1709–1716 (2014). 11. C. M. Bishop: Pattern recognition and machine learning. springer (2006). 12. D. W. Paulus and J. Hornegger: Applied pattern recognition: A practical introduction to image and speech processing in C++. Morgan Kaufmann Publishers (1998). 13. C. J. Burges: “A tutorial on support vector machines for pattern recognition”. Data mining and knowledge discovery, vol. 2, no. 2, pp. 121–167 (1998). 14. J. J. Hopfield et al.: “Pattern recognition computation using action potential timing for stimulus representation”. Nature, vol. 376, no. 6535, pp. 33–36 (1995). 15. K. Plataniotis and A. N. Venetsanopoulos: Color image processing and applications. Springer Science & Business Media (2013). 16. S. J. Sangwine and R. E. Horne: The colour image processing handbook. Springer Science & Business Media (2012). 17. B. Lindbloom: “Rgb working space information”. Specifications, html# Specifications (January 2014), 2001. 18. G. Sulong et al.: “Rgb colour image watermarking using canny edge detection and discrete wavelet transform (dwt)” (2013). 19. K. Van De Sande, T. Gevers, and C. Snoek: “Evaluating color descriptors for object and scene recognition”. IEEE transactions on pattern analysis and machine intelligence, vol. 32, no. 9, pp. 1582–1596 (2010). 20. E. Sutton: “Histograms and the zone system”. Illustrated Photography. Accessed at illustratedphotography. com/photography- tips/basic/contrast.
- 176 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC 21. J. Canny: “A computational approach to edge detection”. IEEE Transac- tions on pattern analysis and machine intelligence, no. 6, pp. 679–698 (1986). 22. I. Sobel: “History and definition of the sobel operator”. Retrieved from the World Wide Web (2014). 23. J. M. Prewitt: “Object enhancement and extraction”. Picture processing and Psychopictorics, vol. 10, no. 1, pp. 15–19 (1970). 24. D.-C. He, L. Wang, and J. Guibert: “Texture feature extraction”. Pattern recognition letters, vol. 6, no. 4, pp. 269–273 (1987). 25. T. Ahonen, A. Hadid, and M. Pietikainen: “Face description with local binary patterns: Application to face recognition”. IEEE transactions on pattern analysis and machine intelligence, vol. 28, no. 12, pp. 2037–2041 (2006). 26. M. Unser: “Texture classification and segmentation using wavelet frames”. IEEE Transactions on image processing, vol. 4, no. 11, pp. 1549–1560 (1995). 27. N. Cristianini and J. Shawe-Taylor: An introduction to support vector machines and other kernel- based learning methods. Cambridge university press (2000). 28. P. Domingos and M. Pazzani: “On the optimality of the simple Bayesian classifier under zero-one loss”. Machine learning, vol. 29, no. 2-3, pp. 103–130 (1997). 29. J. M. Hilbe: Logistic regression models. CRC press (2009). 30. P. Y. Simard, D. Steinkraus, and J. C. Platt: “Best practices for convolutional neural networks applied to visual document analysis” in null, p. 958, IEEE (2003). 31. P. Mohanaiah, P. Sathyanarayana, and L. GuruKumar: “Image texture feature extraction using glcm approach”. International Journal of Scientific and Research Publications, vol. 3, no. 5, p. 1 (2013).