Tự động nhận dạng biển số đăng ký xe trong ảnh chụp từ camera

pdf 5 trang hoanguyen 3950
Bạn đang xem tài liệu "Tự động nhận dạng biển số đăng ký xe trong ảnh chụp từ camera", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftu_dong_nhan_dang_bien_so_dang_ky_xe_trong_anh_chup_tu_camer.pdf

Nội dung text: Tự động nhận dạng biển số đăng ký xe trong ảnh chụp từ camera

  1. Tuyển tập Báo cáo “Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6 Đại học Đà Nẵng - 2008 TỰ ĐỘNG NHẬN DẠNG BIỂN SỐ ĐĂNG KÝ XE TRONG ẢNH CHỤP TỪ CAMERA AUTOMATIC LICENSE PLATE RECOGNIZATION IN CAMERA PICTURES SVTH: DOÃN ĐẠT PHƢỚC NGUYỄN ĐỒNG HẢI PHƢƠNG Lớp: 05D1, Trường Đại học Bách Khoa GVHD: THS TRẦN THÁI ANH ÂU Khoa Điện kỹ thuật, Trường Đại học Bách Khoa TÓM TẮT Nghiên cứu này trình bày một cách tiếp cận trong việc xác định và nhận dạng biển số đăng ký xe của Việt Nam với dữ liệu đầu vào là ảnh chụp từ camera. Để giải quyết vấn đề này, nghiên cứu phải giải quyết ba bài toán riêng rẽ là: xác định vị trí biển số xe, tách ký tự và nhận dạng các ký tự. Phương pháp xuyên suốt được sử dụng trong nghiên cứu này để giải quyết các bài toán đặt ra là phương pháp Hình thái học. Ngoài ra, để nâng cao hiệu quả trong việc xác định vị trí biến số xe, nghiên cứu đã sử dụng thêm Phép biến đổi Hough. Nghiên cứu đã tiến hành thực nghiệm trên cơ sở ảnh chụp biển số đăng ký xe máy của Việt Nam và đưa ra đánh giá về mặt hiệu quả của phương pháp đã được sử đụng đồng thời đưa ra những hướng áp dụng nghiên cứu này. ABSTRACT This study presents an approach to Vietnamese license plate localization and recognition in camera picture. To deal with this problem, this consist three main modules: License Plate detection (LPD), License Plate Character segmentation and Optical Character Recognition (OCR). The main method used in this study to deal with modules is Morphology. Besides, we also uses Hough Transformation to enhance the effect of detecting License Plate region. This study does an experiment in the input database of Vietnamese License Plate pictures and evaluates the effect of the methods used in the research and also presents the application of this research. 1. Mở đầu: Cùng với sự phát triển của khoa học kỹ thuật và nhu cầu đi lại ngày càng tăng số lƣợng phƣơng tiện giao thông trên đƣờng ngày càng xuất hiện nhiều. Với số lƣợng phƣơng tiện giao thông lớn và còn không ngừng tăng lên nhƣ vậy đã làm nảy sinh nhiều vấn đề trong việc kiểm soát cũng nhƣ quản lý các phƣơng tiện. Để giải quyết vấn đề này nhu cầu đặt ra là áp dụng các hệ thống tự động. Một trong nhƣng hệ thống nhƣ vậy là hệ thống tự động nhận dạng biển số xe là hệ thống có khả năng thu nhận hình ảnh cũng nhƣ là „đọc‟ và „hiểu‟ các biển số xe một cách tự động. Một hệ thống nhƣ vậy có thể đƣợc sử dụng trong rất nhiều các ứng dụng chẳng hạn nhƣ: trạm cân và rửa xe tự động hoàn toàn, bãi giữ xe tự động, kiểm soát lƣu lƣợng giao thông hay trong các ứng dụng về an ninh nhƣ tìm kiếm xe mất cắp Nhƣ mọi hệ thống tự động khác, hệ thống nhƣ vậy cũng sẽ yêu cầu có cả phần cứng lẫn phần mềm. Phần cứng của nó có phần chính sẽ là một camera có tác dụng thu nhận hình ảnh còn phần mềm sẽ có tác dụng xử lý hình ảnh đó. Với sự phát triển của kỹ thuật điện tử, các camera sẽ dễ dàng có khả năng thu nhận đƣợc hình ảnh do đó mà vấn đề đặt ra và luôn là vấn đề quan trọng nhất trong hệ thống, quyết định tính hiệu quả của hệ thống xử lý ảnh nhƣ vậy sẽ là phần mềm xử lý ảnh. Với vai trò nhƣ đã phân tích ở trên nghiên cứu này tập trung vào giải quyết các vấn đề đặt ra khi xử lý ảnh để đƣa ra chính xác biển số đăng ký xe. 91
  2. Tuyển tập Báo cáo “Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6 Đại học Đà Nẵng - 2008 Với sự phổ biến của xe máy trên các đƣờng phố ở Việt Nam nghiên cứu đã tập trung vào đối tƣợng là biển số đăng ký xe máy để thu thập hình ảnh làm cơ sở dữ liệu cho việc xử lý. Yêu cầu của bài toán là áp dụng các thuật toán thích hợp tìm vùng chứa biển số, trích vùng biển số, cách li các kí tự trên biển số, từ đó máy tính có khả năng xử lí và nhận dạng đƣợc. Có thể tóm tắt yêu cầu của bài toán theo sơ đồ nhƣ sau: ảnh đầu vào Trích vùng biển số Cách ly các ký tự Xử lý kết quả Nhận dạng ký tự Hình 1.1: Các yêu cầu bài toán tự động nhận dạng biển số xe Từ sơ đồ trên ta thấy rằng bài toán tự động nhận dạng biển số xe máy này có thể chia thành 3 bài toán chính: trích biển số xe, tách ký tự và xử lý các ký tự. 2. Nội dung: 2.1. Trích biển số xe Mục đích: Từ bức ảnh chụp đƣợc trong bƣớc thu nhận ảnh, áp dụng các thuật toán trích ra đƣợc vùng ảnh nhỏ nhất chứa biển số. Các phương pháp: có nhiều phƣơng pháp khác nhau để thực hiện nhiệm vụ này nhƣng tất cả đều có thể qui về 3 phƣơng pháp chính sau đây: - Phƣơng pháp dùng chuyển đổi Hough: dựa vào đặc trƣng cạnh biên trích đƣợc, áp dụng các phƣơng pháp xác định đƣờng thẳng nhƣ phép biến đổi Hough để phát hiện các cặp đƣờng thẳng gần song song ghép thành một ảnh biển số. - Phƣơng pháp hình thái học: dựa vào đặc trƣng hình thái của biển số xe nhƣ màu sắc, độ sáng, sự đối xứng để xác định và trích ra ảnh biển số. - Phƣơng pháp khớp mẫu: xem biển số là một đối tƣợng có khung nền riêng và sử dụng các cửa sổ dò để trích từng đối tƣợng đƣa qua mạng noron (neural network), trí tuệ nhân tạo (artificial intelligence) chẳng hạn để phân loại có phải là vùng biển số hay không. Nghiên cứu này sẽ sử dụng kết hợp 2 phƣơng pháp là Hình thái học và Chuyển đổi Hough. 2.1.1. Phương pháp hình thái học Nội dung của phương pháp: Dựa vào đặc trƣng quan trọng là biển số xe máy có độ sáng (tức mức xám khi chuyển bức ảnh về dạng xám) là tƣơng đối khác so với các vùng khác trong bức ảnh, cũng nhƣ sự phân bố mức xám là khá đồng đều trên biển số và vì vậy khi đƣợc nhị phân hoá, vùng biển số là một đối tượng có đặc thù hình thái, có thể phân biệt được với các vùng khác . Nhƣ vậy các bƣớc thực hiện ở đây là: - Xác định ngƣỡng xám. Thực chất là không có phƣơng pháp nào chọn cho đúng ngƣỡng xám để thực hiện. Thay vào đó, ngƣỡng xám sẽ đƣợc quét trong một khoảng nào đó. Thông qua lƣợc đồ xám ta nhận thấy vùng biển số thƣờng sẽ có độ sáng tƣơng đối lớn (từ 130- 200) vì vậy ta sẽ xác định lƣợc đồ xám lớn nhất trong khoảng này và ngƣỡng xám cần chọn sẽ thuộc vùng này nhờ đó ta sẽ giảm đƣợc thời gian lặp tìm ngƣỡng xám. 92
  3. Tuyển tập Báo cáo “Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6 Đại học Đà Nẵng - 2008 Hình 2.1: Ảnh xám đầu vào Hình 2.2: Lƣợc đồ xám của bức ảnh xám - Nhị phân hoá ảnh xám đầu vào với ngƣỡng xám đã xác định. - Lọc các nhiễu (salt and pepper noise) gây ảnh hƣởng xấu tới đối tƣợng biển số. - Gắn nhãn cho các đối tƣợng còn lại trong ảnh nhị phân thu đƣợc. - Trích ra các đối tƣợng ứng viên biển số theo tiêu chí cụ thể của biển số xe về chiều cao, chiều rộng, tỉ lệ các cạnh, diện tích, trọng tâm Cụ thể nghiên cứu đã chọn: 7000 pixel ≤ diện tích ≤ 150000 pixel 0,68 ≤ chiều cao/chiều rộng ≤ 0,8 Ưu điểm: - đơn giản - chọn ra chính xác vùng biển số Nhược điểm: - thời gian xử lý lớn 2.1.2. Phương pháp chuyển đổi Hough Nội dung của phương pháp: gồm các bước: - Dò đặc trƣng biên ngang, dọc: làm nổi bật các viền bao của tất cả các đối tƣợng trong ảnh trong đó có viền bao biển số. Phƣơng pháp là sử dụng các bộ lọc gradient để trích đƣợc các đặc trƣng cạnh biên này. Nghiên cứu này sử dụng bộ lọc Sobel để tiến hành dò. - Dùng chuyển đổi Hough tìm các đoạn thẳng ngang dọc trên cở sở của ảnh nhị phân biên cạnh thu đƣợc từ bƣớc trên. Ở đây sẽ chọn các đƣờng thẳng cách đều nhau 5 pixel để dò đƣờng, và loại bỏ các đoạn thẳng nhỏ hơn ngƣỡng, cụ thể là có ít hơn 30 pixel thuộc nó. - Tách các đoạn thẳng ngang, dọc có thể là cạnh của biển số. - Trích ứng viên biển số: thành lập các hình chữ nhật là ứng viên cho biển số với tiêu chí cụ thể là: các bộ 4 đoạn thẳng thu đƣợc sẽ qua đánh giá về kích thƣớc: 80< chiều rộng <400 63< chiều cao <350 0.63< chiều cao/ chiều rộng <0.8 Ưu điểm: không phụ thuộc vào màu sắc của biển số xe Nhược điểm: phụ thuộc rất lớn vào bƣớc trích đặc trƣng biên cạnh dẫn đến là các đoạn thẳng ứng viên thu đƣợc thƣờng ngắn hơn nhiều so với chiều dọc cũng nhƣ chiều ngang của biển số. 2.2. Cách ly các ký tự Mục đích: tách thành 8 ảnh đơn chứa các kí tự từ ảnh vùng biển số đã thu đƣợc. Phương pháp: cũng có nhiều phƣơng pháp để thực hiện nhiệm vụ này. Có thể kể ra ở đây nhƣ tách tĩnh, lƣợng tử hóa vecto (vector quantization), lƣợc đồ chiếu ngang và dọc (vertical and horizontal projection), mạng noron (neural network), trí tuệ nhân tạo (AI), hình thái học (Morphology) Nghiên cứu này đã lựa chọn phƣơng pháp Hình thái học để thực hiện. 93
  4. Tuyển tập Báo cáo “Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6 Đại học Đà Nẵng - 2008 Hình 2.3: Tách tĩnh Hình 2.4: Lƣợc đồ chiếu ngang và dọc của ký tự Phương pháp hình thái học: mỗi 1 ký tự trên biển số sẽ là 1 đối tƣợng có đặc điểm hình thái học cụ thể nhƣ là chiều cao, chiều rộng, tỉ lệ 2 chiều biến đổi tƣơng đối ít (nếu ảnh biển số đƣợc đƣa về cùng một kích cỡ) mà dựa vào đó ta có thể tách ra đƣợc cụ thể từng ký tự một. Từ đó ta có thuật toán tách kí tự từ ảnh xám biển số sau đây: - Đƣa ảnh xám biển số về cùng độ phân giải 160x210 sau đó thực hiện xóa biên ảnh biển số. - Xác định ngƣỡng xám để nhị phân bức ảnh biển số. Khâu này rất quan trọng quyết định tính chính xác của việc nhận dạng kí tự. Nghiên cứu đã chọn ngƣỡng xám theo các bƣớc sau: Nâng cao tính tƣơng phản của ảnh biển số bằng thuật toán cân bằng hóa lƣợc đồ xám (histogram equalization). Dùng thuật toán Otsu để xác định ngƣỡng xám của bức ảnh mới này, đây là ngƣỡng xám cần tìm. - Lọc nhiễu để loại bỏ bớt các đối tƣợng và gán nhãn cho các đối tƣợng còn lại. - Tách ra các ký tự thông qua đặc tính về hình thái học, cụ thể là: 8 pixel ≤ chiều rộng ≤ 45 pixel 45 pixel ≤ chiều cao ≤ 85 pixel Ưu điểm: - Không phụ thuộc vào độ nghiêng của biển số. - Không phụ thuộc vào nhiễu. - Biển số có thể không làm sạch đƣợc nhƣng vẫn nhận dạng chính xác. Nhược điểm: - Phụ thuộc vào độ chính xác của ảnh nhị phân có lấy hết đƣợc ảnh ký tự từ ảnh xám. 2.3. Nhận dạng ký tự: Phương pháp: phƣơng pháp phổ biến nhất để nhận dạng ký tự là sử dụng mạng noron tức là huấn luyện cho máy tính để nhận dạng các ký tự. Tuy nhiên do số lƣợng ký tự trên biển số là không nhiều nên để đảm bảo tốc độ xử lý nghiên cứu đã sử dụng phƣơng pháp Hình thái học để giải quyết khâu này bởi vì các ký tự đều có nhƣng đặc điểm hình thái đặc biệt có thể phân biệt với nhau chẳng hạn nhƣ „0‟ có lỗ trống ở giữa, „8‟ có 2 lỗ trống hay „X‟ đối xứng 2 trục dọc và ngang Đặc biệt khâu này đƣợc thực hiện trên cơ sở xây dựng cây nhị phân tối ƣu của các đặc điểm hình thái nên đảm bảo tính khoa học và tính chính xác cao. Từ thực tế thực hiện, nghiên cứu đƣa ra thuật toán của khâu này nhƣ sau: - Quan sát chọn ra các đặc tính phân biệt ký tự để xây dựng ma trận đặc tính. - Xây dựng cây nhị phân tối ƣu từ ma trận đặc tính và tập ký tự thu đƣợc từ bƣớc tách ký tự. - Quan sát cây nhị phân và kiểm tra xem số đặc tính nhƣ vậy đã đủ để nhận dạng chƣa, thiếu (dƣ) thì phải bổ sung (bỏ đi) và quay lại bƣớc đầu tiên. - Tiến hành nhận dạng các ký tự trên cơ sở cây nhị phân tối ƣu tìm đƣợc. Qua tiến hành các bƣớc của thuật toán trên, nghiên cứu đã sử dụng nhóm các đặc tính để phân biệt các ký tự là chữ số và các ký tự là chữ cái. Cụ thể đối với chữ số: số điểm cắt dọc 94
  5. Tuyển tập Báo cáo “Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6 Đại học Đà Nẵng - 2008 1/2, tục dọc, trục ngang, số lỗ tròn, vị trí lỗ tròn; đối với chữ cái: số lỗ tròn, mở trên hay đóng trên, mở dƣới hay đóng dƣới, trục dọc, trục ngang, số điểm cắt dọc 1/2 và số điểm cắt ngang ½. 3. Thực nghiệm: Nghiên cứu tiến hành thực nghiệm trên cơ sở dữ liệu là ảnh biển số xe máy Việt Nam thu đƣợc ở Hà Nội, Đà Nẵng và thành phố Hồ Chí Minh với độ phân giải là 640x480. Sau khi tiến hành viết chƣơng trình dựa trên thuật toán đã nêu và xử lý cơ sở dữ liệu, nghiên cứu đã thu đƣợc kết quả nhƣ sau: Thuật toán Thành công (%) Lỗi (%) Trích ảnh biển số 98,6 1,4 Tách kí tự 95,9 4,1 Nhận dạng kí tự 96,4 3,6 Kết quả nhận dạng chung 92 8 4. Hướng phát triển nghiên cứu: - Nâng cao hiệu quả chƣơng trình nhận dạng kí tự, tách li các kí tự trong biển số trong các trƣờng hợp biển số bị nhiễu nhiều, mất mát thông tin do nhiễu từ điều kiện môi trƣờng. - Phát triển chƣơng trình thành module phần cứng trên hệ vi xử lý dành riêng cho xử lý tín hiệu số để không còn phụ thuộc vào máy tính, giảm nhỏ kích thƣớc đồng thời kết hợp giao tiếp với camera và các cảm biến để có thể trở thành một thiết bị nhận dạng biển số hoạt động độc lập có thể sử dụng cho các ứng dụng cụ thể đã nêu trên. - Nghiên cứu đề nghị một hƣớng ứng dụng cụ thể là hệ thống giám sát phƣơng tiện ra vào một địa điểm cụ thể và giữ xe hoàn toàn tự động. TÀI LIỆU THAM KHẢO [1] Duan, T.D., Du, T.L.H., Phuoc, T.V., Hoang, N.V. (2005), “Building an Automatic Vehicle License-Plate Recognition System”, International Conference in Computer Science, pp. 59-63. [2] w.w.w.Mathworks.com [3] Otsu, N. (1979), “A Threshold Selection Method from Gray-Level Histograms” IEEE Transactions on Systems, Man, and Cybernetics, Vol. 9, No. 1, pp. 62-66. [4] Humayun Karim Sulehria, Ye Zhang (2007), “Extraction of Vehicle Number Plates Using Mathematical Morphological Techniques”, Proceedings of the 8th WSEAS International Conference on Automation and Information, Vancouver, Canada, June 19-21, 2007 pp. 258-261. [5] Linda Shapiro and George Stockman (2000), “Computer Vision E-book”, pp.97-99: Histogram, pp.101-105: Binary Threshoding, pp.150-153: Noise & Smoothing, pp.156- 160: Edge detection.Ballard Brown, “Computer Vision”, pp.123-129: Line Detection with the Hough Algorithm. [6] [7] Amin Sarafraz (2004), “Detects lines in a binary image using common computer vision operation known as the Hough Transform”, University of Tehran, Iran. 95