Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp

pdf 16 trang Hùng Dũng 04/01/2024 630
Bạn đang xem tài liệu "Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfmot_phuong_phap_moi_nang_cao_do_tuong_phan_anh_mau_theo_huon.pdf

Nội dung text: Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp

  1. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Một phƣơng pháp mới nâng cao độ tƣơng phản ảnh màu theo hƣớng tiếp cận trực tiếp A New Method to Enhancement The Contrast of Color Images based on Direct Method Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng Huy, Đặng Duy An Abstract: Image contrast enhancement techniques Các kỹ thuật biến đổi histogram đƣợc khai thác ở have two mainly methods: indirect method and direct nhiều khía cạnh nhƣ thuật toán khung biến đổi method. While indirect methods only modify the histogram và thích nghi nội dung [2], biến đổi logarit histogram without defining any specific contrast histogram [1], kỹ thuật cân bằng động histogram [5], measure, the direct methods establish a criterion of chuẩn hóa nhiều histogram [17], biến đổi Cosine rời contrast measurement and enhance the image by rạc [13], xây dựng toán tử tăng cƣờng mở rộng của improving the contrast measure. Among many direct toán tử INT của Zadeh để mờ hóa thông tin trong methods, only the studies by Cheng and Xu modified miền không gian [12] v.v the contrast at each point of grayscale image using a Mặc dù vậy có rất ít các nghiên cứu theo phƣơng contrast measure [6, 7]. pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh In this paper we propose a new method for dựa trên một độ đo tƣơng phản xác định tại mỗi điểm enhancing the contrast of color images based on the ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong direct method. The experimental results demonstrate [9, 3], các kết quả đã chứng tỏ rằng phƣơng pháp trực that the combination of our proposed method with tiếp có thể tạo ra các kỹ thuật nâng cao độ tƣơng phản Fuzzy C_Mean (FCM) clustering algorithms performs hiệu quả. well on different color images. Nhƣ nhận xét ở trên, trong một thời gian dài cho Keywords: Direct contrast enhancement, đến nay hầu nhƣ chỉ có các nghiên cứu của Cheng và homogeneity measure, contrast measure, FCM, S- Xu [6, 7] là đề xuất một phƣơng pháp biến đổi độ function, histogram, the dynamic range of gray, HSV, tƣơng phản tại mỗi điểm ảnh dựa trên định nghĩa một entropy, fuzzy entropy, the image details. độ đo tƣơng phản giữa độ sáng điểm ảnh và lân cận xung quanh nó. Độ đo tƣơng phản của [6, 7] đƣợc xây I. GIỚI THIỆU dựng dựa trên các đặc trƣng địa phƣơng nhƣ gradient, Nâng cao độ tƣơng phản ảnh là một vấn đề quan entropy, độ lệch chuẩn trung bình và moment bậc 4 tại trọng trong xử lý và phân tích hình ảnh, là một bƣớc từng điểm ảnh. cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng Ngay từ đầu, phƣơng pháp nâng cao độ tƣơng phản nâng cao độ tƣơng phản ảnh đƣợc phân loại theo hai này chỉ đƣợc thực hiện trong ảnh đa cấp xám. Mở tiếp cận chính: (1) Các phƣơng pháp gián tiếp [1, 2, 5, rộng những phƣơng pháp này để nâng cao độ tƣơng 12, 13, 17]; và (2) các phƣơng pháp trực tiếp [6, 7]. phản của ảnh màu không phải là một nhiệm vụ dễ Có rất nhiều kỹ thuật đã đƣợc đề xuất đƣợc tìm dàng do gặp phải một số yếu tố, chẳng hạn nhƣ sự lựa thấy trong tài liệu tham khảo, hầu hết trong số đó là chọn một mô hình màu thích hợp để biểu diễn và xử phƣơng pháp gián tiếp, chúng biến đổi histogram mà lý ảnh, ảnh hƣởng hệ thống thị giác của con ngƣời. không sử dụng bất kỳ một độ đo tƣơng phản nào. - 59 -
  2. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Việc lựa chọn một mô hình màu là rất quan trọng trong đó a, bopt và c là các tham số đƣợc ƣớc lƣợng tự để cải thiện độ tƣơng phản của ảnh màu. Biểu diễn động khi khảo sát các đỉnh histogram và dựa trên màu RGB đƣợc sử dụng cho việc hiển thị màu sắc, nguyên lý cực đại fuzzy entropy: trong khi biểu diễn màu HSV là cho hệ thống thị giác bopt argmax H(;,,), I a b c  (2) của con ngƣời. Trong mô hình màu HSV, kênh H biểu b [ a 1, c 1] diễn màu sắc, kênh S chỉ độ bão hòa, và kênh V là và H là độ đo fuzzy entropy thông dụng (xem công cƣờng độ của màu. Bằng cách bảo toàn kênh H, chỉ thức (33), mục IV.3). thay đổi kênh V hoặc thay đổi cả kênh S và kênh V, chúng ta có thể nâng cao chất lƣợng ảnh màu mà không làm suy giảm chất lƣợng ảnh gốc [12]. Trong khi các thuật toán trong [6, 7] là cơ sở của phép nâng cao độ tƣơng phản các ảnh đa cấp xám, chúng không đảm bảo hiệu quả khi áp dụng trực tiếp cho ảnh màu do một số nguyên nhân sau: Hình 2. Ảnh biến đổi sử dụng hàm S-function bị mất (i) Ảnh nâng cao độ tƣơng phản không thay đổi chi tiết [6]. mức độ sáng của màu so với ảnh gốc. Hình 2 chứng tỏ khi áp dụng phép biến đổi dạng S- Khi áp dụng thuật toán [7] trên kênh V của ảnh function ở trên cho từng kênh R, G và B của ảnh #1 màu trong biểu diễn màu HSV, chúng tôi nhận thấy chúng ta sẽ nhận đƣợc một ảnh bị mất chi tiết nhƣ đã với nhiều ảnh màu, đặc biệt là các ảnh tối, các điểm đƣợc thể hiện ở vùng đánh dấu chữ nhật. Điều này ảnh nhƣ vậy có thể chiếm rất nhiều. Do đó ảnh đƣợc cũng xảy ra khi áp dụng biến đổi này cho kênh V nâng cao sẽ không thay đổi mức sáng ở những vùng trong biểu diễn màu HSV của ảnh #1. này và không khác biệt với ảnh gốc nếu chỉ dựa trên Phần còn lại của bài báo đƣợc tổ chức nhƣ sau: cảm nhận bằng mắt. Phần II, trình bày một số nghiên cứu liên quan của thuật toán nâng cao độ tƣơng phản theo hƣớng trực tiếp của Cheng và cộng sự; Phần III là đề xuất thuật toán sử dụng phân cụm mờ để ƣớc lƣợng nhiều khoảng động mức xám, xây dựng hàm biến đổi kênh ảnh trƣớc khi tính độ tƣơng phản điểm ảnh và thuật toán nâng cao độ tƣơng phản ảnh màu trong biểu diễn màu HSV; Các kết quả thực nghiệm trình bày trong phần IV; Kết luận đƣợc đƣa ra ở phần V. Hình 1. Ảnh kết quả khi sử dụng [7] cho ảnh #1 (Xem II. NGHIÊN CỨU LIÊN QUAN hình 5) Bảng 1 liệt kê một số kí hiệu đƣợc sử dụng trong (ii) Chi tiết của ảnh gốc bị suy giảm. bài báo này. Trong [6], các tác giả đề xuất một thuật toán sử Bảng 1. Các ký hiệu và các định nghĩa của nó dụng hàm S-function có tham số để biến đổi ảnh đa Ký hiệu Định nghĩa cấp xám I đầu vào sau đó nâng cao độ tƣơng phản của I Ảnh RGB nói chung ảnh biến đổi theo phƣơng pháp trực tiếp. M x N là kích thƣớc theo pixel của ảnh M, N đầu vào. I Iij(,)  SIab (,opt ,) c S funcIijab ((,);,opt ,), c  (1) Kênh ảnh R,G và B của ảnh màu trong I , I , I R G B biểu diễn màu RGB. - 60 -
  3. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Kênh ảnh H,S và V của ảnh màu trong Nâng cao độ tƣơng phản theo phƣơng pháp trực I , I , I S H V biểu diễn màu HSV tiếp, theo [6, 7] là việc thực hiện một dãy biến đổi Miền giá trị mức xám của kênh ảnh thứ (,)f b Cf, b C new f new,, f b , 0 ≤ Cf,b ≤ Cnew ≤ 1 và Lk, min, k của ảnh đầu vào, thông thƣờng Lk, min 1 Cnew Lk, max b, f b = 0, L = 255. 1 Cnew k, max f new,, f b 1 C (4) d x d là kích thƣớc cửa sổ lân cận của bnew , f b d điểm ảnh. 1 Cnew Các giá trị gradient lấy tại điểm ảnh (i, II.2. S-function j) đƣợc chuẩn hóa về miền [0, 1] theo Eij Trong lý thuyết tập mờ, Zadeh đã định nghĩa một một toán tử tìm kiếm biên chẳng hạn toán tử Sobel. toán tử tăng cƣờng gọi là INT (intensification), và Giá trị entropy địa phƣơng lấy tại điểm dạng tổng quát của nó đƣợc gọi là S-function [7], H ij ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1]. đƣợc xác định nhƣ sau: Độ lệch chuẩn trung bình mức xám lấy 0, 0 xa 2 Vij tại điểm ảnh (i, j) đƣợc chuẩn hóa về xa , a x b miền [0, 1] b a c a S(;,,) x a b c (5) 2 Giá trị moment bậc 4 lấy tại điểm ảnh xc R4,ij 1, b x c (i, j) đƣợc chuẩn hóa về miền [0, 1] c b c a 1, cx Giá trị kết nhập dạng f(Eij, Hij, Vij, HOij R4,ij)[7] Trong [6] Cheng và cộng sự đã sử dụng hàm S- ij Giá trị thuần nhất tại điểm ảnh (i, j) function để chuyển một ảnh xám sang miền fuzzy, sau Giá trị trung bình không thuần nhất tại đó nghiên cứu nâng cao độ tƣơng phản của ảnh trong ij điểm ảnh (i, j) miền fuzzy. ξij Số mũ khuếch đại tại (i, j) Trong [7] đề xuất xây dựng phép nâng cao độ t (0,1): Tham số của phép nâng độ t tƣơng phản trực tiếp của ảnh đa cấp xám dựa trên các khuếch đại đặc trƣng địa phƣơng của điểm ảnh. Đây là phƣơng f1, f2 (0, 1): Tham số xác định dải pháp gốc đƣợc dùng phát triển các thuật toán sẽ đƣợc f1,f2 động mức xám [7] đề xuất trong phần III. K Số kênh ảnh cần xử lý của ảnh đầu vào II.3. Ƣớc lƣợng độ sáng nền và độ tƣơng phản Số cụm cần phân cụm của tổ hợp kênh C ảnh đầu vào. điểm ảnh Giá trị độ thuộc cụm thứ c của điểm ảnh Phép nâng cao độ tƣơng phản trực tiếp của một  i,j,c (i, j), đầu ra của thủ tục phân cụm FCM ảnh xám đƣợc công bố trong [7] có thể đƣợc tóm tắt fcut (0, 1): Tham số xác định C dải nhƣ sau: fcut động mức xám của một kênh ảnh (mục Giả sử gij là mức xám của một điểm ảnh I(i,j) at III) của ảnh đa cấp xám I kích thƣớc M × N, và Wij cửa sổ II.1. Độ tƣơng phản trực tiếp tại từng điểm ảnh lân cận tại (i, j) kích thƣớc d × d. Thực hiện tuần tự Thông thƣờng, độ tƣơng phản chỉ sự chênh lệch về các bƣớc sau: độ sáng giữa một đối tƣợng (ký hiệu là f) và vùng Bƣớc 1: Tính các tham số địa phƣơng đƣợc chuẩn hóa xung quanh của nó (ký hiệu là b). Tƣơng tự nhƣ [6, giá trị về đoạn [0, 1], gradient Eij, entropy Hij, trung 7], trong bài báo này chúng ta cũng sử dụng độ đo bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij: tƣơng phản sau: 1.1: Tính cƣờng độ biên ảnh: fb C (3) e = {eij} là giá trị cƣờng độ biên ảnh xám đầu vào fb bằng một toán tử xác định ảnh biên nhƣ toán tử Sobel. - 61 -
  4. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 1.2: Giá trị trung bình, độ lệch chuẩn max  min *  ij  min ij min , (14)  = {ij}, v = {vij}, trong đó ij là giá trị trung bình max min mức xám, vij là độ lệch chuẩn mức xám lấy tại lân cận ggk 1 trong đó:  , max 1, gk, g1 điểm ảnh gij min (15) ggmax 1 2 là các đỉnh của histogram đƣợc xác định theo [3] g pq g    pq ij (6) (,)Wpq ij (,)Wpq 3.3: Nâng độ tƣơng phản  , ij ij 2 vij 2 t ' ij (16) d d CC , 1.3: Tính giá trị entropy địa phƣơng ij ij L trong đó tham số t {0.25, 0.5} [7] pplog  kk (7) 3.4: Tính giá trị mức xám mới tại từng điểm ảnh k 1 , hij  t 2log d 11 CC' ij ij  ij  ij ' ij  t , gij ij ij #(,)W: p q ij gpq , k 1 Cij 1 C ' ij pk 2 g ij t (17) d ' ij 11 CC ij  ij  1.4: Tính moment bậc 4 ij ' ij  t , gij ij 4 1 C ij ij 1 Cij  g pq ij  (,)Wpq ij (8) 4,ij 2 Thuật toán [6, 7] thỏa mãn điều kiện sau: Tại từng d 1 1.5: Chuẩn hóa về miền giá trị là đoạn [0, 1] điểm ảnh, độ thuần nhất càng cao thì mức độ nâng e v tƣơng phản càng thấp. ij , ij Eij Vij (9) max eij  max vij  h  ij , 4,ij Hij R4,ij max hij  max  4,ij  Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và giá trị mức xám không thuần nhất 2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh HO  ij , ij (10) max HOij trong đó HO E V H R ij ij ij ij 4 Hình 3. Đồ thị số mũ khuếch đại của [7] (gần tuyến (11) 1EVHRij * 1ij * 1ij * 1 4,ij tính) 2.2: Tính giá trị mức xám không thuần nhất (non- Nhƣ đã đề cập trong phần I, đối với ảnh tối, thuật homogeneity gray value [7]) toán nâng cao độ tƣơng phản trực tiếp trên không thay  g pq(1  pq ) đổi đƣợc độ sáng của ảnh. Để giải quyết vấn đề thay (,)Wpq ij (12) ij đổi độ sáng của ảnh sau khi tăng cƣờng độ tƣơng phản  (1  pq ) (,)Wpq ij (địa phƣơng) chúng tôi đề xuất xây dựng một biến đổi Bƣớc 3: Tính giá trị độ tƣơng phản tại từng điểm ảnh ảnh F của từng kênh ảnh xám của tổ hợp kênh ảnh đầu và số mũ khuếch đại vào. Khi đó độ tƣơng phản đƣợc tính công thức (13) 3.1: Giá trị độ tƣơng phản sẽ đƣợc thay đổi thành: FF(i, j)  ( ) (18) gij  ij ij Cij , Cij (13) F(,)() i j ij F gij  ij 3.2: Số mũ khuếch đại ở đây ta đồng nhất biến đổi F với ảnh {F(i, j)}. - 62 -
  5. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Trong [6], các tác giả cũng đã xây dựng một biến biến đổi kênh ảnh và kỹ thuật nâng cao độ tƣơng phản đổi mờ hóa ảnh áp dụng cho quy trình nâng cao độ của ảnh màu xét trong biểu diễn màu HSV. tƣơng phản trực tiếp. Nhƣ đã phân tích ở phần I, biến III.1. Ƣớc lƣợng nhiều dải động mức xám dựa đổi ảnh này có thể làm mất chi tiết ảnh. Để chi tiết vào phân cụm mờ FCM chúng tôi sẽ tóm lƣợc lại phép mờ hóa kênh ảnh của Phân cụm mờ c-mean (FCM [4]), đƣợc sử dụng [7] nhƣ mục sau: hiệu quả trong một số nghiên cứu về nâng cao độ II.4. Ƣớc lƣợng dải động mức xám và biến đổi - mờ tƣơng phản của ảnh một kênh. hóa ảnh sử dụng S-function Trong [16] đã trình bày một cách xác định dải Dựa trên histogram của ảnh, trong [6, 7] các tác động của miền giá trị mức xám bằng cách sử dụng giả đã nhận thấy đỉnh đầu tiên của histogram của ảnh thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có liên quan đến vùng nền và mức xám lớn hơn đỉnh sau tính chất đều hơn, và do đó việc xác định dải động cùng có thể là nhiễu. Vì vậy các tác giả đã đề xuất mức xám là tƣơng đối dễ dàng. Ngoài ra trong [15] cách xác định một dải động của mức xám nhƣ sau: các tác giả cũng sử dụng FCM để phân đoạn k histogram và nâng cao độ tƣơng phản theo bộ phận Đặt  Hgismiax ( ) (19) i 1 của histogram. Hgismax ( ) , k Để có thể ƣớc lƣợng tự động dải động mức xám trong đó k là số điểm cực đại địa phƣơng) của cho nhiều loại ảnh khác nhau nhƣ ảnh tối, ảnh sáng, histogram, Hismax(g1), , Hismax(gk) là các điểm cực ảnh có độ tƣơng phản thấp và ảnh có độ tƣơng phản đại địa phƣơng của histogram, g1, gk là điểm cực đại cao, chúng tôi đề xuất sử dụng phân cụm mờ để ƣớc địa phƣơng đầu tiên và sau cùng tƣơng ứng sao cho: lƣợng dải động của mức xám của từng kênh ảnh của (20) ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu Hismax(g1) Hgismax ( ), Hismax(gk) Hgismax ( ) nhƣ biểu diễn màu RGB, các kênh ảnh là không độc Dải động mức xám là đoạn [a, c] ở đó lập mà có độ tƣơng quan cao, vì thế cách làm ƣớc lƣợng dải động của từng kênh ảnh độc lập là không a = min{(1 - f2)(g1 - Lmin) + Lmin, B1} (21) c = max{f2(Lmax - gk) + gk, B2}, hoàn toàn phù hợp trong trƣờng hợp tổng quát. Trong trong đó B1, B2 đƣợc xác định : kỹ thuật của chúng tôi, do đặc tính của thuật toán phân cụm mờ là thích hợp cho dữ liệu đầu vào dạng B1 Lmax His( i ) f H is( i ) 1 vector số nên kỹ thuật sử dụng FCM sẽ có tính khái i Lmin i Lmin LLmmax ax (22) quát cao khi áp dụng cho các kênh ảnh có sự tƣơng His( i ) f1 H is( i ), quan. i B2 i Lmin Sau khi phân cụm, việc ƣớc lƣợng dải động mức và Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất xám của từng cụm sẽ dễ dàng hơn do tính đồng nhất của kênh ảnh, các hằng số f1 = 0.01, f2 = 0.5 đƣợc xác cao của giá trị mức xám trong một cụm. định bằng thực nghiệm. Với một tổ hợp K kênh ảnh của ảnh I (trong một Từ dải động mức xám [a, c] đã ƣớc lƣợng trên, biểu diễn màu), để thuận tiện chúng ta ký hiệu trong [6] đã trình bày một thuật toán để mờ hóa ảnh I1, K {I1 , I 2 , , I K }, sử dụng thuật toán phân cụm đầu vào trƣớc khi nâng cao độ tƣơng phản của ảnh mờ FCM phân cụm I thành C cụm, C ≥ 2. Thuật đầu vào. 1, K III. KỸ THUẬT ĐỀ XUẤT toán lặp FCM cực tiểu hóa hàm mục tiêu: C 2 Phần này trình bày kỹ thuật ƣớc lƣợng các dải JV(,)  2 (23)  i,, j c I1,K (,) i j Vc min động của mức xám sử dụng phân cụm mờ FCM, phép i,1 j c - 63 -
  6. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 2 với độ đo khoảng cách Ơcơlit, Bƣớc 1: Phân C cụm tập vector dữ liệu I1, K (,) i j Vc I(,) i j bằng thuật toán FCM chuẩn K k i 1, M , j 1, N , k 1, K 2 và các ràng buộc biến nhƣ sau:  IVk (,)()i jc k C k 1 ta đƣợc V ,  , theo công c c 1 i,, j c i 1, M , j 1, N , c 1, C (i)  [0, 1],1 c C thức (24). i,j,c C Bƣớc 2: Xác định histogram mờ k theo (ii)   (24) hc   i, j,c 1, 1 i M, 1 j N c 1, C , k 1, K c1 công thức (25).   (iii)  i, j,c 0, 1 c C Bƣớc 3: k 1, K , c 1, C i, j B Lkm, ax Nhƣ vậy với FCM chúng ta nhận đƣợc bảng các kk Bk,1, c arg min hc ( g ) fcut h c () g B [L ,L ] giá trị độ thuộc từng cụm cho từng điểm ảnh là k,min k,max  g Lkk,min g L ,min (26)  , trong đó 1 ≤ c ≤ C, 1 ≤ i ≤ M và 1 ≤ j ≤ N. LLk ,max k, m ax i,, j c  kk Bk,2, c arg min hc ( g ) fcut h c () g B [B +1,L ] Định nghĩa 3.1: Histogram mờ: kc,1, k,max  g B g Lk ,min Giả sử là bảng độ thuộc thỏa mãn ở công Trả về: BB, k,1, c k ,2, c k 1, K , c 1, C thức (24), histogram mờ theo từng kênh Ik của ảnh I k Thuật toán 1 có độ phức tạp tồi nhất là O(M*N*L), (trong một biểu diễn màu), 1 k K , ký hiệu là hc trong đó L là tham số số lần lặp tối đa của thuật toán đƣợc xác định nhƣ sau: FCM chuẩn. k hc g  i,, j c,g L k,min L k ,max (25) 12 Kk (i , j ) gi,j g i,j , g i,j , , g i,j : g i,j g Nhận xét: Khi K = 1, C = Lmax - Lmin + 1 và 1,I1 ( i , j ) c 1 c 1, L1,max L 1,min 1, i , j , c thì 0 1 hcc ( 1)  trùng với histogram thông cL 1,k, km ax ,L k,min +1 thƣờng của ảnh xám. Thuật toán 1. Ƣớc lƣợng C dải động mức xám của một cụm trong một tổ hợp kênh ảnh sử dụng Hình 4. Histogram của kênh V, cụm số 1 ảnh #4 (C = 5), trục hoành biểu diễn giá trị xám, trục tung biểu thị histogram mờ. tần suất Đầu vào: K kênh của ảnh I (trong một biểu diễn III.2. Biến đổi kênh ảnh màu), I {I , I , , I }, tham số C NC,2, 1,K 1 2 K Định nghĩa 3.2: Phép biến đổi kênh ảnh của một ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của tổ hợp kênh trong một biểu diễn màu của ảnh đầu vào. ảnh I. trong Xét K kênh của ảnh I, I1, K {I1 , I 2 , , I K } Đầu ra: BBk,1, c, k ,2, c  , trong đó k 1, K , c 1, C một biểu diễn màu, C NC ,2 là số cụm,  Lk,min B k ,1, c B k ,2, c L k ,max , c 1, C , k 1, K BBk,1, c, k ,2, c  là các dải động mức xám k 1, K , c 1, C đƣợc xác định nhờ thuật toán 1. - 64 -
  7. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Với mỗi kK 1, , chúng ta xác định một biến đổi Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV Fk cho kênh ảnh Ik nhƣ sau: tƣơng ứng theo công thức (27), định nghĩa 3.2 với các C dải động mức xám đƣợc ƣớc lƣợng từ bƣớc 2 cho mỗi Ik (,) i j Bk,1, c Lkk,max L ,min clip  (27) kênh S và kênh V. c 1 BBk,2, c k ,1, c F(,) i j L , kk ,min C Bƣớc 4: Tính tham số của [7] cho kênh FS, FV nhƣ đã trình bày trong mục 2 (xem các công thức từ (6) đến trong đó k 1, K , i 1, M , j 1, N , clip(x) = (12) với kích thƣớc cửa sổ dxd, cụ thể là các giá trị min{max{x, 0}, 1} và [x] chỉ phần nguyên của số mức xám không thuần nhất {δS,ij}, {δV,ij}, số mũ thực x. khuếch đại {S,ij}, {V,ij} tại từng điểm ảnh của kênh FS và kênh FV. Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là Bƣớc 5: Tính độ tƣơng phản và xác định kênh ảnh xám mới của kênh FS và kênh FV, IijIijk ( , ) k ( ', ') Lk,min FijFij k ( , ) k ( ', ') Lk,max FIFIS S,, new, V V new nhƣ sau: Kỹ thuật nâng cao độ tƣơng phản ảnh màu trong Với kênh F và kênh F : Tính độ tƣơng phản biểu diễn màu HSV, ảnh RGB đầu vào đƣợc chuyển S V sang biểu diễn HSV. Sau đó, thuật toán sẽ sử dụng FSS(,)() i j ij F FVV(,)() i j ij F , CS,ij CV,ij (28) ảnh 2 kênh {S, V} nhƣ một ảnh 2 kênh đầu vào để FSS(,)() i j ij F FVV(,)() i j ij F thực hiện phép nâng cao độ tƣơng phản đƣợc thực Tính giá trị mức xám mới của kênh S và V: hiện theo thuật toán 2 nhƣ dƣới đây. Hai kênh ảnh {S,  t 1 C S,ij V} mới là đầu ra thu nhận đƣợc sẽ kết hợp với kênh H S,ij S,ij  t , gS,ij S,ij S,ij gốc của ảnh đầu vào để biến đổi ngƣợc từ biểu diễn 1 CS,ij I(,)ij S,new  t màu HSV trở về biểu diễn màu RGB. Đầu ra của biến 1 C S,ij S,ij , g (29) đổi ngƣợc HSV sang RGB là ảnh kết quả cuối cùng S,ij  t S,ij S,ij 1 C S,ij đƣợc trả về. Thuật toán 2 đƣợc thực hiện nhƣ sau: S,ij t  1 C V,ij V,ij Thuật toán 2. Nâng cao độ tƣơng phản ảnh màu sử V,ij  t , gV,ij V,ij V,ij 1 CV,ij dụng biểu diễn màu HSV. I(,)ij V,new  t 1 C S,ij Đầu vào: Ảnh màu I trong biểu diễn màu RGB, có V,ij V,ij  t , gV,ij V,ij V,ij kích thƣớc M x N. Tham số C NC,2, ngƣỡng 1 CV,ij fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ). Lƣu ý ở đây kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2. Đầu ra: Ảnh màu RGB Inew, và tùy chọn trả về: Bƣớc 6: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu Giá trị tƣơng phản trung bình CMR, CMG, CMB diễn màu HSV về biểu diễn màu RGB, ta đƣợc ảnh Giá trị Eavg , Havg Inew. Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn màu của I trong Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số khách quan không gian màu HSV. Lƣợng hóa để coi các kênh IS, CM{R,G,B}, Eavg và Havg IV nhƣ là các ảnh đa cấp xám. 7.1: Tính tham số của [7] cho kênh IR, IG và IB của ảnh Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (I , I ), S V gốc I nhƣ đã trình bày trong mục II.3 (xem các công tham số số cụm là C và ngƣỡng fcut , gọi thuật toán 1 thức từ (6) đến (12) với kích thƣớc cửa sổ dxd, cụ thể để ƣớc lƣợng các dải động mức xám theo kênh IS, IV. là các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, (xem công thức (24), (25) và (26)) và {δ } của kênh I , I và I tƣơng ứng. B,ij R G B - 65 -
  8. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 7.2: Tính CMR, CMG, CMB theo công thức (31), cụ Để đánh giá hiệu quả của phƣơng pháp đƣợc đề thể là: xuất, chúng tôi sẽ đƣa ra một số thực nghiệm cơ bản I(,) i j  và so sánh kết quả với kết quả của phƣơng pháp đƣợc new, R R,ij mô tả trong [7]. Trong thực nghiệm chúng tôi đã sử   ij Inew, R (,) i j R,ij dụng đa dạng các kiểu ảnh màu, các kênh màu của CM R MN ảnh vệ tinh. Các ảnh đa màu đƣợc chọn điển hình từ I(,) i j  loại ảnh tối, ảnh sáng, ảnh có độ tương phản các kênh  new, G G,ij I(,) i j  là thấp, ảnh có độ tương phản các kênh là cao v.v CM ij new, G G,ij G MN Các ảnh có thể có độ sáng thấp và chi tiết ảnh là không quan sát đƣợc rõ bằng mắt. I(,) i j  new, B B,ij Việc lựa chọn ảnh thử nghiệm đa dạng nhƣ vậy   ij Inew, B (,) i j B,ij nên chúng tôi tin tƣởng rằng việc kiểm thử các thuật CM B MN toán của chúng tôi sẽ cho một đánh giá khách quan về 7.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công hiệu quả của chúng. thức (32). Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo Tập ảnh màu (đánh số #1 - #6) đƣợc dùng để thể công thức (35). hiện trong khuôn khổ bài báo này thu nhận từ tập ảnh RGB đƣợc công bố trong [14] (ảnh từ #3 đến #5 trong Trả về: Inew, và các tùy chọn đƣợc trả về hình 6), ảnh vệ tinh huyện Lạc Thủy của Việt Nam CM , CM , CM , R G B (ảnh #6 trong Hình 6). Eavg , Havg. Thuật toán 2 có độ phức tạp tƣơng đƣơng thuật toán gốc [7]. Mô hình kiến trúc hệ thống đề xuất (Hình 5) đƣợc xây dựng và tƣơng tác nhƣ sau: Bắt đầu #1: Kích thƣớc 352x254 Ảnh RGB đầu vào #2: Kích thƣớc 256x384 CHUYển đổi RGB sang HSV Biến đổi kênh S và V TÍNH ij, δij và ij của kênh S và kênh V đã đƣợc biến đổi #3: Kích thƣớc 512x384 #4: Kích thƣớc 512x384 TÍNH CÁC GIÁ TRị mức xám mới của kênh S và kênh V CHUYển đổi ngƣợc HSV về RGB Kết thúc Hình 5. Lưu đồ xử lý của các thuật toán đề xuất. #5: Kích thƣớc 512x384 IV. THỰC NGHIỆM #6: Kích thƣớc 633x647 IV.1. Ảnh thử nghiệm Hình 6. Một số ảnh gốc được dùng cho thử nghiệm. - 66 -
  9. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 IV.2. Tính độ thuần nhất kênh ảnh Chất lƣợng ảnh đƣợc nâng cao độ tƣơng phản phụ thuộc vào giá trị thuần nhất tại mỗi điểm ảnh, bởi vì độ đo thuần nhất liên quan chính đến các thông tin địa phƣơng của một ảnh và phản ánh tính đều của các (a) (b) vùng ảnh và nó đóng vai trò quan trọng trong nâng cao chất lƣợng ảnh [7]. Trong thử nghiệm các giá trị địa phƣơng đƣợc mô tả trong [7] đƣợc tính với kích thƣớc cửa số 3x3, đặc biệt công thức (11) tính các giá trị thuần nhất (c) (d) HO E* V * H * R 1 E * 1 V * 1 H * 1 R ij ij ij ij 4,ij ij ij ij 4,ij Hình 8. Độ thuần nhất tính theo công thức gốc (11) [7] (a) đƣợc chúng tôi thay thế bởi công thức sau: Ảnh nâng cao độ tương phản 3 kênh R,G và B sử dụng công (30) thức (11) (b) Độ thuần nhất tính theo công thức (30) (c) HOij max Eij * H ij , V ij * R 4,ij , Ảnh nâng cao sử dụng công thức (30) (d) ở đây cần nhấn mạnh là các giá trị entropy địa phƣơng Hình 7.a chứng tỏ các giá trị độ thuần nhất tại các Hij rất nhạy với nhiễu và sự thay đổi của giá trị mức điểm ảnh của ảnh #5 và ảnh kết quả của phép nâng xám, nên khi kết hợp theo công thức (11) có thể tạo ra cao của [7] khi dùng công thức gốc (11) là không đủ giá trị độ thuần nhất rất không trơn và do đó ảnh trơn (xem hình 7.b ở các vùng đánh dấu ô chữ nhật). hƣởng đến độ trơn của ảnh nâng cao độ tƣơng phản Ngoài ra thử nghiệm với các ảnh màu khác nhau cùng đầu ra. Để đi tới đề xuất công thức đơn giản (30) thuật toán của [6, 7] cho từng kênh ảnh R, G và B chúng tôi đã khảo sát trên 30 công thức khác nhau kết chúng tôi cũng nhận thấy cả 2 công thức (11) và công hợp 4 đặc trƣng địa phƣơng Eij, Hij, Vij, R4,ij, trong đó thức (30) cùng cho ảnh đầu ra của thuật toán [7] có sự đã sử dụng các toán tử kết nhập mờ thông dụng nhƣ tƣơng phản mạnh ở vùng có độ thuần nhất thấp min, max, product, Yager, Zimmerman, Hamacher, (chẳng hạn, vùng đôi mắt, xem hình 8.b và 8.d) và Dombi, Aczel, tổng trọng số v.v [10] và thấy rằng mức độ sáng của hình ảnh đƣợc nâng cao là nhƣ nhau. công thức (30) là phù hợp cho đa dạng ảnh màu RGB IV.3. Đánh giá thuật toán 2 (các ảnh đã đƣợc nâng cao độ tƣơng phản khi sử dụng Khi đánh giá kết quả thuật toán 1 và thuật toán 2 công thức (30) và thuật toán của [7] đều trơn). Ngoài của chúng tôi so với thuật toán gốc đƣợc công bố ra, trong [7] các tác giả cũng đã chỉ sử dụng E và H ij ij trong [7], vì [7] chỉ đƣợc phát biểu ứng dụng cho ảnh để tính giá trị trung bình không thuần nhất của điểm đa cấp xám, trong khi thuật toán của chúng tôi đƣợc ảnh khi nâng cao độ tƣơng phản của kênh ảnh theo phát biểu cho ảnh màu để đảm bảo tính khách quan phƣơng pháp trực tiếp. ngoài đánh giá bằng trực quan chúng tôi sẽ sử dụng các chỉ số khách quan để đánh giá. Nhƣ vậy cách đánh giá của chúng tôi là: Bằng trực quan. Sử dụng chỉ số biểu diễn độ tƣơng phản trực tiếp. Chỉ số đánh giá khách quan khác. (a) (b) Lƣu ý rằng trong các thực nghiệm của thuật toán Hình 7. {Hij} #5. (a) {Vij}; (b) 3 kênh R, G và B với ảnh #5. gốc [7, 6] các tác giả của các thuật toán gốc chỉ sử - 67 -
  10. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 dụng đánh giá bằng cảm nhận trực quan, không dùng Giả sử ggkk [Lk,min , L k,max ] ( ) [0,1] là một bất kỳ một chỉ số khách quan nào để đánh giá. phép mờ hóa nào đó L Các chỉ số đánh giá khách quan độ tƣơng phản ảnh k ,max (33) HI ()kk   ()log(())g22  g 1  ()log(1 g  ())*g p () g đƣợc dùng trong bài báo này cụ thể là: gLk ,min Dƣới đây chúng ta sẽ dùng phép mờ hóa tự nhiên: (1) Chỉ số độ tƣơng phản trực tiếp đƣợc lấy trung def gL k,min bình trên toàn bộ các điểm ảnh của một kênh ảnh Ik’ gg() (34) LLkk,max ,min so với một kênh ảnh gốc Ik (Ik’ và Ik có cùng kích thƣớc M x N), chúng đƣợc cho nhƣ sau: Khi đó ta viết gọn H thay cho H, và ta có một độ '  Ikk(,) i j ,ij đo fuzzy-entropy trung bình của K kênh ảnh nhƣ sau:  ' I(,) i j  (31) K ' i,j kk,ij CM(,) Ikk I ,  HI()k MN HI() k 1 (35) avg 1, K K ở đây δk,ij là giá trị mức xám không thuần nhất tại điểm ảnh (i, j) của Ik (xem ký hiệu ở bảng 1, và xem Nhận xét: Giá trị fuzzy entropy càng thấp thì độ [7]). phân biệt một điểm ảnh của một kênh ảnh là sáng Nhận xét: Nói chung ta có, hoặc tối càng cao tức là ảnh càng có độ tƣơng phản tối – sáng cao, các điểm ảnh của kênh ảnh Ik có mức xám CM(,)(,) I I'' CM I I k k k k tƣơng phản cao với mức sáng “xám” ở giữa: " ' " ' CMJI(,)(,)(,)(,)k k CMJIk k  CMIIk k CMIIk k LL I(,) i j kk,min ,max  HI()  ở đây Ik, Jk, Ik’ và Ik” là các kênh ảnh có cùng kích kk2 thƣớc. Nhận xét nhấn mạnh là phép nâng cao độ Các ảnh thể hiện trong bài báo này đƣợc đánh chỉ tƣơng phản của ảnh biến đổi từ ảnh gốc thì chƣa chắc số nhƣ trong Hình 6. đã là phép nâng cao độ tƣơng phản của ảnh gốc. Trong các nghiên cứu về độ tƣơng phản ảnh nhƣ (2) Chỉ số entropy đƣợc lấy trung bình trên toàn bộ [12], chỉ số khách quan  nhƣ sau thƣờng hay đƣợc các điểm ảnh và các kênh ảnh, chúng đƣợc cho nhƣ sử dụng: sau: Lk ,max Lmax k   (Ikk )  min  (g ),1  ( g ) * p ( g ) gL k ,min E() Ik  pk ( g )log2 ( pk ( g )) gLmink (32) Thực ra chỉ số  cũng tƣơng tự nhƣ chỉ số fuzzy K entropy theo ý nghĩa :  EI()k EI(), k 1 avg 1,K LLkk,min ,max K Ikk(,) i j   ()I  def #(,) I i j g  2 trong đó pg() k và quy ƣớc k MN Vì vậy trong phần thực nghiệm này, chúng tôi 0*log2(0) = 0. không đề cập đến chỉ số khách quan  khi đánh giá Giá trị của chỉ số entropy cao thì có thể xem ảnh là kết quả thực nghiệm. giầu tính chi tiết. Chỉ số entropy của ảnh kết quả càng Với các ảnh thử nghiệm bƣớc đầu tiên là tính các cao thì khả năng là ảnh kết quả bảo toàn tốt tính chi giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và tiết của ảnh gốc. {δB,ij} của 3 kênh R, G và B tƣơng ứng. Các giá trị này (3) Chỉ số đánh giá khách quan fuzzy-entropy đƣợc dùng để tính độ đo tƣơng phản CM trên từng đƣợc lấy trung bình trên toàn bộ các điểm ảnh và các kênh R, G và B của ảnh đầu vào và ảnh kết quả. Từ kênh ảnh, chúng đƣợc cho nhƣ sau: đó cho chúng ta đánh giá hiệu quả của các thuật toán tăng độ tƣơng phản trực tiếp của ảnh màu RGB. - 68 -
  11. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Để dễ theo dõi, chúng tôi trình bày lại thuật toán Bƣớc 4: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu [7] nhƣ một thủ tục, giải mã đƣợc cho nhƣ sau: diễn màu HSV về biểu diễn màu RGB, ta đƣợc ảnh Thủ tục 1. Nâng cao độ tƣơng phản ảnh màu trong Inew. biểu diễn màu HSV, sử dụng phƣơng pháp của [7] cho Bƣớc 5: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B} cho từng kênh S và kênh V. kênh R, G và B, Eavg và Havg nhƣ sau: Đầu vào: Ảnh màu I trong biểu diễn màu RGB, có 5.1: Tính tham số của [7] cho kênh IR, IG và IB của kích thƣớc M x N. Tham số d (d x d là kích thƣớc cửa ảnh gốc I nhƣ đã trình bày trong mục II.3 (xem các sổ). công thức tử (6) đến (12) với kích thƣớc cửa sổ dxd, Đầu ra: Ảnh màu RGB Inew, và tùy chọn trả về: cụ thể là các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và {δB,ij} của các ảnh đa cấp xám IR, IG và IB Giá trị tƣơng phản trung bình CMR, CMG, CMB tƣơng ứng. Giá trị Eavg , Havg 5.2: Tính CMR, CMG, CMB theo công thức (31), cụ Bƣớc 1: Gọi (I , I , I ) là biểu diễn màu của I trong H S V thể là: không gian màu HSV. Lƣợng hóa coi các kênh IS, IV I(,) i j  là các ảnh đa cấp xám.  new, R R,ij I(,) i j  Bƣớc 2: Tính tham số của [7] cho ảnh đa cấp xám CM ij new, R R,ij R MN* IS,IV nhƣ đã trình bày trong mục II.3 (xem các công I(,) i j  thức từ (6) đến (12) với kích thƣớc cửa sổ dxd, cụ thể  new, G G,ij I(,) i j  là các giá trị mức xám không thuần nhất {δS,ij}, {δV,ij}, ij new, G G,ij CM G số mũ khuếch đại {S,ij}, {V,ij} tại từng điểm ảnh của MN* ảnh đa cấp xám IS và IV tƣơng ứng. Inew, B (,) i j  B,ij Bƣớc 3: Tính độ tƣơng phản và tính mức xám mới  ij I(,) i j  của kênh S và kênh V, IIII, CM new, B B,ij S S,, new V V new B MN* Với kênh S và kênh V: Tính độ tƣơng phản 5.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công I(,) i j  I(,) i j  thức (32). Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo C S S,ij , C V V,ij S,ij V,ij công thức (35) IS (,) i j S,ij IV (,) i j V,ij Trả về: I , và các tùy chọn trả về Tính giá trị mức xám mới của kênh S và new kênh V CMR, CMG, CMB , Eavg , Havg  t 1 C S,ij S,ij Bảng 2 là giá trị chỉ số của các ảnh #1 - #6, đƣợc S,ij  t ,(,)IS i j S,ij S,ij 1 CS,ij tính từ các công thức (31) đến (35). I(,)ij S,new  t 1 C S,ij S,ij S,ij  t ,(,)IS i j S,ij Bảng 2. Giá trị chỉ số ảnh thể hiện. S,ij 1 CS,ij Ảnh CMR CMG CMB Eavg Havg  t V,ij #1 0.1180 0.1914 0.2482 5.9395 0.3456 1 CV,ij  #2 0.0160 0.0191 0.0314 7.315 0.8216 V,ij  t ,(,)IV i j V,ij V,ij 1 CV,ij #3 0.0154 0.0188 0.0548 7.4847 0.8001 I(,) i j V, new  t 1 C V,ij #4 0.0256 0.0298 0.0511 7.4536 0.8642 V,ij V,ij  t ,(,)IV i j V,ij #5 0.0170 0.0293 0.0345 7.3092 0.8504 1 C V,ij V,ij #6 0.0273 0.0304 0.0364 3.4443 0.2861 - 69 -
  12. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 IV.4. Các kết quả và luận giải Trong phần này chúng tôi trình bày hai kiểm thử, chúng bao gồm: (A) Phép mờ hóa - biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp kênh ảnh (a) (b) (B) Thử nghiệm nâng cao độ tương phản sử dụng Hình 9. (a) Ảnh mờ hóa của ảnh #1 sử dụng [6]; biến đổi ảnh trên 2 kênh ảnh (kênh S và kênh V) trong (b) Ảnh kết quả sử dụng thuật toán đề xuất 1 biểu diễn màu HSV. Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi A. Thực nghiệm để kiểm tra hiệu quả của Phép mờ của [6], chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc hóa-biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh kênh ảnh so với phép mờ hóa của [7]. biến đổi sử dụng nhiều dải động ƣớc lƣợng từ phân Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ cụm FCM cho tổ hợp kênh RGB (thuật toán 1) chi tiết R, G và B chúng tôi thực hiện phép mờ hóa bằng biến ảnh đƣợc giữ tốt hơn. đổi S-function đƣợc xây dựng trong [6]. Quan sát các kênh G và B của ảnh biến đổi của ảnh Hàm biến đổi S(x; a, b, c) với các tham số a và c #2 sau đây ta cũng thấy độ chi tiết của ảnh biến đổi sử đƣợc xác định dựa trên phân tích histogram của kênh dụng [6] cũng bị suy giảm nhiều hơn biến đổi ảnh dựa ảnh và tham số b đƣợc dò tìm bằng phép cực đại hóa trên thuật toán 1 đã đề xuất. fuzzy entropy. Thuật toán 1 của chúng tôi thực hiện đồng thời cho 3 kênh ảnh R, G và B, tham số f1, f2 để ƣớc lƣợng khoảng động mức xám [B1,c,k B2,c,k] của từng cụm c ứng với kênh R, G và B đƣợc xác định dựa trên thực nghiệm, fcut = 0.005. Thuật toán phân cụm tập vector giá trị điểm ảnh {IR(i, j), IG(i, j), IB(i, j)} sử dụng số (a) (b) cụm C [2,10]. Trong thực nghiệm này chúng tôi chọn C = 5. Bảng 3. So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết quả của phép mờ hóa – biến đổi ảnh Ảnh Havg Havg (sử dụng [7]) (sử dụng thuật toán 1) #1 0.4478 0.4950 #2 0.6931 0.7879 (c) (d) #3 0.5736 0.7200 Hình 10. Kênh G và kênh B của ảnh biến đổi sử #4 0.5822 0.7624 dụng [6] (a), (c). Kênh G và kênh B của ảnh biến đổi #5 0.6227 0.8157 sử dụng thuật toán 1 (b), (d). #6 0.3374 0.3512 Phân tích trên lại cho thấy việc biến đổi của [6] chỉ Bảng 3 cho chúng ta thấy độ không chắc chắn của sử dụng chỉ một bộ tham số {a, bopt, c} liên quan đến phép mờ hóa sử dụng nhiều dải động mức xám của dải động mức xám của kênh ảnh cho một dạng hàm thuật toán đề xuất 1 cao hơn so với phƣơng pháp sử biến đổi nhƣ S-function để biến đổi ảnh có thể làm dụng một dải động mức xám của [6]. Điều này cũng mất chi tiết ảnh. Trái lại, phƣơng pháp sử dụng nhiều phù hợp với trực quan khi quan sát các ảnh mờ hóa dải động của mức xám {B1,c,k, B2,c,k} đƣợc ƣớc lƣợng minh họa của #1 và #2. - 70 -
  13. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 từ histogram mờ, nhƣ của thuật toán 1 đã giữ đƣợc chi Cuối cùng, tính giá trị mức xám không thuần tiết ảnh tốt hơn. nhất tại từng điểm ảnh ứng với các kênh ảnh R, G và B (các giá trị này đƣợc dùng để tính độ đo tƣơng phản trung bình trên từng kênh R, G và B trong bảng 4). Giá trị trung bình độ tƣơng phản trực tiếp CM đƣợc tính trên kênh R, G và B trong biểu diễn màu RGB của ảnh đầu vào đƣợc tính với ảnh giá trị mức xám trung bình không thuần nhất của từng kênh R, G (a) (b) và B của ảnh RGB gốc và ảnh kết quả đầu ra khi sử Hình 11. Sử dụng biến đổi ảnh [6] với một dải động dụng thủ tục 1 và phƣơng pháp đề xuất (thuật toán 2) mức xám cho ảnh #3(a), #5 (b) và áp dụng [7]. đƣợc thể hiện ở Bảng 4. Trên Hình 11, các ảnh kết quả minh họa bị mất chi tiết ảnh, xem ở các vùng chữ nhật đánh dấu. Điều đó Bảng 4. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), chứng tỏ sự hạn chế của việc chỉ dùng một dải động và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. mức xám cho các biến đổi ảnh. CMR CMG CMB B. Thử nghiệm nâng cao độ tƣơng phản sử dụng Ảnh Thủ tục Thuật Thủ tục Thuật Thủ tục1 Thuật 1 gốc toán 2 1 gốc toán 2 gốc toán 2 thuật toán đề xuất 2 trên hai kênh ảnh S và V trong #1 0.1244 0.2143 0.1961 0.2575 0.2511 0.3373 biểu diễn màu HSV của ảnh đầu vào so với sử dụng #2 0.0157 0.1676 0.0193 0.1685 0.0320 0.1728 #3 0.0155 0.2157 0.0192 0.2166 0.0543 0.2351 thủ tục 1 (dựa vào thuật toán gốc). #4 0.0284 0.1232 0.0338 0.1254 0.0570 0.1385 #5 0.0170 0.0967 0.0299 0.1003 0.0352 0.1033 Trong thử nghiệm này, chúng tôi thực hiện kiểm #6 0.0275 0.0861 0.0307 0.0879 0.0375 0.0870 tra hiệu quả của thuật toán 2 đề xuất sử dụng phép phân cụm FCM để xác định tham số cho phép biến Bảng 5. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. đổi ảnh trong định nghĩa 3.2, công thức (27) so với sử E H dụng thủ tục 1 trên 2 kênh ảnh S và V riêng rẽ. Các avg avg Ảnh bƣớc đƣợc thực hiện nhƣ sau: Thủ tục Thuật Thủ tục Thuật 1 gốc toán 2 1 gốc toán 2 Đầu tiên, chuyển biểu diễn màu RGB sang biểu #1 5.8446 6.1855 0.3456 0.3077 diễn màu HSV của ảnh đầu vào. Phân cụm dữ liệu #2 6.8158 7.2568 0.8216 0.7004 mức xám tổ hợp kênh S và kênh V với tham số đƣợc #3 6.9599 7.0051 0.8001 0.6737 chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v ). #4 7.2337 7.4179 0.8642 0.7947 #5 7.0103 7.5376 0.8504 0.8233 trên từng kênh ảnh S và kênh V riêng rẽ ƣớc lƣợng #6 3.0140 4.0173 0.2868 0.2861 {B1,c,k, B2,c,k} (k {S, V}) và thực hiện biến đổi ảnh cho kênh S và kênh V tƣơng ứng sử dụng hàm biến Bảng 4 và 5 của kết quả thực nghiệm của các ảnh đổi FS, FV (công thức (27)) có tham số của các hàm #1 - #6 đã thể hiện các chỉ số khách quan độ tƣơng biến đổi là các dải động mức xám ƣớc lƣợng từ thuật phản trực tiếp trên từng kênh R, G và B khi sử dụng toán 1. thuật toán 2 đều cho kết quả cao hơn khi sử dụng Thứ hai, xác định giá trị độ tƣơng phản theo thuật toán [7]. Chỉ số khách quan Eavg khi áp dụng thuật toán 2 và các bƣớc liên quan cho kênh ảnh S và thuật toán 2 cũng cao hơn so với áp dụng thủ tục 1. V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật 3x3 và tham số t = 0.25 (công thức (16)). toán 2, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh số ảnh kết quả khi áp dụng thủ tục 1. S và kênh V đã nâng cao độ tƣơng phản, sau đó biến đổi ngƣợc từ biểu diễn HSV sang biểu diễn RGB. - 71 -
  14. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 Thứ nhất, chúng tôi đề xuất một phƣơng pháp biến đổi ảnh mới sử dụng nhiều hàm S-function đƣợc tham số hóa ứng với từng dải động mức xám. Các dải động mức xám này đƣợc ƣớc lƣợng tự động bằng thuật toán phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực (a) (b) tiếp với phƣơng pháp biến đổi sử dụng một hàm S- function với tham số hóa dựa trên cực đại fuzzy entropy [6]. Thứ hai, chúng tôi cũng đề xuất một thuật toán mới theo phƣơng pháp nâng cao độ tƣơng phản trực tiếp cho ảnh màu dựa trên thuật toán trong [7]. (c) (d) Cuối cùng, là một cải tiến nhỏ để tăng độ trơn của các giá trị độ thuần nhất của điểm ảnh khi thay đổi cách kết nhập các giá trị địa phƣơng (tại từng điểm ảnh) nhƣ gradient, entropy, độ lệch chuẩn trung bình và moment bậc 4 so với cách kết nhập của [7]. (e) (g) Kết qủa thực nghiệm đã chứng tỏ rằng các kỹ thuật đề xuất của chúng tôi làm việc tốt với đa dạng ảnh màu. Ảnh nâng cao độ tƣơng phản trơn và sự thay đổi mức độ sáng trong khi vẫn bảo toàn chi tiết ảnh gốc tốt hơn so với phƣơng pháp đƣợc công bố trong [6, 7]. (h) (k) Độ sáng của các kênh ảnh sau khi nâng cao độ tƣơng phản tƣơng đồng với độ sáng ảnh đầu ra của các phƣơng pháp gián tiếp. Trong các nghiên cứu tiếp theo, chúng tôi sẽ tiếp tục nghiên cứu các dạng kết nhập khác của các đặc trƣng địa phƣơng nhƣ gradient, (l) (m) entropy, độ lệch trung bình và moment bậc 4 dạng HOij = f(Eij, Hij, Vij, R4,ij) khi tính độ thuần nhất tại từng điểm ảnh. TÀI LIỆU THAM KHẢO [1] S. S. Agaian, S. Blair and K. A. Panetta, (n) (p) “Transform coefficient histogram-based image Hình 12. Ảnh kết quả (các ảnh cột bên trái ) sử dụng [7] enhancement algorithms using contrast entropy”, Ảnh kết quả (các ảnh cột bên phải) sử dụng thuật toán 2. IEEE Trans. Image Processing, vol. 16, no. 3, (2007): 741-758. V. KẾT LUẬN [2] Arici T., Dikbas S., and Altunbasak Y., “A Trong bài báo này chúng tôi đã đề xuất 3 đóng góp Histogram Modification Framework and Its mới cho phƣơng pháp nâng cao độ tƣơng phản ảnh Application for Image Contrast Enhancement,” IEEE màu theo tiếp cận trực tiếp. Transactions on Image Processing, vol. 18, no. 9, (2009):1921-1935. - 72 -
  15. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 [3] A. Beghdadi, A.L. Negrate, “Contrast Transactiong on Image Processiong, Vol. 15, No.10 enhancement technique based on local detection of (2006): 2956-2966. edges”, Comput. Vision Graphics Image Process. 46 [13] S. Lee, “An efficient content-based image (1989):162–174. enhancement in the compressed domain using Retinex [4] Bezdek, James C. Pattern recognition with fuzzy theory”, IEEE Trans. Circuits and Systems for Video objective function algorithms. Springer Science & Technology, vol. 17, no. 2, pp. (2007):199-213. Business Media, (2013). [14] Ponomarenko N. Ponomarenko, L. Jin, O. [5] A.O. Boudraa and E. H. S. Diop, “Image contrast Ieremeiev, V. Lukin, K. Egiazarian, J. enhancement based on 2D teager-kaiser operator”, Astola, B. Vozel, K. Chehdi, M. Carli, Proc. of the IEEE International Conference on Image F.Battisti, C.-C. Jay Kuo, “Image database Processing, (2008.): 3180-3183. TID2013: Peculiarities, results and perspectives, [6] Cheng H.D, Huijuan Xu, “A novel fuzzy logic Signal Processing”, Imag Communication, vol. 30, approach to contrast enhancement”, Pattern Jan. (2015):57-77. Recognition 33 (2000):809-819. [15] M. Shakeri, M.H. Dezfoulian, H. [7] Cheng H.D., Mei Xue, Shi X,J., “Contrast Khotanlou, A.H. Barati, Y. Masoumi, enhancement based on a novel homogeneity Image contrast enhancement using fuzzy clustering measurement”, Pattern Recognition 36 (2003):2687 – with adaptive cluster parameter and sub-histogram 2697. equalization, Digital Signal Processing 62, (2017) [8] L.Dash, B.N. Chatterji, “Adaptive contrast :224–237. enhancement and de-enhancement” , Pattern [16] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying Recognition 24 (1991) :289–302. Chang, Wei-Ting Tsai and Kuang-Hui [9] A.P. Dhnawan, G. Buelloni, R. Gordon, Tang, “Contrast Enhancement through Clustered Enhancement of mammographic features by optimal Histogram Equalization”, Research Journal of adaptive neighborhood image processing, IEEE Applied Sciences, Engineering and Technology 4(20), Trans. Med. Imaging 5 (1986):8–15. (2012):3965-3968, ISSN: 2040-7467. [10] M. M. Gupta, J. Qi, “Theory of T-norms and fuzzy [17] M. J. Soha and A. A. Schwartz, “Multi- inference methods”, Fuzzy Sets and Systems 40, dimensional histogram normalization contrast (1991):431-450. enhancement,” in Proc. 5th Canad. Symp Remote [11] Hanmandlu M., Devendra Jha, Rochak, Sensing, (1978):86–93. “Color image enhancement by fuzzy intensification”, Pattern Recognition Letters 24 (2003):81–87. Nhận bài ngày: 12/01/2017 [12] Hanmandlu M, Devendra Jha, “An Optimal Fuzzy System for Color Image Enhancement”, IEEE - 73 -
  16. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 SƠ LƢỢC VỀ TÁC GIẢ NGUYỄN VĂN QUYỀN NGÔ HOÀNG HUY Sinh năm 1979 tại Hải Phòng. Sinh năm 1969 tại Hà Nội. Nhận bằng thạc sĩ chuyên ngành Tốt nghiệp chuyên ngành Toán Khoa học máy tính tại trƣờng ĐH tin tại trƣờng ĐH Sƣ phạm Hà Sƣ phạm Hà Nội, năm 2008 Nội năm 1990. Đang là NCS tại Viện CNTT – Hiện công tác tại Viện CNTT, Viện Hàn lâm KH&CN Việt Nam Viện Hàn lâm KH&CN Việt Hiện công tác tại Phòng QLSĐH, Nam trƣờng ĐH Hải Phòng Lĩnh vực nghiên cứu: Xử lý ảnh, Lĩnh vực nghiên cứu: Xử lý ảnh, khai phá dữ liệu, tính Xử lý tiếng nói, Trí tuệ nhân toán mềm tạo, Khai phá dữ liệu, Hệ thống nhúng. Điện thoại: 0904.815.444 Điện thoại: 0904140022 Email: quyenqlkh.dhhp@gmail.com Email: huyngo3i@gmail.com TRẦN THÁI SƠN ĐẶNG DUY AN Sinh năm 1955, tại Nghệ An Sinh năm 1974 tại Thái Nguyên. Nhận học vị tiến sĩ năm 1990, tại Nhận bằng thạc sĩ tại Đại học Viện hàn lâm Khoa học Liên Xô Thái Nguyên, năm 2014. Hiện công tác tại Viện CNTT, Hiện công tác tại Công ty tập Viện Hàn lâm KH&CN Việt Nam đoàn CDC CORP - Viện máy và Lĩnh vực nghiên cứu: Lập luận Dụng cụ Công nghiệp - Bộ xấp xỉ, tính toán mềm Công Thƣơng Điện thoại: 0903409894 Lĩnh vực nghiên cứu: Trí tuệ Mail: ttson@ioit.ac.vn nhân tạo, khai phá dữ liệu, hệ thống nhúng Điện thoại: 0913215111 NGUYỄN TÂN ÂN Mail: duyanimi@gmail.com Sinh năm 1953 tại Hà Nội. Nhận bằng tiến sĩ năm 2002, tại trƣờng ĐH Năng lƣợng Maxcơva; nhận học hàm PGS năm 2012 tại Viêt Nam. Hiện công tác tại Khoa CNTT, Học viện Quản lý Giáo dục. Lĩnh vực nghiên: Trí tuệ nhân tạo, Mạng nơron nhân tạo, Tính toán mềm, Giáo dục tin học Điện thoại: 0912 321 559 Email: nguyentanan@yahoo.com - 74 -