Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê

pdf 7 trang Gia Huy 17/05/2022 2730
Bạn đang xem tài liệu "Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiai_phap_kiem_tra_chinh_ta_van_ban_tieng_e_de_dua_vao_mo_hi.pdf

Nội dung text: Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê

  1. 182 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mơ hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê Hồng Thị Mỹ Lệ1, Phan Huy Khánh2 1 Trường Đại học Sư phạm Kỹ Thuật, Đại học Đà Nẵng 2 Trường Đại học Bách Khoa, Đại học Đà Nẵng hoangthimyle.html@gmail.com khanhph@dut.udn.vn Tĩm tắt. Hiện nay nhu cầu sử dụng, trao đổi văn bản tiếng dân tộc thiểu số ở Việt Nam nĩi chung và tiếng Ê Đê nĩi riêng ngày càng nhiều. Yêu cầu đặt ra cho các văn bản là phải đảm bảo đúng, chính xác và hiệu quả. Các yêu cầu này thực hiện được thì các văn bản phải được kiểm tra chính tả, kiểm tra ngữ pháp trước khi sử dụng hay trao đổi. Trong ứng dụng soạn thảo văn bản MicroSoft Word đã cĩ chức năng kiểm tra chính tả và ngữ pháp tiếng Anh ở một mức độ tương đối nhất định. Đối với tiếng Việt cũng đã cĩ các phần mềm kiểm tra chính tả và phần nào cũng đã gĩp phần giải quyết bài tốn phát hiện lỗi chính tả trong văn bản tiếng Việt. Tuy nhiên, bài tốn kiểm tra chính tả văn bản tiếng Ê Đê cho đến nay vẫn chưa được quan tâm nghiên cứu của các nhà khoa học. Bước đầu nhằm gĩp phần giải quyết bài tốn kiểm tra chính tả văn bản tiếng Ê Đê, nghiên cứu đề xuất giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mơ hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê. Keywords: Xử lý tiếng Ê Đê, Kiểm tra chính tả tiếng Ê Đê, Âm tiết tiếng Ê Đê, Kho ngữ vựng tiếng Ê Đê, Dân tộc thiểu số. 1 Giới thiệu Mọi hoạt động xử lý thơng tin trên máy tính đều liên quan đến soạn thảo văn bản. Cĩ nhiều mục đích khác nhau trong soạn thảo văn bản: giao tiếp xã hội, các hoạt động hành chính-văn phịng, tổ chức lưu trữ và tìm kiếm tài liệu, xây dựng các hệ thống thơng tin, dịch thuật các ngơn ngữ tự nhiên, trong các ứng dụng in ấn, chế bản điện tử Bài tốn kiểm tra chính tả là thành phần quan trọng khơng thể thiếu trong các ứng dụng này [4], [10], [11]. Dựa vào loại hình ngơn ngữ, chính tả được kiểm tra theo các mức khác nhau. Với ngơn ngữ khơng đơn lập (tiếng Anh, tiếng Pháp, tiếng Nga ) kiểm tra chính tả được thực hiện ở mức từ. Với ngơn ngữ đơn lập (tiếng Hàn, tiếng Thái, tiếng Việt ) kiểm tra chính tả được thực hiện ở các mức âm tiết, mức từ, mức câu. Tính chính xác của phương pháp kiểm tra chính tả ở mức âm tiết và mức từ phụ thuộc vào chất lượng của từ điển âm tiết, từ điển từ vựng [3], [8]. Trong dạy và học tiếng dân tộc thiểu số ở Việt Nam nĩi chung và tiếng Ê Đê nĩi riêng, cũng như trong các lĩnh vực khác, nhu cầu sử dụng và trao đổi bằng văn bản tiếng dân tộc thiểu số ngày càng nhiều. Vì vậy, nhu cầu kiểm tra lỗi chính tả văn bản trước khi sử dụng là cần thiết. Tuy nhiên, các văn bản nếu được kiểm tra theo lối thủ cơng thì mất nhiều thời gian và khơng tránh khỏi sai sĩt. Cĩ nhiều nguyên nhân dẫn đến sai sĩt, trong đĩ nguyên nhân chủ quan là do người kiểm tra khơng kiểm tra hết văn bản, hoặc khi kiểm tra hết văn bản thì cũng chưa đảm bảo văn bản đĩ đã đúng tồn bộ. Lỗi xãy ra nhiều nhất trong văn bản là lỗi chính tả do đánh máy nhầm. Lỗi này thường xãy trên các văn bản được soạn thảo bởi những người chưa thơng thạo tiếng Ê Đê và chưa quen với cách gõ chữ cái tiếng Ê Đê.
  2. Hồng Thị Mỹ Lệ, Phan Huy Khánh 183 Kiểm tra chính tả tiếng Anh đã cĩ trong MicroSoft Word. Kiểm tra chính tả tiếng Việt cũng đã được sự quan tâm nghiên cứu của các nhà khoa học. Một số phần mềm kiểm tra chính tả tiếng Việt đã được cơng bố như: website VSpell.com của phần mềm sốt lỗi chính tả tiếng Việt; phần mềm Tummo Spell, VcatSpell, Vietspell, Copcon, VicheckSpell, Vietkey Office phần nào đã giải quyết bài tốn phát hiện lỗi chính tả tiếng Việt trong văn bản. Cho đến nay bài tốn kiểm tra chính tả tiếng dân tộc thiểu số ở Việt Nam nĩi chung và tiếng Ê Đê nĩi riêng vẫn chưa được sự quan tâm của các nhà khoa học. Nhằm gĩp phần giải quyết bài tốn kiểm tra chính tả văn bản tiếng Ê Đê ở mức âm tiết, chúng tơi đề xuất giải pháp kết hợp mơ hình cấu tạo âm tiết và kho ngữ vựng (KNV) tiếng Ê Đê trong kiểm tra lỗi chính tả văn bản tiếng Ê Đê. Áp dụng hướng tiếp cận này là dựa theo mơ hình cấu trúc âm tiết tiếng Ê Đê, nhằm xác định các âm tiết tiếng Ê Đê cĩ cấu trúc âm tiết đúng và các âm tiết Ê Đê cĩ cấu trúc âm tiết sai [5]. Sau đĩ dựa vào KNV tiếng Ê Đê đã được xây dựng [6], [7], tiếp tục kiểm tra các âm tiết sau khi đã được kiểm tra mơ hình cấu trúc âm tiết. Các âm tiết tiếng Ê Đê khơng cĩ trong KNV, được thơng báo trên giao diện cho người dùng kiểm tra và chỉnh sửa. Phần tiếp theo bài báo sẽ trình bày giải pháp kiểm tra chính tả âm tiếng tiết Ê Đê dựa vào mơ hình cấu tạo âm tiết tiếng Ê Đê và KNV tiếng Ê Đê giải quyết bài tốn kiểm tra chính tả văn bản tiếng Ê Đê. Cuối cùng là kết quả thực nghiệm và kết luận. 2 Kiểm tra chính tả âm tiết tiếng Ê Đê dựa vào mơ hình cấu tạo âm tiết tiếng Ê Đê 2.1 Cấu tạo âm tiết tiếng Ê Đê Các âm tiết tiếng Ê Đê được thể hiện trên chữ viết thành một khối và được tách rời nhau bằng dấu cách. Mỗi âm tiết bao gồm hai bộ phận chính: phần đầu và phần vần [12], [1], [2]. Cấu tạo âm tiết tiếng Ê Đê được thể hiện trong Hình 1. Phần đầu giữ vai trị phần đầu âm tiết cĩ thể là: một phụ âm, tổ hợp hai phụ âm hay ba phụ âm. Phần vần giữ vai trị vần âm tiết cĩ thể là: một nguyên âm, bán nguyên âm + nguyên âm, nguyên âm + bán nguyên âm, bán nguyên âm + nguyên âm + bán nguyên âm. Nguyên âm ở phần vần cĩ thể tách ra khỏi phụ âm cuối của vần. Âm đệm cĩ chức năng nối phần đầu với nguyên âm chính của vần và gĩp phần biến đổi âm sắc của âm tiết. Hai bán nguyên âm u, i là các âm đệm. Âm chính là yếu tố giữ âm sắc chủ yếu của âm tiết. Giữ vai trị âm chính bao giờ cũng là nguyên âm. Bán nguyên âm theo sau âm chính: các bán nguyên âm (o, u, i) hoặc một tổ hợp âm gồm bán nguyên âm và một phụ âm họng (ĭ, ŏ). Âm cuối cĩ chức năng kết thúc âm tiết, cĩ thể là một trong các phụ âm (p, t, č, k, h, m, n, đ, ng, l, r). Hình 1. Cấu tạo âm tiết tiếng Ê Đê
  3. 184 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Dựa trên 22 kiểu âm tiết khác nhau trong mơ hình cấu tạo âm tiết tiếng Ê Đê [12]. và các trường hợp kiểu âm tiết khơng cĩ phần đầu, chúng tơi đã rút gọn 22 kiểu âm tiết cịn 8 kiểu âm tiết và bổ sung thêm 7 kiểu âm tiết khơng cĩ phần đầu. Trong 8 kiểu âm tiết rút gọn là gộp các trường hợp phần đầu âm tiết là một phụ âm hay tổ hợp hai phụ âm và ba phụ âm thành một trường hợp chung là phần đầu âm tiết. Trong 7 kiểu âm tiết bổ sung cĩ một trường hợp kiểu âm tiết khơng cĩ trong từ điển đĩ là trường hợp nguyên âm + bán nguyên âm. Vì vậy, trong 7 kiểu âm tiết bổ sung chỉ cịn 6 kiểu âm tiết khơng cĩ phần đầu. Tập mơ hình cấu tạo âm tiết tiếng Ê Đê được đề xuất, gồm cĩ 14 mơ hình âm tiết (xem Bảng 1). Bảng 1. Mơ hình âm tiết tiếng Ê Đê Stt Mơ hình âm tiết Ví dụ Stt Mơ hình âm tiết Ví dụ 1 V ĭ (sơ sinh) 8 CbVCe mđơt (ngắn) 2 VCe ung (chồng) 9 CbVS2 hmlei (bơng gịn) 3 VS2Ce ơih (vâng) 10 CbVSCe hmiêt (gĩi ghém) 4 S1V iŭ (bơm) 11 CbS1V thiê (xui khiến) 5 S1VS2 iêu (gọi) 12 CbS1VS2 miêu (con mèo) 6 S1VCe uan (số) 13 CbS1VCe mđhiăr (lặp lại) 7 CbV ƀơ̆ (mặt) 14 CbS1VS2Ce mbhuơih (chuốt) 2.2 Giải pháp kiểm tra chính tả âm tiết tiếng Ê Đê Dựa vào tập 14 mơ hình cấu tạo âm tiết tiếng Ê Đê trong Bảng 1, giải pháp kiểm tra chính tả âm tiết tiếng Ê Đê được đề xuất, thể hiện trong mơ hình kiểm tra chính tả âm tiết tiếng Ê Đê (Hình 2). Hình 2. Mơ hình kiểm tra chính tả âm tiết tiếng Ê Đê
  4. Hồng Thị Mỹ Lệ, Phan Huy Khánh 185 Hoạt động trong mơ hình Đầu tiên, tạo tập mơ hình chuẩn của âm tiết Ê Đê theo cấu trúc âm tiết tiếng Ê Đê trong Bảng 1. Tiếp đến, dựa vào tập dữ liệu của các thành phần trong cấu trúc âm tiết Ê Đê (Cb, S1, V, S2, Ce) chuyển đổi âm tiết tiếng Ê Đê cần kiểm tra sang mơ hình âm tiết cĩ cấu trúc [Cb][S1] [S2][Ce]. Trong đĩ, thành phần trong cặp dấu là bắt buộc phải cĩ trong mơ hình âm tiết tiếng Ê Đê và thành phần trong cặp dấu [ ] là thành phần khơng bắt buộc phải cĩ trong mơ hình âm tiết tiếng Ê Đê. Ví dụ: âm tiết miêu (con mèo) chuyển thành sang mơ hình âm tiết là CbS1VS2. Sau cùng, kiểm tra mơ hình của âm tiết đã chuyển đổi trong tập mơ hình chuẩn của âm tiết tiếng Ê Đê, từ đĩ kết luận được âm tiết kiểm tra cĩ cấu trúc âm tiết đúng hay sai. 2.3 Mơ đun chuyển đổi âm tiết Ê Đê sang mơ hình âm tiết - Đầu vào: Âm tiết tiếng Ê Đê, các hàm tách phụ âm đầu, tách nguyên âm, tách phụ âm cuối, tách âm đệm và bán nguyên âm. Các hàm tách các thành phần trong mơ hình âm tiết. - Đầu ra: Mơ hình âm tiết chuẩn hoặc kí tự dấu sao "*" (kí tự dấu sao "*" là mơ hình khơng thuộc mơ hình âm tiết chuẩn của tiếng Ê Đê). - Phương pháp: Bước 1: Gọi hàm TACH_PAD(âm tiết), kiểm tra trong âm tiết cĩ phụ âm đầu thì gán MH = "Cb" và tách phụ âm đầu ra khỏi âm tiết. Bước 2: Gọi hàm TACH_ADEM(âm tiết), kiểm tra trong âm tiết cĩ âm đệm thì gán MH=MH & "S1" và tách bán nguyên âm ra khỏi âm tiết. Bước 3: Gọi hàm TACH_NA(âm tiết), kiểm tra trong âm tiết cĩ nguyên âm thì gán MH = MH & “V” và tách nguyên âm ra khỏi âm tiết, nếu khơng cĩ nguyên âm thì trả về kí tự dấu sao "*". Bước 4: Gọi hàm TACH_BNA(âm tiết), kiểm tra trong âm tiết cĩ bán nguyên âm đứng sau nguyên âm thì gán MH = MH & "S2" và tách bán nguyên âm ra khỏi âm tiết. Bước 5: Gọi hàm TACH_PAC(âm tiết), kiểm tra trong âm tiết cĩ phụ âm cuối thì gán MH = MH & "Ce" và tách phụ âm cuối ra khỏi âm tiết. Bước 6: Kiểm tra âm tiết sau khi tách, nếu length(âm tiết) = 0 thì trả về MH, cịn khơng thì trả về kí tự dấu sao "*". Bảng 2, minh họa ví dụ các âm tiết tiếng Ê Đê được chuyển sang mơ hình âm tiết. Bảng 2. Ví dụ âm tiết tiếng Ê Đê chuyển sang mơ hình âm tiết Čar Lâm Đồng ară anei mâo 700 anơk bruă dơk đuơm nư bảo hiểm Âm tiết yang ƀuơn, bảo hiểm mdrao mgŭn lehanăn bảo hiểm luič bruă mă, tiếng Ê Đê hŏng ênoh prăk jih jang truh êbeh 55 êklai prăk. [15] Čar(CbVCe) Lâm(CbVCe) Đồng(*) ară(CbV) anei(CbVS2) mâo(CbVS2) 700(*) anơk(CbVCe) bruă(CbS1V) dơk(CbVCe) đuơm(CbS1VCe) nư(CbV) bảo(*) hiểm(*) yang(CbVCe) Âm tiết tiếng Ê Đê chuyển ƀuơn(CbS1VCe), bảo(*) hiểm(*) mdrao(CbVS2) mgŭn(CbVCe) sang mơ hình âm tiết lehanăn(*) bảo(*) hiểm(*) luič(CbS1VCe) bruă(CbS1V) mă(CbV), hŏng(CbVCe) ênoh(CbVCe) prăk(CbVCe) jih(CbVCe) jang(CbVCe) truh(CbVCe) êbeh(CbVCe) 55(*) êklai(CbVS2) prăk(CbVCe).
  5. 186 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” 3 Kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mơ hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê 3.1 Xây dựng kịch bản kiểm tra chính tả văn bản tiếng Ê Đê - Đầu vào: Văn bản tiếng Ê Đê, KNV Ê Đê, tập mơ hình âm tiết tiếng Ê Đê chuẩn. - Đầu ra: Văn bản tiếng Ê Đê được kiểm tra lỗi chính tả. - Phương pháp: Hoạt động theo mơ hình kiểm tra lỗi chính tả văn bản tiếng Ê Đê được trình bày trong Hình 3. Hình 3. Mơ hình kiểm tra chính tả văn bản tiếng Ê Đê dựa vào cấu tạo âm tiết tiếng Ê Đê và kho ngữ vựng tiếng Ê Đê Bước 1: Xử lý loại các nhiễu là sai âm tiết trong văn bản bằng cách lọc các ký tự dư thừa, các ký tự phụ. Bước 2: Tách âm tiết trong văn bản tiếng Ê Đê thành tập các âm tiết tiếng Ê Đê. Trong văn bản tiếng Ê Đê, các âm tiết được phân biệt với nhau qua kí tự trắng. Dựa vào kí tự trắng giữa các âm tiết cho việc thực hiện tách âm tiết.
  6. Hồng Thị Mỹ Lệ, Phan Huy Khánh 187 Bước 3: Kiểm tra chính tả âm tiết tiếng Ê Đê đã được đề xuất để tách tập âm tiết tiếng Ê Đê thành hai nhĩm: tập âm tiết tiếng Ê Đê đúng và tập âm tiết tiếng Ê Đê sai. Tập âm tiết tiếng Ê Đê sai được chuyển sang bước 4. Tập âm tiết tiếng Ê Đê đúng được chuyển sang bước 5. Bước 4: Kiểm tra các âm tiết tiếng Ê Đê sai trong KNV tiếng Ê Đê, xác định được các âm tiết sai chính tả cĩ trong KNV là các từ được vay mượn các ngơn ngữ khác. Các âm tiết xác định sai chính tả khơng cĩ trong KNV sẽ được thơng báo trên giao diện cho người sử dụng thực hiện kiểm tra và chỉnh sửa. Bước 5: Kiểm tra tập âm tiết tiếng Ê Đê đúng trong KNV tiếng Ê Đê. Nếu các âm tiết tiếng Ê Đê đúng khơng cĩ trong KNV, thì thơng báo trên giao diện cho người sử dụng kiểm tra và xử lý. Kết quả, các âm tiết trong văn bản tiếng Ê Đê đã được kiểm tra chính tả âm tiết dựa vào tập 14 mơ hình âm tiết Ê Đê và KNV Ê Đê. 3.2 Triển khai ứng dụng Dựa theo kịch bản giải quyết bài tốn kiểm tra lỗi chính tả văn bản tiếng Ê Đê, nghiên cứu đề xuất triển khai xây dựng ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê theo hướng tiếp cận kết hợp mơ hình cấu tạo âm tiết và KNV tiếng Ê Đê, gồm các chức năng: Kiểm tra lỗi chính tả: thực hiện theo bài tốn kiểm tra lỗi chính tả văn bản tiếng Ê Đê. Sau khi thực hiện chức năng kiểm tra lỗi chính tả, các âm tiết tiếng Ê Đê khơng cĩ trong KNV được đánh dấu cho người sử dụng kiểm tra. Tìm kiếm và thay thế: cho phép người sử dụng sửa các từ sai chính tả trong văn bản. Chức năng này thực hiện tìm kiếm và thay thế các từ trong văn bản theo yêu cầu của người sử dụng. 3.3 Cài đặt thử nghiệm Tiến hành cài đặt thử nghiệm ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê và thu được kết quả thực nghiệm khả quan. Nhằm đảm bảo cho kết quả nghiên cứu và thử nghiệm, dữ liệu của các tệp văn bản thử nghiệm được nhập thủ cơng từ sách học tiếng Ê Đê [13], [14], truyện đọc Ê Đê-Việt [9], báo dân tộc và miền núi. Những tài liệu văn bản này cĩ đặc thù: cấu trúc nhất quán, ngơn từ cụ thể, ngắn gọn và các từ vựng chủ yếu tiếng địa phương Kpă. Ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê đã phát hiện được các lỗi chính tả âm tiết trong các tệp văn bản thử nghiệm (Bảng 3). Các lỗi chính tả âm tiết phát hiện từ bộ cơng cụ, cũng đã được chúng tơi kiểm tra trực tiếp thủ cơng trên các văn bản tài liệu gốc. Kết quả các chính tả phát hiện được gồm các âm tiết là các danh từ riêng và do gõ nhầm phím. Bảng 3. Kết quả thử nghiệm kiểm tra chính tả trên các tệp văn bản tiếng Ê Đê Âm tiết sai được phát hiện Loại văn bản Số âm tiết Danh từ riêng Gõ nhầm Tổng cộng Sách học tiếng Ê Đê 28.164 93 218 359 Truyện đọc Ê Đê Việt 47.952 174 392 613 Báo dân tộc và miền núi 56.004 7.056 569 6.672
  7. 188 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Với kết quả cài đặt thử nghiệm đạt được, cho thấy rắng kết quả kiểm tra chính tả cịn phụ thuộc vào ngữ liệu đầu vào cho quá trình tiền xử lý văn bản như từ điển tên riêng, từ điển viết tắt Quá trình tiền xử lý văn bản cần sử dụng các ngữ liệu này để phân loại âm tiết và lọc nhiễu trước khi thực hiện kiểm tra chính tả âm tiết. Với ngữ liệu đầu vào đầy đủ, hiệu suất khả năng phát hiện lỗi chính tả âm tiết tiếng Ê Đê được nâng cao hơn. 4 Kết luận Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mơ hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê, gĩp phần giải quyết bài tốn kiểm tra chính tả tiếng Ê Đê ở mức âm tiết trong các văn bản tiếng Ê Đê. Triển khai ứng dụng, chúng tơi đã xây dựng được ứng dụng kiểm tra chính tả văn bản tiếng Ê Đê ở mức âm tiết. Ứng dụng này gĩp phần trợ giúp cho giáo viên, học sinh phát hiện và sửa các lỗi chính tả âm tiết trên các văn bản soạn thảo bằng tiếng Ê Đê như các giáo trình, giáo án, các bài học, bài tập Tài liệu tham khảo 1. Đồn Văn Phúc, Ngữ âm Ê Đê, Nxb Khoa học xã hội, Hà Nội (1996). 2. Đồn Văn Phúc, Từ vựng các phương ngữ Ê Đê, Nxb TP Hồ Chí Minh (1998). 3. Ela Kumar, Natural Language Processing, I. K. International Pvt Ltd (2011). 4. Gobinda G. Chowdhury, Natural language processing, Annual Review of Information Science and Technology, 37. pp. 51-89 (2003). 5. Hồng Thị Mỹ Lệ, Phan Huy Khánh, Basing on the Ede syllable models to check Ede syllable misspelling, applying to improve the quality of Ede vocabulary corpus, Proceeding of the International Conference on Advanced Technologies for Communications-ATC, pp. 158-162, HaNoi (2016). 6. Hồng Thị Mỹ Lệ, Phan Huy Khánh, Giải pháp xây dựng kho ngữ vựng song ngữ Việt-Ê Đê dựa trên mơ hình tương tác Việt-Ê Đê, Tạp chí Khoa học Cơng nghệ ĐHĐN, Số 5 (2), pp. 36–40 (2017). 7. Hồng Thị Mỹ Lệ, Phan Huy Khánh, Deploying environment for processing Ede ethnic minority language in Vietnam, Proceeding of the IEEE International Conference on System Science and Engineering (ICSSE), pp. 174-177, HoChiMinh (2017). 8. Hodge, V.J. and Austin, A comparison of standard spell checking algorithms and a novel binary neural approach, Proceeding of the IEEE Transactions on Knowledge and Data Engineering, pp. 1073-1081 (2003). 9. Phan Hồng, Nguyễn Văn Thú, Truyện đọc song ngữ Ê Đê-Việt, tập 1, 2, 3, Nxb Giáo dục Việt Nam (2011). 10. Phan Huy Khánh, Xây dựng văn phạm xử lý văn bản. Ứng dụng cho các ngơn ngữ dân tộc thiểu số Việt Nam, Kỷ yếu Hội thảo Khoa học (Kỷ niệm 30 năm ngày thành lập viện CNTT, Viện KH&CN Việt Nam 1976-2006) (2006). 11. Phan Huy Khanh, A Survey on Vietnamese Language Processing and Multilingual Processing, Proceeding of the NECTEC Conference, Phuket, ThaiLan, pp. 13-14 (2002). 12. Sở Giáo dục & Đào tạo Đăk Lăk, Ngữ Pháp tiếng Ê Đê, Nxb Giáo dục Việt Nam (2011). 13. Y-Hạ Niê Kdăm, Klei ÊĐê Hdruơn 1, 2, 3, Nxb Giáo dục Việt Nam (2013). 14. Y Čang Niê Siêng, Y ČơČ Mlơ, Hdruơm Hră Hriăm Ê Đê, Sở Giáo dục Đăk Lăk (2007). 15. bao-hiem-c1300-171975.aspx