Một phương pháp phân luồng người khám bệnh dựa trên học sâu và xử lý ngôn ngữ tự nhiên

5 trang Gia Huy 6900

Download

Bạn đang xem tài liệu "Một phương pháp phân luồng người khám bệnh dựa trên học sâu và xử lý ngôn ngữ tự nhiên", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

mot_phuong_phap_phan_luong_nguoi_kham_benh_dua_tren_hoc_sau.pdf

Nội dung text: Một phương pháp phân luồng người khám bệnh dựa trên học sâu và xử lý ngôn ngữ tự nhiên

Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) Một Phương Pháp Phân Luồng Người Khám Bệnh Dựa Trên Học Sâu Và Xử Lý Ngôn Ngữ Tự Nhiên Nguyễn Ngọc Duy, Huynh Trung Trụ, Huynh Thị Tuyết Trinh, Lưu Ngọc Diệp Khoa Công Nghệ Thông Tin II, Học Viện Công Nghệ Bưu Chính Viễn Thông cơ sơ tai TP.HCM Email: duynn, truht, trinhhuynh, luungocdiep@ptithcm.edu.vn Abstract —Ứng dụng trí tuệ nhân tạo trong chẩn đoán ban Trong phần tiếp theo của bài báo này, các tác giả sẽ trình đầu tốt sẽ giúp quá trình khám và chữa bệnh. Nếu chẩn đoán ban bày một số công trình liên quan về học sâu và về y tế ơ mục 2. đầu hiệu quả sẽ xác định được sớm trường hợp khám có dấu hiệu Mục 3 sẽ trình bày về phương pháp thực hiện từ quá trình bệnh nặng thì việc chữa trị sẽ gặp thuận lợi. Ngược lại, người chuyển đổi và xử lý dữ liệu đến các cấu hình của một số giải khám sẽ không còn lo lắng hoặc chỉ cần khám tại các cơ sở ý tế thuật học sâu dùng trong thử nghiệm của bài báo. Mục 4 các nhỏ tại địa phương, tránh được sự lãng phí và cũng góp phần giảm tải cho bệnh viện trung tâm. Bài báo này đề xuất phương tác giả sẽ trình bày các kết quả đat được và các ý kiến thảo pháp dùng các giải thuật học sâu cho việc chẩn đoán ban đầu luận. Các tác giả sẽ trình bày những ý kiến kết quận và hướng trong thử nghiệm nhận định một số bệnh. Phương pháp mà bài phát triển tiếp dựa trên kết quả đat được từ bài báo này trong báo đề xuất ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên đối mục 5. với tiếng Việt trong việc xây dựng kho dữ liệu huấn luyện hệ thống học sâu từ các bệnh án cũng như dựa trên sự tư vấn của II. CAĆ CÔNG TRINH̀ LIÊN QUAN bác sĩ chuyên môn. Kết quả thử nghiệm với mô hình Ở công trình [10] các tác giả giới thiệu một mô hinh học Convolutional Neural Network (CNN), Long short-term memory sâu phân loai tre em khỏe manh hoặc có khả năng măc chứng (LSTM), Bi-LSTM, CNN-Bi-LSTM và CNN-LSTM kết hợp là khá tốt khi nhận định các loại bệnh viêm phôi, tiêu chảy, da liễu. tự ky. Mô hình các tác giả sử dụng là CNN kết hợp với mô hinh MobileNet. Kết quả đat được rất tốt, độ chính xác đat Keywords- Corpus, Deep Learning, classification, CNN, 94,6%. Trong khi đó, Amjad Rehman [11] và các cộng sự Convolution Neural Network, Healthcare, Medicine, Physical phân loai bệnh bach cầu mãn tính dòng tế bào lympho sử dụng exam, Examination. mô CNN phân loai ảnh chụp tế bào đat độ chính xác 97.78%. Tiếp theo trong bài báo [12] tác giả sử dụng mô hinh học sâu I. GIỚI THIỆU trong chân đoán ky sinh trung đường ruột ơ người, tác giả sử dụng mang nơ-ron tính chập ConvNet với độ chính xác Ứng dụng các kỹ thuật trí tuệ nhân tao trong lĩnh vựa y tế 96.49%. Trong bài báo [13] tác giả phát hiện và chân đoán sâu đã được quan tâm từ rất lâu. Nhu cầu xây dựng một hệ thống răng bằng cách sử dụng thuật toán mang nơ-ron CNNs dựa hỗ trợ chăm sóc sức khỏe hoặc thăm khám bệnh tự động là trên mô hinh học sâu, với độ chính xác 95%. mong muốn rất lớn của mọi người. Với sự phát triển của khoa Các công trên đat được độ chính xác rất cao khi giải quyết học máy tính, và nhất là sự phát triển của các phương pháp bài toán xác định một loai bênh cụ thể. học sâu, những công trình nghiên cứu nhằm đáp ứng nhu cầu Các giải thuật học sâu trong lĩnh vực xử lý ngôn ngữ tự này càng trơ nên được quan tâm hơn và cũng càng có cơ sơ nhiên tiếng Việt cũng được dùng trong nhiều công trình, nhất thành công hơn. Đã có nhiều công trình nghiên cứu về lĩnh là cho lĩnh vực phân loai ý kiến đánh giá sản phâm như [14] vực này trên thế giới [1]. Các công trình này nghiên cứu ứng và [15]. Kết quả đat được ơ các công trình này cũng khá tốt, dụng từ nhiều lĩnh vực khác nhau của khoa học máy tính như độ chính xác trên 80%. Ở công trình [14] các tác giả đã thử thị giác máy tính, nhận dang giọng nói cũng như xử lý ngôn nghiệm phân loai ý kiến cho tiếng Anh và tiếng Việt để nhận ngữ tự nhiên cho tiếng Anh. Những công trình xử lý bài toán thấy các giải thuật học sâu không phụ thuộc vào ngôn ngữ chuyên sâu theo chuyên ngành hẹp như [5] và [6] đòi hỏi công trong lĩnh vực xử lý ngôn ngự tự nhiên. Vấn đề sử dụng các sức rất lớn và cũng thu được những kết quả rất tốt. giải thuật học sâu cho lĩnh vực xử lý ngôn ngữ tự nhiên là xây Quá trình thu thập kiến thức và học để hiểu biết từ dữ liệu y dựng kho ngữ liệu đầy đủ và chất lượng để các giải thuật học sinh phức tap, nhiều chiều và không đồng nhất vẫn là một sâu học tốt tri thức của lĩnh vực cần xử lý. thách thức quan trọng trong việc xây dựng kho dữ liệu để huấn luyện các hệ thống học sâu. Nhiều loai dữ liệu khác nhau đã và III. PHƯƠNG PHÁP TIÊṔ CÂṆ đang xuất hiện trong nghiên cứu y sinh hiện đai, bao gồm hồ sơ Các bệnh án là tập hợp của nhiều yếu tố như số đo huyết áp, sức khỏe điện tử, hình ảnh, dữ liệu cảm biến Đặc điểm thân nhiệt, hoặc các chỉ số trong xét nghiệm là những giá chung của các loai dữ liệu này là phức tap, không đồng nhất, trị có y nghĩa quan trọng thuộc về chuyên ngành khoa học sức chú thích kém và cơ bản là không có cấu trúc. Việc xử lý các khỏe. Đó là các giá trị định lượng nên nếu chỉ xem các giá trị dữ liệu này đòi hỏi nền tảng kiến thức miền đầy đủ và sâu. này như một từ hoặc cụm từ thông thường sẽ dẫn đến chân ISBN: 978-604-80-5076-4 291
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) đoán hoặc nhận định sai trong khám chữa bệnh. Tuy nhiên, nhiều lĩnh vực. Mô hinh CNN như hinh 1 có các layer liên kết bên canh những giá trị định lượng của kết quả trong khám cận được với nhau thông qua cơ chế tích chập (convolution). Dữ lâm sàng có tính chuyên môn sâu về y khoa, có những thông liệu đầu vào của layer tiếp theo là kết quả tích chập từ layer số của quá trình khám tổng quát như chiều cao, cân nặng, trước đó. Nhờ đó, ta có được các kết nối cục bộ trong quá trình huyết áp không đòi độ chính xác cao. Đây là các thông số tính toán. Sự kết hợp cục bộ cho chúng ta khả năng biểu diễn cơ bản góp phần vào nhận định phân loai bệnh trong giai đoan thông tin từ mức độ thấp đến mức độ cao và trừu tượng hơn đầu của quá trình khám chữa bệnh. Trong bài báo này, các tác thông qua tích chập (convolution) từ các bộ lọc. giả trình bày một phương pháp tiếp cận biến đổi và xử lý các Việc chuyển các từ trong câu thành ma trận trọng số trong thông tin ban đầu này thành cơ sơ tri thức nhằm khai thác khả bài toán xử lý ngôn ngữ tự nhiên dùng ơ tầng Word embedding năng của các hệ thống học sâu trong xử lý ngôn ngữ tự nhiên có thể được tao từ công cụ word2vec hay Glove. Tầng này là cho mục đích hỗ trợ phân loai một số bệnh ơ giai đoan đầu của một tập các ma trận kích thước n x k. Trong đó, n là số từ trong quá trình khám chữa bệnh. câu, mỗi từ biểu diễn một vector k chiều. Lớp này biểu diễn mỗi từ trong câu được chọn thành một vector từ. Đặt l R là 3.1 Xây dựng kho dữ liệu (l) kx|D| chiều dài câu, |D| R là kích thước từ vựng và W R là ma trận nhúng các vector từ k chiều. Từ thứ i trong câu được 3.1.1 Tiền xử lý dư liêu chuyển thành một vector k chiều wi bằng công thức (1): (l) Dữ liệu thử nghiệm của bài báo này được các tác giả thu wi = W xi (1) thập từ các bệnh án ơ một số bệnh viện và phòng khám tư trong đó xi là một biểu diễn one-hot vector cho từ thứ i. nhân. Quá trình xử lý tao kho dữ liệu được thực hiện theo các bước: Bước 1: Rút trích dữ liệu theo từng ca khám và kết luận của các bác sỹ. Bước 2: Tao văn bản cho mỗi ca khám bệnh. Mỗi ca tao thành một văn bản. Mỗi câu trong văn bản là một thông tin theo khía canh như tiền sử bệnh, chân đoán, kết luận Ví dụ 1: “Cao 163 cm, nặng 42 kg, huyết áp Đã bị lao cách đây 8 Word Convolutional Pooling fully- năm. Khả năng bị ” embedding Layer Layer connected Ví dụ 2: Layer layer Cao 152 cm, nặng 54 kg, hay đau nhức cơ thể Khả năng Hình 1: Mô hình Convolutional Neural Network [2] bị Sau quá trình xử ly như trên tác giả thu được một kho dữ Tầng Convolutional sử dụng phép tích chập để xử lý dữ liệu liệu với số liệu như bảng 3.1. bằng cách cho cửa sổ trượt (slide windows) có kích thước cố Bảng 3.1: Số liệu kho dữ liệu bệnh án bằng tiếng việt định (còn gọi là kernel) trên ma trận dữ liệu đầu vào để thu được kết quả đã được tinh chỉnh. Tầng Pooling tổng hợp các Đặc tính Số lượng vector kết quả của tầng Convolution và giữ lai những vector Số bệnh nhân 4103 quan trọng nhất. Tầng full-connected là một mang nơ-ron Số văn bản 8697 truyền thống sử dụng những vector còn lai ơ tầng Pooling làm Số loai nhãn (loai bệnh) 3 đầu vào để tao ra kết quả cuối cùng thông qua quá trình huấn luyện. 3.1.2 Tao dư liêu cho mô hinh hoc sâu Dữ liệu văn bản được chuyển đổi về dang ma trận trọng số 3.2.2 LSTM để sử dụng huấn luyện các mô hình học sâu. Bài báo này sử Mang LSTM [7] thuộc nhóm phương pháp học sâu hồi quy dụng công cụ word2vec [8] cho việc chuyển đổi này. (Recurrent Neural Networks – RNN). Mô hình mang LSTM Word2vec chứa mô hình Continuous Bag-of-Words (CBOW) như ơ hình 2. LSTM có các kết nối giữa các neural tao thành và mô hình Skip-Gram [9]. Mô hình CBOW dự đoán từ mục dang có hướng có tính chu ky và có khả năng học các phụ tiêu (ví dụ: từ “mặc” có thể tìm ra khi dùng từ “kệ” nếu trong thuộc dài. Tất cả các RNN có dang một chuỗi các module lặp kho ngữ liệu hai từ này có mối quan hệ) từ các từ cung ngữ lai. Trong các RNN tiêu chuân, module lặp này thường có cấu cảnh với nó. Trong khi đó, mô hình Skip-Gram thực hiện trúc đơn giản. Tuy nhiên, module lặp trong LSTM thì phức tap ngược lai, dự đoán các từ ngữ cảnh được đưa ra từ mục tiêu. hơn. Thay vì có một tầng neural thì có bốn lớp tương tác theo 3.2 Sơ lược về phương pháp học sâu CNN và LSTM một cách đặc biệt. Bên canh đó, nó có hai trang thái: trang thái ân và trang thái tế bào (cell state). Hình 2 minh họa mô hình LSTM. 3.2.1 CNN Tai thời điểm bước t, LSTM trước tiên quyết định thông tin CNN là một trong những mô hình học sâu tiên tiến rất phổ nào sẽ được đổ vào trang thái tế bào. Quyết định này được đưa biến. Mô hình này giúp cho chúng ta xây dựng được những hệ ra bơi một hàm sigmoid hoặc tầng , được gọi là cổng quên thống xử lý thông minh, cho kết quả có độ chính xác cao trong (forget gate). Hàm lấy ℎ t-1 (đầu ra từ lớp ân trước đó) và xt ISBN: 978-604-80-5076-4 292
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) (đầu vào hiện tai) và xuất ra một số trong [0, 1], trong đó 1 có trong một chuỗi, chúng ta có thể cần xem xét cả bối cảnh bên nghĩa là giư hoàn toàn và 0 có nghĩa là bỏ qua hoàn toàn trong trái và bên phải. công thức (2) f f ft = (W xt + U ht-1) (2) Sau đó LSTM quyết định những thông tin mới sẽ lưu trữ trong trang thái tế bào. Việc này gồm hai bước. Đầu tiên, một hàm hay lớp sigmoid, được gọi là cổng đầu vào như ơ công thức (3), quyết định giá trị nào LSTM sẽ cập nhật. Tiếp theo, một hàm hoặc lớp tanh tao ra một vectơ các giá trị ứng viên ~ mới C . Hình 3: Mô hình Bidirectional RNN [7] Một BRNN bao gồm hai bộ RNN ngược hướng xếp chồng lên nhau. Một bộ xử ly đầu vào theo thứ tự ban đầu và một bộ RNN xử lý chuỗi đầu vào đảo ngược. Đầu ra sau đó được tính toán dựa trên trang thái ân của cả hai bộ RNN. Hình 2: Mô hình Long Short Term Memory network [7] IV. IV. THỬ NGHIỆM i i it = (W xt + U ht-1) (3) 4.1 Cấu hình các mô hình học sâu dùng cho thử nghiệm ~ Các thông số dùng trong thử nghiệm của các giải thuật sâu CWxUhtanh(nn ) (4) tt1 của bài báo được trình bày 4.1, 4.2, 4.3, 4.4, 4.5. Đây là các ~ thông số cho kết quả tốt nhất trong các thử nghiệm của bài báo CfCttt 1 iC tt (5) này. Tiếp theo, cập nhật trang thái tế bào cũ Ct-1 vào trang thái tế 4.1.1. LSTM bào mới Ct như công thức (5). Cổng quên ft có thể kiểm soát độ Dựa trên thư viện Keras. Các thông số được chọn để thử dốc đi qua nó và cho phép xóa và cập nhật bộ nhớ một cách nghiệm như liệt kê ơ bảng 4.1 tường minh, giúp giảm bớt sự hao hụt của độ dốc hoặc làm bùng nổ về độ dốc trong RNN tiêu chuân. Bảng 4.1: Thông số thử nghiệm mô hinh LSTM LSTM quyết định đầu ra dựa trên trang thái tế bào. Trước Đặc tính Giá trị tiên, LSTM chay một lớp sigmoid, quyết định phần nào của Số neural ân 100, 200 trang thái tế bào sẽ xuất ra trong công thức (6), được gọi là ngõ dropout 0.2 ra (output gate). Sau đó, LSTM đặt trang thái tế bào vào hàm Recurrent_dropout 0.2 tanh và nhân nó với đầu ra của cổng sigmoid, để LSTM chỉ Epoch 500 xuất ra các phần mà nó quyết định như công thức (7). Kích thước word embedding 300 00 Hàm activation sigmoid oWxUhttt ()1 (6) 4.1.2. CNN ho *tanh( C ) (7) tt t Dựa trên thư viện Tensorflow. Các thông số được chọn để thử nghiệm như liệt kê ơ bảng 4.2 3.2.3 Bidirectional LSTM (Bi_LSTM) Hình 4.2: Thông số thử nghiệm mô hinh CNN Mô hình BRNN [7] dựa trên y tương rằng đầu ra tai mỗi thời Đặc tính Giá trị điểm có thể không chỉ phụ thuộc vào các yếu tố trước đó trong Kích thước embedding word 300 chuỗi, mà còn phụ thuộc vào các yếu tố tiếp theo trong chuỗi Số bộ lọc 300 được trình ơ hình 3. Chẳng han, để dự đoán một từ còn thiếu Dropout 0.5 ISBN: 978-604-80-5076-4 293
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) Epoch 500 Bảng 4.6: Độ chính xác (accuracy - %) tốt nhất của mô hình trong L2 0.0008 các thử nghiệm Hàm activation Sigmoid Phương pháp Da liễu Tiêu hóa Phôi Tông Kích thước bộ lọc 3,4,5 CNN 61.57 67.43 66.99 65.42 LSTM 60.64 67.57 66.66 65.06 Bi_LSTM 60.87 66.39 69.03 66.84 4.1.3. Bi-LSTM CNN-Bi_LSTM 65.31 69.85 70.74 69.57 Dựa trên thư viện Keras. Các thông số được chọn để thử CNN-LSTM 68.73 73.60 71.64 71.38 nghiệm như liệt kê ơ bảng 4.3 Bảng 4.3: Thông số thử nghiệm mô hinh Bi-LSTM Từ kết thu được về độ chính xác của các phương dung trong thử nghiệm của bài báo này có thể rút ra một số nhận xét Đặc tính Giá trị sau: Số neural ân 100, 200 - Sự kết hợp bộ CNN và bộ LSTM tao được sự cải thiện dropout 0.2 đáng kể về hiệu năng khi so với khi thực thi riêng từng giải Recurrent_dropout 0.2 thuật. Tương tự, khi kết hợp bộ CNN và bộ Bi-LSTM cũng đat Epoch 500 độ chính xác tốt hơn khi để các bộ học sâu này thực thi riêng, Kích thước word embedding 300 tuy không tốt như khi kết hợp CNN và LSTM. Mức chênh Hàm activation sigmoid lệch cao nhất lên đến trên 8% đối với loai nhãn bệnh da liễu. - Mặc dù là sự kết hợp hai bộ LSTM theo hai chiều khác nhau nhưng bộ Bi-LSTM không có được kết quả tốt hơn 4.1.4. CNN – LSTM kết hợp LSTM trong trường hợp thử nghiệm dữ liệu của bài báo này. Dựa trên thư viện Keras. Các thông số được chọn để thử - Đối với kho dữ liệu thử nghệm trong bài báo này, kết nghiệm như liệt kê ơ bảng 4.4. quả thu được về độ chính xác của phương pháp CNN và Bảng 4.4: Thông số thử nghiệm mô hinh CNN + LSTM LSTM khá tương đương nhau trong khả năng phân biệt cả ba nhãn bệnh cũng như trong đánh giá chung. Đặc tính Giá trị - Khả năng nhận dang đối với nhãn bệnh da liễu có kết Epoch 500 quả thấp nhất. Điều này có thể lý giải là do các triệu chứng về LSTM da là rất đa dang, khó phân biệt nếu không có sự hỗ trợ của Số bộ lọc 200 quá trình khám cận lâm sàng. Hàm activation softmax - Các kết quả đat được về độ chính xác trong xác định CNN các loai bệnh trong thử nghiệm ơ bài báo này tuy không cao, Kích thước embedding word nhưng có thể nói phương pháp này có nhiều triển vọng về việc Số bộ lọc 300 ứng dụng các phương pháp học sâu vào việc hỗ trợ phân loai Kích thước bộ lọc 3 ban đầu các bệnh nhân vì sự đơn giản và dễ ứng. Pool size 2 Hàm activation sigmoid V. KẾT LUẬN Kết quả thu được của bài báo này cho thấy phương pháp 4.1.5. CNN – Bi-LSTM kết hợp tiếp cận của bài báo là khá triển vọng. Mô hình nhận định Dựa trên thư viện Keras. Các thông số được chọn để thử bệnh của bài báo có ưu điểm là linh hoat, dễ xây dựng ứng nghiệm như liệt kê ơ bảng 4.5. dụng đối với các cơ sơ y tế; dễ tiếp cận và dễ sử dụng với Bảng 4.5: Thông số thử nghiệm mô hinh CNN + Bi-LSTM nhiều đối tượng người bệnh nếu triển khai dưới dang website Đặc tính Giá trị hoặc ứng dụng di động. Tuy vậy, để có thể đưa vào ứng dụng Epoch 500 thực tế, thời gian tới các tác giả sẽ thu thập thêm dữ liệu, nghiên cứu phân tích bệnh án theo hướng phân loai triệu LSTM chứng cho nhiều loai bệnh hơn và thử nghiệm với nhiều mô Số bộ lọc 200 hình học sâu khác. Hàm activation softmax CNN TÀI LIỆU THAM KHẢO Kích thước embedding word [1] MIOTTO, Riccardo, et al. Deep learning for healthcare: review, Số bộ lọc 300 opportunities and challenges. Briefings in bioinformatics, vol 19, isuue Kích thước bộ lọc 3 6, 2018, pages 1236-1246. Pool size 2 [2] Yoon Kim, “Convolutional neural networks for sentence classification”, in Proceedings of the 2014 Conference on Empirical Methods in Natural Hàm activation sigmoid Language Processing, EMNLP 2014, pages 1746-1751. [3] FAUST, Oliver, et al. Deep learning for healthcare applications based on 4.2 Kết quả thử nghiệm physiological signals: A review. Computer methods and programs in Kết quả thử nghiệm trên bộ dữ liệu trình bày ơ phần 3.1 biomedicine, vol 161, 2018, pages 1-13. được trình bày trong bảng 4.6. [4] BEAM, Andrew L.; KOHANE, Isaac S. “Big data and machine learning in health care”. Jama, vol 319, isuue 13, 2018, pages 1317-1318. ISBN: 978-604-80-5076-4 294
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) [5] WANG, Dayong, et al. Deep learning for identifying metastatic breast [12] A.Z. Peixinho, S.B. Martins, J.E. Vargas and A.X. Falc ̃ao, J.F. Gomes, cancer. arXiv preprint arXiv:1606.05718, 2016. C.T.N. Suzuki, “Diagnosis of Human Intestinal Parasites by Deep [6] LIU, Saifeng, et al. Prostate cancer diagnosis using deep learning with Learning”. In: Computational Vision and Medical Image Processing V: 3D multiparametric MRI. In: Medical imaging 2017: computer-aided Proceedings of the 5th Eccomas Thematic Conference on Computational diagnosis. International Society for Optics and Photonics, 2017. pages Vision and Medical Image Processing (VipIMAGE 2015, Tenerife, 1013428. Spain. 2015. pages 107. [7] Lei Zhang, Suai Wang, and Bing Liu (2018), “Deep learning for [13] Jae-Hong Leea, Do-Hyung Kima, Seong-Nyum Jeonga, Seong-Ho sentiment analysis: A survey”, Wiley Interdisciplinary Reviews: Data Choib, “Detection and diagnosis of dental caries using a deep learning- Mining and Knowledge Discovery, Vol 8, Issue 4, 2018, page e1253. based convolutional neural network algorithm”. Journal of dentistry, vol 77, 2018, pages 106-111. [8] Xin Rong, “word2vec parameter learning explained”, In arXiv preprint arXiv:1411.2738, 2014. [14] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “Preprocessing Improves CNN and LSTM in Aspect-Based Sentiment Analysis for [9] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, and Jeffrey Vietnamese”. In Proceedings of Fifth International Congress on Dean, “Distributed representations of words and phrases and their Information and Communication Technology. ICICT 2020. Springer, compositionality”. In Proceedings of the Annual Conference on Singapore, 2020. pages. 175-185. Advances in Neural Information Processing Systems (NIPS 2013), 2013. [15] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “A Data Preprocessing [10] Madison Beary, Alex Hadsell, Ryan Messersmith, Mohammad-Parsa Method to Classify and Summarize Aspect-Based Opinions using Deep Hosseini, “Diagnosis of Autism in Children using Facial Analysis and Learning”, Asian Conference on Intelligent Information and Database Deep Learning”. arXiv preprint arXiv:2008.02890, 2020. Systems. Springer, Cham, 2019. pages 115-127 [11] Amjad Rehman, Naveed Abbas, Tanzila Saba, Syed Ijaz ur Rahman, Zahid Mehmood, HoshangKolivand. “Classification of acute lymphoblastic leukemia using deep learning". Microscopy Research and Technique, cil 81, isuue 11, 2018, pages 1310-1317. ISBN: 978-604-80-5076-4 295