Machine learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân tại các ngân hàng thương mại Việt Nam

pdf 14 trang Gia Huy 24/05/2022 3450
Bạn đang xem tài liệu "Machine learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân tại các ngân hàng thương mại Việt Nam", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfmachine_learning_va_ung_dung_trong_xep_hang_tin_dung_khach_h.pdf

Nội dung text: Machine learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân tại các ngân hàng thương mại Việt Nam

  1. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Machine Learning VÀ ỨNG DỤNG TRONG XẾP HẠNG TÍN DỤNG KHáCH HÀNG Cá NHÂN TẠI CáC NGÂN HÀNG THƯƠNG MẠI VIệT Nam PGS. TS Nguyễn Hữu Tài Trường Đại học Kinh tế Quớc dân NCS. ThS. Đặng Hương Giang1 Trường Đại học Kinh tế Kỹ Thuật Cơng nghiệp Tóm tắt Hệ thớng phần mềm chấm điểm xếp hạng tín dụng (XHTD) khách hàng cá nhân hiện nay của các ngân hàng thương mại (NHTM) mới chỉ dừng lại ở mức đưa dữ liệu, thơng tin khách hàng vào hệ thớng và trả lại kết quả là điểm XHTD của khách hỡ trợ cán bợ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức đợ chính xác cao nhưng vẫn có sai sớ nhất định. Sẽ thế nào nếu mợt khách hàng đến xin vay tại NH này và bị từ chới vì điểm XHTD thấp nhưng được mợt NH khác cho vay và là mợt khách hàng tớt, luơn trả nợ đúng hạn? Hay ngược lại, mợt khách hàng có điểm XHTD tớt được ngân hàng cho vay nhưng sau đó lại trở thành mợt khoản nợ xấu với ngân hàng. Đây là 2 trường hợp thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của các NHTM. Câu hỏi đặt ra là liệu có thể nâng cao đợ chính xác trong đánh giá khách hàng khơng? Làm thế nào để khơng bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những khách hàng khơng thực sự tớt như thể hiện bên ngoài? Hệ thớng Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này. Từ khóa: Machine Learning, ngân hàng thương mại, xếp hạng tín dụng, Big Data Machine Learning applications in personal credit ratings of Vietnam Commercial Banks Abstract With current credit score software system for individual clients of commercial banks, it is only set up to input data and customer’s information into the system and the returned result is customer’s credit score which help loan officer to make lending decision. However, this is a rigid, inflexible evaluation way. Although the current system has high accuracy, it still has errors in measurement. What happens if a customer applies a loan at a bank 1 Email: danghuonggiang1902@gmail.com 87
  2. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" and his/her loan application is rejected because of low credit score but that same person and loan application is approved by other bank and become a customer with good credit and always pay on time. Or in an opposite situation, a customer with good credit score is qualified for a loan but that loan is becoming a bad credit loan for the bank. These are 2 situations showing the failure of current credit score software system at commercial banks. Is there any way to increase the accuracy in evaluating customers? How do we avoid missing potential customers or prevent and get rid of customers that are not as good as they are showing. The Machine Learning system with Big Data base can help solving this problem. Keywords: Machine Learning, Commecial bank, credit ratings, Big Data, Artificial intelligence. 1. lời mở đầu Những năm gần đây, sau khi phải đới mặt với những rủi ro lớn gây tởn thất cho ngân hàng, đặc biệt là rủi ro tín dụng xảy ra với tần suất khá cao, giá trị lớn, các ngân hàng thương mại Việt Nam đã chú trọng nhiều hơn đến hoạt đợng quản trị rủi ro tín dụng trong kinh doanh và dần tiếp cận tới các chuẩn mực quản trị rủi ro và đánh giá tín dụng (Credit Scoring) theo Hiệp ước quớc tế Basel II vào hoạt đợng quản trị rủi ro của mình. Đây được cho là hướng đi đúng của các ngân hàng khi mợt mặt, họ vẫn có thể hút khách hàng qua những sản phẩm, dịch vụ hấp dẫn, mặt khác, họ cần trang bị cho mình những cơng cụ, phương pháp đánh giá khả năng chi, trả của mỡi khách hàng, qua đó dễ dàng đưa ra quyết định cấp vớn. Cùng với sự phát triển của cuợc Cách mạng cơng nghiệp 4.0, những tiến bợ trong khoa học cơng nghệ đã cho phép các đơn vị tài chính, ngân hàng, giảm rủi ro cho vay qua việc phân tích nhiều dữ liệu khác nhau về khách hàng. Bằng các kỹ thuật thớng kê, Machine Learning, các dữ liệu này được phân tích và cơ đọng đưa ra mợt giá trị duy nhất được gọi là điểm tín dụng thể hiện tính rủi ro cho vay. Điểm tín dụng càng cao, mức đợ tín dụng của khách hàng càng lớn. Đánh giá tín dụng có thể áp dụng Trí tuệ nhân tạo (Artificial Intelligence), ựd a trên mơ hình tiên đoán, đánh giá khả năng chi trả món vay của khách hàng: đúng hạn, trễ hạn hoặc khơng đủ khả năng thanh toán. Lợi ích lớn nhất của đánh giá tín dụng là giúp các cơng ty tài chính, ngân hàng đưa ra quyết định nhanh chóng, hiệu quả trong việc chấp nhận hoặc từ chới món vay của khách hàng, tăng hoặc giảm giá trị khoản vay, lãi suất, kỳ hạn. Nhờ tính chính xác và tớc đợ đưa ra quyết định nhanh như vậy, đã khiến cho đánh giá tín dụng trở thành nền tảng của quản trị rủi ro trong các lĩnh vực như ngân hàng, viễn thơng, bảo hiểm và bán lẻ. 88
  3. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2. Tổng quan về Xếp hạng tín dụng kháCh hàng Cá nhân Của NHTM 2.1. XHTD và vai trị của XHTD khách hàng cá nhân XHTD là việc đưa ra nhận định về mức đợ tín dụng đới với trách nhiệm tài chính; hoặc đánh giá mức đợ rủi ro tín dụng phụ thuợc các yếu tớ bao gờm năng lực đáp ứng các cam kết tài chính, khả năng dễ bị vỡ nợ khi các điều kiện kinh doanh thay đởi, ý thức và thiện chí trả nợ của người đi vay. Hệ thớng XHTD của NHTM nhằm cung cấp những dự đoán khả năng xảy ra rủi ro tín dụng có thể được hiểu là sự khác biệt về mặt kinh tế giữa những gì mà người đi vay hứa thanh toán với những gì mà NHTM thực sự nhận được. Khái niệm rủi ro được xét đến ở đây là mợt sự khơng chắc chắn hay mợt tình trạng bất ởn có thể ước đoán được xác suất xảy ra. Khái niệm tín dụng được hiểu là quan hệ chuyển giao quyền sử dụng vớn giữa người cho vay và người đi vay trên nguyên tắc có hoàn trả. Hệ thớng XHTD giúp NHTM quản trị rủi ro tín dụng bằng phương pháp tiên tiến, giúp kiểm soát mức đợ tín nhiệm khách hàng, thiết lập mức lãi suất cho vay phù hợp với dự báo khả năng thất bại của từng nhóm khách hàng. NHTM có thể đánh giá hiệu quả danh mục cho vay thơng qua sự giám sát sự thay đởi dư nợ và phân loại nợ trong từng nhóm khách hàng đã được xếp hạng, qua đó điều chỉnh danh mục theo hướng ưu tiên nguờn lực vào những nhóm khách hàng an toàn. Hệ thớng XHTD là mợt cơng cụ quan trọng để tăng cường tính khách quan, nâng cao chất lượng và hiệu quả của hoạt đợng tín dụng. Mơ hình tính điểm tín dụng là phương pháp lượng hóa mức đợ rủi ro thơng qua đánh giá thang điểm, các chỉ tiêu đánh giá trong những mơ hình chấm điểm được áp dụng khác nhau đới với từng loại khách hàng. Khái niệm hiện đại về XHTD được tập trung vào các nguyên tắc chủ yếu bao gờm phân tích tín nhiệm trên cơ sở ý thức và thiện chí trả nợ của người đi vay và từng khoản vay; đánh giá rủi ro dài hạn dựa trên ảnh hưởng của chu kỳ kinh doanh và xu hướng khả năng trả nợ trong tương lai; đánh giá rủi ro toàn diện và thớng nhất dựa vào hệ thớng ký hiệu xếp hạng. Trong phân tích XHTD cần thiết sử dụng phân tích định tính để bở sung cho những phân tích định lượng. Các dữ liệu định lượng là những quan sát được đo bằng sớ, các quan sát khơng thể đo lường bằng sớ được xếp vào dữ liệu định tính. Các chỉ tiêu phân tích có thể thay đởi phù hợp với sự thay đởi của trình đợ cơng nghệ và yêu cầu quản trị rủi ro. Việc thu thập sớ liệu để đưa vào mơ hình XHTD cần được thực hiện mợt cách khách quan, linh đợng. Sử dụng cùng lúc nhiều nguờn thơng tin để có được cái nhìn toàn diện về tình hình tài chính của khách hàng vay. 89
  4. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2.2. mợt sớ mơ hình XHTD khách hàng cá nhân Nghiên cứu của Stefanie Kleimeier về mơ hình điểm sớ tín dụng cá nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam Stafanie Kleimeier đã tiến hành nghiên cứu chi tiết nguờn sớ liệu được tởng hợp từ các NHTM tại Việt Nam theo hai mươi hai biến sớ bao gờm đợ tuởi, thu nhập, trình đợ học vấn, nghề nghiệp, thời gian cơng tác, tình trạng cư ngụ, giới tính, tình trạng hơn nhân, mục đích vay để xác định mức ảnh hưởng của các biến sớ này đến rủi ro tín dụng và qua đó thiết lập mợt mơ hình điểm sớ tín dụng cá nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam. Nghiên cứu của Stefanie Kleimeier đã xây dựng mơ hình chấm điểm tín dụng cá nhân gờm hai phần là chấm điểm nhân thân và năng lực trả nợ, chấm điểm quan hệ với ngân hàng như trình bày trong Bảng 1. Căn cứ vào tởng điểm đạt được để xếp loại theo mười mức giảm dần từ Aaa đến D như trình bày trong Bảng 2. Tuy nhiên, cơng trình nghiên cứu này khơng đưa ra cách tính điểm cụ thể cho từng chỉ tiêu, để vận dụng được mơ hình địi hỏi các NHTM phải thiết lập thang điểm cho từng chỉ tiêu đánh giá phù hợp với thực trạng và hệ thớng cơ sở dữ liệu cá nhân tại ngân hảng mình. Bảng 1: Ký hiệu XHTD cá nhân theo Stefanie Kleimeier Điểm Xếp hạng Ý nghĩa xếp hạng > 400 Aaa Cho vay tối đa theo đề nghị của người vay 351 - 400 Aa 301 - 350 A 251 - 300 Bbb Cho vay theo tài sản đảm bảo 201 - 250 Bb Cho vay theo tài sản đảm bảo và đánh giá đơn vay vốn 151 - 200 B Yêu cầu đánh giá thận trọng đơn vay vốn và cĩ tài sản đảm bảo đầy đủ 101 - 150 Ccc Từ chối cho vay 51 - 100 Cc 0 - 50 C 0 D Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring for Vietnam’s Retail Banking Market 90
  5. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" B ảng 2: Chỉ tiêu chấm điểm XHTD cá nhân theo mơ hình Stefanie Kleimeier Bước 1: Chấm điểm nhân thân và năng lực trả nợ Tuổi 18 - 25 tuổi 26 - 40 tuổi 40 - 60 tuổi > 60 tuổi Trình độ học vấn Sau đại học Đại học, Cao đẳng Trung học Dưới trung học Nghề nghiệp Chuyên mơn Giúp việc Kinh doanh Hưu trí Thời gian cơng tác 5 năm Thời gian làm cơng việc hiện tại 5 năm Tình trạng cư trú Nhà riêng Nhà thuê Sống cùng gia đình Khác Số người phụ thuộc Độc thân 1 - 3 người 3 - 5 người > 5 người Thu nhập hàng năm 120 triệu đồng Thu nhập gia đình hàng năm 240 triệu đồng Bước 2: Chấm điểm quan hệ với ngân hàng Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Cĩ trễ hạn ít hơn 30 Cĩ trễ hạn trên hàng (ngắn hạn) hạn ngày 30 ngày Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Cĩ trễ hạn trong 2 Cĩ trễ hạn trước 2 hàng (dài hạn) hạn năm gần đây năm gần đây Tổng giá trị khoản vay chưa trả 1 tỷ đồng đồng đồng Các dịch vụ khác đang sử dụng Tiền gửi tiết kiệm Thẻ tín dụng Tiền gửi tiết kiệm và Khơng thẻ tín dụng Số dư bình quân tài khoản tiết 500 triệu đồng kiệm trong năm trước đây Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring for Vietnam’s Retail Banking Market M ơ hình điểm sớ tín dụng cá nhân của FICO Điểm sớ tín dụng (Credit score) cá nhân là mợt phương tiện kiểm soát tín dụng được gán cho mỡi cá nhân tại mợt sớ nước phát triển giúp tở chức tín dụng ước 20 lượng mức rủi ro khi cho vay. Điểm tín dụng càng thấp thì mức rủi ro của nhà cho vay càng cao. Fair Isaac Corp đã xây dựng mơ hình điểm sớ tín dụng FICO thấp nhất là 300 và cao nhất là 850 áp dụng cho cá nhân dựa vào tỷ trọng của 5 chỉ sớ phân tích được trình bày trong Bảng 3. 91
  6. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" B ảng 3: Tỷ trọng các tiêu chí đánh giá trong mơ hình điểm sớ tín dụng FICO Tỷ trọng Tiêu chí đánh giá 35% Lịch sử trả nợ (Payment history): Thời gian trễ hạn càng dài và số tiền trễ hạn càng cao thì điểm số tín dụng càng thấp 30% Dư nợ tại các tổ chức tín dụng (Amount owed): Nợ quá nhiều so với mức cho phép đặc biệt là đối với thẻ tín dụng sẽ làm giảm điểm số tín dụng 15% Độ dài của lịch sử tín dụng (Length of credit history): Thơng tin càng nhiều năm càng đáng tin và điểm số tín dụng sẽ càng cao 10% Số lần vay nợ mới (new credit): Vay nợ thường xuyên bị xem là dấu hiệu cĩ khĩ khăn về tài chính nên điểm số tín dụng càng thấp 10% Các loại tín dụng được sử dụng (Types of credit used): Các loại nợ khác nhau sẽ được tính điểm số tín dụng khác nhau Nguồn Mơ hình điểm sớ tín dụng FICO được áp dụng rợng rãi ở Mỹ do các thơng tin liên quan đến tình trạng tín dụng của mọi người có thể được ngân hàng rà soát dễ dàng qua các cơng ty dữ liệu tín dụng (Credit reporting companies). Cơng ty dữ liệu tín dụng thực hiện ghi nhận và cập nhật thơng tin từ các tở chức tín dụng, 21 phân tích và cho điểm đới với từng người. Theo mơ hình điểm sớ tín dụng của FICO thì người có điểm sớ tín dụng ở mức 700 được xem là tớt, đới với cá nhân có điểm sớ tín dụng thấp hơn 620 sẽ có thể bị ngân hàng e ngại khi xét cho vay. 3. Machine Learning và ứng dụng trong Xếp hạng tín dụng kháCh hàng Cá nhân Của NHTM Với hệ thớng phần mềm chấm điểm XHTD khách hàng cá nhân hiện nay của các NHTM mới chỉ dừng lại ở mức đưa dữ liệu, thơng tin khách hàng vào hệ thớng và trả lại kết quả là điểm XHTD của khách hỡ trợ cán bợ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức đợ chính xác cao nhưng vẫn có sai sớ nhất định. Sẽ thế nào nếu mợt khách hàng đến xin vay tại NH này và bị từ chới vì điểm XHTD thấp nhưng được mợt NH khác cho vay và là mợt khách hàng tớt, luơn trả nợ đúng hạn? Hay ngược lại, mợt khách hàng có điểm XHTD tớt được ngân hàng cho vay nhưng sau đó lại trở thành mợt khoản nợ xấu với ngân hàng. Đây là 2 case thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của các NHTM. Với phần mềm hiện tại có thể giải thích mức đợ dự báo khả năng trả nợ trong tương lai của khách hàng khơng thể chính xác hoàn toàn và ngân hàng chấp nhận sai sớ đó. Câu hỏi đặt ra là liệu có thể nâng cao 92
  7. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" đợ chính xác trong đánh giá khách hàng khơng? Làm thế nào để khơng bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những khách hàng khơng thực sự tớt như thể hiện bên ngoài? Hệ thớng Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này. 3.1. Tổng quan về Trí tuệ nhân tạo, Machine Learning và Big Data Trí tuệ nhân tạo hay trí thơng minh nhân tạo (tiếng Anh: artificial intelligence hay machine intelligence, (AI) là trí tuệ được biểu diễn bởi bất cứ mợt hệ thớng nhân tạo nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích khơng nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của Trí tuệ nhân tạo. Trí thơng minh nhân tạo là mợt trong những ngành trọng yếu của tin học. Trí thơng minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thơng minh của máy móc. AI thể hiện mợt mục tiêu của con người, Machine Learning là mợt phương tiện được kỳ vọng sẽ giúp con người đạt được mục tiêu đó. Và thực tế thì Machine Learning đã mang nhân loại đi rất xa trên quãng đường chinh phục AI. Machine Learning và AI có mới quan hệ chặt chẽ với nhau nhưng khơng hẳn là trùng khớp vì mợt bên là mục tiêu (AI), mợt bên là phương tiện (Machine Learning). Chinh phục AI mặc dù vẫn là mục đích tới thượng của Machine Learning, nhưng hiện tại Machine Learning tập trung vào những mục tiêu ngắn hạn hơn như: (1) Làm cho máy tính có những khả năng nhận thức cơ bản của con người như nghe, nhìn, hiểu được ngơn ngữ, giải toán, lập trình, (2) Hỡ trợ con người trong việc xử lý mợt khới lượng thơng tin khởng lờ mà chúng ta phải đới mặt hàng ngày, hay cịn gọi là Big Data. Machine Learning theo định nghĩa cơ bản là ứng dụng các thuật toán để phân tích cú pháp dữ liệu, học hỏi từ nó, và sau đó thực hiện mợt quyết định hoặc dự đoán về các vấn đề có liên quan. Vì vậy, thay vì code phần mềm bằng cách thức thủ cơng với mợt bợ hướng dẫn cụ thể để hoàn thành mợt nhiệm vụ cụ thể, máy được “đào tạo” bằng cách sử dụng mợt lượng lớn dữ liệu (Big Data) và các thuật toán cho phép nó học cách thực hiện các tác vụ và ngày càng thơng minh hơn. 3.2. Ứng dụng của Machine Learning trong xếp hạng tín dụng khách hàng cá nhân tại các NHTM Việt Nam Nhiều tở chức tài chính sử dụng các mơ hình chấm điểm để giảm rủi ro trong đánh giá tín dụng cũng như trong việc cấp và giám sát tín dụng. Các mơ hình chấm điểm tín 93
  8. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" dụng dựa trên các lý thuyết thớng kê cở điển được sử dụng rợng rãi. Tuy nhiên, các mơ hình này khơng dùng được khi có sớ lượng lớn dữ liệu đầu vào. Điều này ảnh hưởng đến tính chính xác của dự báo dựa trên mơ hình. Theo nhiều nghiên cứu thực nghiệm, các kỹ thuật học máy cùng với các thuật toán khai thác dữ liệu (data mining) khác dựa trên cách tính toán và chuyển đởi kiểu mới hoạt đợng tớt hơn cho mục đích dự báo. Các thuật toán học máy được thiết kế để học từ mợt lượng lớn dữ liệu lịch sử và sau đó tính toán ra kết quả dự báo. Lấy điểm tín dụng cho các khoản vay từ các ngân hàng bán lẻ làm ví dụ. Quá trình kinh doanh điển hình cho việc cung cấp dịch vụ cho vay là: nhận các hờ sơ vay vớn, đánh giá rủi ro tín dụng, ra quyết định về việc cho vay và giám sát việc hoàn trả vớn gớc và lãi. Trong quá trình đó, các vấn đề có thể xảy ra, chẳng hạn như làm thế nào để đẩy nhanh tiến trình thẩm định tín dụng và làm thế nào để giám sát quá trình hoàn trả và thực hiện can thiệp kịp thời khi khả năng vỡ nợ xuất hiện. Để giải quyết hai vấn đề nêu trên, chúng ta có thể xây dựng hai mơ hình trong hai tiến trình khởi tạo vớn vay và tiến trình giám sát. Trong quá trình khởi tạo, đới tượng cần kiểm tra bao gờm tất cả các ứng viên nợp đơn xin vay vớn. Mơ hình có thể được sử dụng để phân tích và học thơng qua dữ liệu lịch sử của các hờ sơ đăng ký vay vớn, qua đó đánh giá liệu mợt ứng viên mới có đủ tin cậy để được vay hay khơng nếu các chỉ tiêu đặc trưng của người nợp đơn được cung cấp, như thu nhập, tình trạng hơn nhân, tuởi, lịch sử tín dụng (chẳng hạn đã từng nợ xấu hay chưa), Trong quá trình giám sát, hệ thớng kiểm tra dữ liệu của người được duyệt vay vớn. Bằng cách sử dụng dữ liệu lịch sử hờ sơ hoàn trả và trạng thái đặc điểm của khách hàng đã hoàn thành toàn bợ quá trình vay vớn, chúng ta có thể đào tạo mơ hình khác để đưa ra dự kiến về việc liệu khách hàng này có xác suất lớn hay khơng khả năng vỡ nợ; bằng cách quan sát hờ sơ hoàn trả của người nợp đơn cho mợt vài giai đoạn hoàn vớn đầu tiên và thay đởi các đặc tính, mơ hình này sẽ giúp tạo ra các điều chỉnh mới dựa trên thơng tin cập nhật. Quy trình tự đợng này hiệu quả hơn về thời gian xử lý cũng như tính chính xác so với cách làm truyền thớng. Tuy nhiên, có rất nhiều thuật toán học máy đang có sẵn, câu hỏi đặt ra là “Thuật toán nào là tớt nhất?”. Khơng có câu trả lời rõ ràng cho câu hỏi này vì tính hiệu quả của các thuật toán phụ thuợc vào dữ liệu và cịn phụ thuợc vào cấu trúc dữ liệu cụ thể. Cách chung để tìm mợt mơ hình thích hợp cho mợt bợ dữ liệu cụ thể hoặc mợt loại tập dữ liệu là áp dụng thuật toán đã được sử dụng rợng rãi và đã được kiểm chứng. 94
  9. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Trong hai tiến trình được nhắc tới ở trên, cả hai trơng giớng nhau nhưng có các mơ hình khác nhau. Tiến trình giám sát hoàn trả trơng tương tự như tiến trình cấp vớn vay, nhưng nó được học và đúc rút ra từ các dữ liệu lịch sử khác nhau, cụ thể là từ khách hàng cũ đã hoàn thành việc trả nợ, bao gờm toàn bợ lịch sử hờ sơ thanh toán và các đặc điểm của khách hàng. Mợt thuật toán học máy khác có thể được ứng dụng để phù hợp tương ứng với các thay đởi của cấu trúc dữ liệu. Ngày nay, các thuật toán Machine Learning hay được sử dụng nhất có thể được phân loại là phân loại đơn hoặc phân loại toàn bợ. Các đại diện của các thuật toán phân loại đơn là CART, Nạve Bayes, SVM, logistics. Việc sửa đởi các bợ phân loại đơn, nhiều mơ hình cùng học để giải quyết cùng mợt vấn đề, được sử dụng rợng rãi, chẳng hạn như Random Forests, CART-Adaboost, Về cơ bản, Machine Learning cũng giớng như việc dạy kiến thức tài chính cho mợt học sinh mới dựa trên sớ liệu lịch sử để thực hiện xác định chất lượng của khoản vay, sau đó bợ máy này sẽ có kinh nghiệm để tự quyết định. Nói rợng hơn, kỹ thuật Machine Learning có thể được sử dụng trong tất cả các loại vấn đề phân loại. Trong lĩnh vực ngân hàng/bảo hiểm, dựa trên Machine Learning có thể phát triển các ứng dụng, bao gờm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics), Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell). Qua nhiều năm, mợt sớ kỹ thuật xây dựng mơ hình khác nhau để thực hiện xếp hạng tín dụng đã phát triển, bao gờm: tham sớ hoặc phi tham sớ (parametric or non-parametric), thớng kê hoặc Machine Learning, các thuật toán giám sát hoặc khơng giám sát, mạng neuron. Các kỹ thuật gần đây gờm các cách tiếp cận rất tinh vi, sử dụng hàng trăm hoặc hàng ngàn mơ hình khác nhau, các cách thức kiểm định mơ hình khác nhau, đa dạng kết hợp rất nhiều thuật toán để mong đạt được kết quả với đợ chính xác cao. Mặc dù đa dạng là vậy, nhưng có mợt kỹ thuật xây dựng mơ hình nởi bật có tên là thẻ điểm tín dụng (Credit Scorecard) được nhiều ngân hàng trên thế giới áp dụng rợng rãi (Các ngân hàng như Commonwealth Bank of Australia, Standard Chartered Bank, cũng đang áp dụng kỹ thuật này). Thường được gọi là thẻ điểm tiêu chuẩn (Standard Scorecard), nó dựa trên Mơ hình hời quy Logistic (Logistic Regression Model). Mơ hình thẻ điểm tín dụng dạng này được xây dựng đơn giản, dễ hiểu, dễ triển khai và chạy nhanh. Kết hợp giữa thớng kê và Machine Learning, đợ chính xác của phương pháp này tương đương với các kỹ thuật tinh vi, điểm sớ đầu ra của nó có thể được áp dụng trực tiếp để đánh giá xác suất nợ xấu, từ đó cung cấp đầu vào cho việc định giá nợ xấu dựa trên rủi ro. Điều này rất quan trọng đới với các bên cho vay cần tuân thủ khuơn khở pháp lý Basel II. 95
  10. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Mơ hình thẻ điểm tín dụng có thể được mơ tả mợt cách đơn giản như sau: nó bao gờm tập hợp các thuợc tính đầu vào từ khách hàng, cụ thể là đặc điểm khách hàng (Ví dụ như tuởi, thu nhập, nghề nghiệp, ), thơng tin tín dụng quá khứ của họ (Ví dụ như thơng tin thu thập được từ Trung tâm thơng tin tín dụng Quớc gia - CIC, cũng như thơng tin tín dụng khác mà ngân hàng nắm được), căn cứ vào tính toán của mơ hình, mỡi thuợc tính sẽ được gán mợt hệ sớ nhất định, tởng của các con sớ này bằng điểm sớ đầu ra. Căn cứ vào điểm sớ đầu ra, người ta có thể xác định được xác suất khách hàng có khả năng phát sinh nợ xấu. Chính nhờ xác suất này mà việc tính được giá trị của rủi ro tín dụng dễ dàng được thực hiện, qua đó ngân hàng nhanh chóng biết được sớ vớn tới thiểu dành cho rủi ro tín dụng phù hợp với tiêu chuẩn Basel II. Như vậy, hệ thớng chấm điểm tín dụng và xếp hạng khách hàng bằng thẻ điểm, được tạo ra bởi cơng nghệ Machine Learning, ứng dụng mơ hình hời qui Logistic, khơng chỉ giúp đánh giá khả năng thực hiện các nghĩa vụ tài chính của mợt khách hàng đới với mợt ngân hàng như việc trả lãi và trả gớc nợ vay khi đến hạn, mà nó cịn là cơng cụ hỡ trợ ngân hàng trong kiểm soát việc tuân thủ Basel II. 4. đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong Xếp hạng tín dụng kháCh hàng Cá nhân Của NHTM 4.1. Quy trình phát triển hệ thớng Machine Learning Các bước phát triển hệ thớng Machine Learning gờm: (1) Requirements; (2) Data; (3) Model; (4) Production. Requirements - Yêu cầu: là giai đoạn tìm hiểu về những gì người dùng đang cần, mong muớn từ hệ thớng Machine Learning. Trong mọi trường hợp, bước này là quan trọng nhất. Càng thêm thời gian dành riêng cho giao tiếp và hiểu biết lẫn nhau giữa các bợ phận, mục tiêu càng rõ ràng và cụ thể càng có nhiều cơ hợi dự án sẽ thành cơng hơn. Data - Sớ liệu: dữ liệu là “kinh nghiệm” cho model (mơ hình). Nếu chúng ta có thể train các model với rất nhiều “kinh nghiệm” có chất lượng tớt, nó sẽ học những phương án tớt hơn để phục vụ mục đích. Đới với các trường hợp trong đó dữ liệu khơng đủ hoặc quá lợn xợn nó cần mợt bước chuẩn bị dữ liệu, hoặc là thu thập thêm dữ liệu, hoặc là mua từ 1 bên thứ 3, hoặc là sử dụng dữ liệu opensource. Trong trường hợp bất kỳ dữ liệu phải được hoàn thiện sạch sẽ và có cấu trúc tớt. Model - Mơ hình: Mục đích của bước này để thớng nhất về sớ liệu chính xác để đánh giá các mơ hình 1 cách khách quan. Mất nhiều ngày làm việc để lựa chọn các thuật toán, train model, kiểm tra nó và lập lại. Đây là phần cớt lõi và quan trọng nhất của quá trình. 96
  11. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Production - Vận hành: Mợt khi các thuật toán được thử nghiệm sẵn sàng để hoạt đợng, có hai cơng việc chính trong bước vận hành: Tích hợp với các thiết lập hiện có. Tự đợng cập nhật các mơ hình. Mơ hình tự đợng cập nhật theo thời gian khi mà lượng data mới liên tục được thêm vào. 4.2. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách hàng cá nhân của NHTM Việc phát triển mợt mơ hình Machine Learning cũng có nhiều bước và sẽ có mợt vài điểm/bước tương đờng so với việc phát triển 1 phần mềm cơng nghệ thơng thường và Machine Learning là mợt nhánh cực kỳ hiện đại của việc phát triển phần mềm. Như trong phần mềm thơng thường, các giải pháp đóng gói sẵn tớn ít chi phí nhưng khơng phù hợp với nhu cầu cụ thể, trong khi ngược lại xây dựng hệ thớng Machine Learning đưa đến các giải pháp có khả năng thiên biến vạn hóa hơn. Dựa trên nghiên cứu về hệ thớng XHTD khách hàng cá nhân hiện tại và mục tiêu của việc ứng dụng Trí tuệ nhân tạo với cơng nghệ Machine Learning và nền tảng Big Data, tác giả đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách hàng cá nhân đới với các NHTM gờm các bước sau: 4.2.1. Xác định mục tiêu của hệ thớng Hệ thớng được xây dựng với các mục tiêu chính sau: 1. Hỡ trợ thẩm định, phê duyệt cấp tín dụng và quản lý rủi ro tín dụng 2. Xây dựng chính sách khách hàng 3. Khắc phục những điểm yếu của hệ thớng XHTD cũ 4. Đáp ứng yêu cầu của NHNN 4.2.2. Xây dựng nền tảng - kho dữ liệu khách hàng (Big Data) Các NHTM cần chuẩn hóa dữ liệu lịch sử tín dụng khách hàng cá nhân tại hệ thớng ngân hàng của mình với các thơng tin khách hàng về các tiêu chí chấm điểm. Dữ liệu càng lớn càng tớt, đề xuất thời gian sớ hóa lưu trữ hờ sơ khách hàng tới thiểu 10 năm. Các trường thơng tin khách hàng được sắp xếp khoa học với các thơng tin: 1. Về nhân thân; 97
  12. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2. Về lịch sử giao dịch với ngân hàng; 3. Về thơng tin khoản vay; 4. Về tài sản đảm bảo; 5. Về lịch sử trả nợ của khách hàng. 4.2.3. Xây dựng mơ hình XHTD khách hàng cá nhân với nền tảng Big Data và cơng nghệ Machine Learning Việc xây dựng mơ hình XHTD khách hàng cá nhân với nền tảng Big Data và cơng nghệ Machine Learning thực hiện qua các bước cơng việc sau: 1. Lựa chọn mơ hình XHTD phù hợp; 2. Lập trình hệ thớng Machine Learning dựa trên mục tiêu đặt ra, mơ hình XHTD được lựa chọn và hệ thớng dữ liệu Big Data sẵn có. 4.2.4. Vận hành thử nghiệm, đánh giá và đưa vào sử dụng chính thức Sử dụng mơ hình mới với cơng nghệ Machine Learning để đánh giá và dự báo kết quả XHTD dựa trên dữ liệu nhóm khách hàng cũ. So sánh kết quả dự báo của cơng nghệ Machine Learning với kết quả thực tế đã xảy ra với nhóm khách hàng này và so sánh với với kết quả dự báo của cơng nghệ XHTD khách hàng cá nhân hiện tại. Thơng qua phân tích tập khách hàng cũ với kho dữ liệu khách hàng có sẵn và so sánh đợ chính xác với cơng nghệ cũ để đánh giá mơ hình XHTD mới cơng nghệ Machine Learning, đánh giá điểm mạnh và yếu của mơ hình để có hướng điều chỉnh mơ hình. Ứng dụng trên tập khách hàng mới và sau đó đánh giá mức đợ chính xác dựa trên kết quả thực tế của khách hàng 5. KếT luận Dự báo chính xác về năng lực trả nợ của khách hàng trong tương lai là quan trọng hàng đầu trong nghiệp vụ tín dụng của ngân hàng thương mại, điều này giúp các nhà cấp tín dụng được kỳ vọng đưa ra quyết định nhanh chóng về việc có nên cho mợt khách hàng vay hay khơng. Hiện nay những quyết định này được đưa ra dựa trên các thơng tin rất hạn chế. Với sự bùng nở của dữ liệu trong mười năm qua, cơ hợi sử dụng dữ liệu này mợt cách thơng minh đã phát triển theo cấp sớ nhân; nhưng những cơ hợi này thường vẫn chưa được thực hiện bởi vì việc giải thích sớ lượng lớn dữ liệu phức tạp vượt quá 98
  13. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" khả năng của con người. Nó đã được chứng minh rằng sử dụng các kỹ thuật Machine Learning cho phép người ta tận dụng tất cả các dữ liệu sẵn có, và do đó, đạt được mợt sự cải thiện đáng kể về khả năng dự đoán trước các mơ hình truyền thớng. Các dự đoán tớt hơn (và đúng thời gian hơn) lần lượt dẫn đến tác đợng tích cực đến quyết định cho vay của ngân hàng đới với khách hàng của mình. Ngoài ra, phương pháp mơ hình hóa này có mợt khía cạnh tự điều chỉnh cho phép nó tự đợng điều chỉnh theo các xu hướng trong dữ liệu đầu vào đơn giản bằng cách đào tạo định kỳ, do đó làm giảm nhu cầu truy cập lại trọng sớ trong các mơ hình truyền thớng và nâng cao mức đợ chính xác của các dự báo. Điều này khơng có nghĩa là vai trị của mợt nhà phân tích là con người sẽ trở nên lỡi thời. Có những trường hợp mà các mơ hình máy tính có thể khơng tính toán và dự báo chính xác được, ví dụ, khi xảy ra các sự kiện bất thường (chiến tranh, thiên tai, biến đợng chính trị, ). Những sự kiện này tạo ra sự gián đoạn khi các mẫu trong quá khứ khơng cịn áp dụng nữa. Do đó, việc tính điểm tín dụng tự đợng dựa trên thuật toán Machine Learning và phân tích của con người có thể bở sung cho nhau trong việc xác định rủi ro tín dụng. Tài liệu THAM Khảo 1. Altman, E.I., 1968. Financial ratios, discriminant analysis and the prediction of cor- porate bankruptcy. The journal of finance, 23(4), pp.589-609. 2. Baesens, B., Van Gestel, T., Viaene, S., Stepanova, M., Suykens, J. and Vanthienen, J., 2003. Benchmarking state-of-the-art classification algorithms for credit scoring, Journal of the operational research society, 54(6), pp.627-635. 3. Chintan Trivedi, Irina Rabinovich and Shyarsh Desai (2017),Applying Machine Learning to Leverage Big Data for Commercial Credit Scoring, The Credit & Finan- cial Management Review, 4. Dinh Thi Huyen Thanh & Stafanie Kleimeier (2006), Credit Scoring for Vietnam’s Retail Banking Market 5. Dominique Guegan, Bertrand Hassani (2017), Maison des Sciences Économiques, 106-112. 6. Fawcett, T., 2006. An introduction to ROC analysis. Pattern recognition letters, 27(8), pp.861-874. 7. Fensterstock, B.A., Salters, J. and Willging, R., 2013. On the Use of Ensemble Models for Credit Evaluation. Credit Financ. Manag. Rev, 1(1), pp.1-14. 99
  14. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CƠNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 8. Friedline, T., Masa, R.D. and Chowa, G.A., 2015. Transforming wealth: Using the in- verse hyperbolic sine (IHS) and splines to predict youth’s math achievement. Social science research, 49, pp.264-287. 9. Huang, C.L., Chen, M.C. and Wang, C.J., 2007. Credit scoring with a data min- ing approach based on support vector machines. Expert systems with applications, 33(4), pp.847-856. 10. Lo, K. and Lys, T., 2000. The Ohlson model: contribution to valuation theory, limita- tions, and empirical applications. Journal of Accounting, Auditing & Finance, 15(3), pp.337-367. 11. Philipp Kallerhoff, PhD, Jumiya (2017), Big Data and Credit Unions: Machine Learning in Member Transactions, Filene Research Institute. 12. Piotroski, J.D., 2000. Value investing: The use of historical financial statement infor- mation to separate winners from losers. Journal of Accounting Research, pp.1-41. 13. Rasmussen, C.E. and Williams, C.K., 2006. Gaussian processes for machine learning (Vol. 1). Cambridge: MIT press. 14. West, D., 2000. Neural network credit scoring models. Computers & Operations Research, 27(11), pp.1131- 1152 Ngày gửi bài: 19/5/2018 Ngày gửi lại bài: 21/5/2018 Ngày duyệt đăng: 02/06/2018 100