Ứng dụng khoa học dữ liệu trong ngân hàng tài chính
Bạn đang xem tài liệu "Ứng dụng khoa học dữ liệu trong ngân hàng tài chính", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- ung_dung_khoa_hoc_du_lieu_trong_ngan_hang_tai_chinh.pdf
Nội dung text: Ứng dụng khoa học dữ liệu trong ngân hàng tài chính
- 179 ỨNG DỤNG KHOA HỌC DỮ LIỆU TRONG NGÂN HÀNG TÀI CHÍNH ThS. Cao Thị Thu Hương, ThS. Tống Minh Ngọc Viện Công nghệ thông tin và Kinh tế số, Trường Đại học Kinh tế Quốc dân TÓM TẮT Khoa học dữ liệu (KHDL) đang được ứng dụng vào rất nhiều lĩnh vực của nền kinh tế số, tạo những chuyển biến ấn tượng, giúp tăng hiệu quả và năng suất của doanh nghiệp. Bài viết này đi sâu vào phân tích những ứng dụng của KHDL trong một số ngành như ngân hàng, tài chính. Từ khóa: Khoa học dữ liệu, Kinh tế số, Tài chính, Ngân hàng 1. GIỚI THIỆU Kể từ đầu thập niên 2000, số hóa và kinh tế số đã phát triển với tốc độ cao và làm thay đổi nhanh mọi mặt của đời sống xã hội. Một mặt, kinh tế số là một khu vực kinh tế đóng góp rất đáng kể vào tổng thu nhập quốc dân của nhiều nước với các ước tính khác nhau. Mặt khác, kinh tế số tạo ra các loại hình kinh doanh đa dạng và cải tiến không ngừng, đồng thời tạo thêm các loại hình việc làm hoàn toàn mới, thu hút được đông đảo nguồn lao động trong xã hội. Hơn nữa, kinh tế số còn cung cấp các giá trị bổ sung cho người tiêu dùng và xã hội, làm phong phú thêm đời sống tinh thần của con người. Kinh tế số đã trở thành xu thế tất yếu đối với mọi quốc gia trên thế giới (Hà Quang Thụy, 2020). Sự xuất hiện của Internet vạn vật (Internet of Things - IoT) đánh dấu sự phát triển vượt bậc việc sử dụng dữ liệu vào hoạt động kinh doanh và mọi hoạt động khác của doanh nghiệp. Sự tăng trưởng với tốc độ cao dữ liệu số, một mặt, là nguồn tài nguyên quý giá giúp doanh nghiệp hiểu biết sâu sắc hơn không chỉ khách hàng và thị trường của mình mà còn đối với nhân viên và quy trình nội tại trong doanh nghiệp, và hơn thế nữa, dữ liệu số còn trở thành một tài sản “bán được” để tăng doanh thu cho doanh nghiệp (Hà Quang Thụy, 2020). Ngày nay, hầu hết các công ty và tập đoàn lớn đều đã có những đội ngũ, chuyên gia phân tích dữ liệu của riêng họ. Một ví dụ tiêu biểu là đội ngũ KHDL của các hãng công nghệ lớn như: Google, Amazon, Facebook, Microsoft, Youtube, LinkedIn, Instagram, Twitter Họ không ngừng tham gia vào quá trình thu thập, phân tích, dự đoán các tri thức có từ dữ liệu để hỗ trợ cho doanh nghiệp của mình. Sự thành công của các công ty và tổ chức trên thế giới ngày nay đều ít nhiều có liên quan tới KHDL. KHDL đang lan rộng ảnh hưởng của nó và mang lại ý nghĩa ngày càng quan trọng hơn đối với đời sống con người nói chung và với nền kinh tế số nói riêng.
- 180 2. TỔNG QUAN VỀ KHOA HỌC DỮ LIỆU Hiện nay, vẫn còn nhiều tranh cãi về định nghĩa chính thức của ngành KHDL (Data Science). Theo Wikipedia “KHDL là một lĩnh vực liên ngành về các quá trình và các hệ thống rút trích tri thức hoặc hiểu biết từ dữ liệu ở các dạng khác nhau, kể ở dạng cấu trúc hay phi cấu trúc, là sự tiếp nối của một số lĩnh vực phân tích dữ liệu như khoa học thống kê, khai phá dữ liệu, tương tự như khám phá tri thức ở các cơ sở dữ liệu (KDD-Knowledge Discovery in Databases)”. NIST (National Institute of Standards and Technology) định nghĩa “KHDL trực tiếp trích rút tri thức hành động từ dữ liệu qua quá trình phát hiện, thiết lập và kiểm nghiệm các giả thiết”. Microsoft đã định nghĩa “KHDL là dùng dữ liệu tạo quyết định dẫn dắt hành động”. Slaltz và cộng sự định nghĩa “KHDL là trích xuất, sắp xếp, phân tích, trực quan hóa và duy trì thông tin. Đây là một lĩnh vực đa ngành sử dụng các phương pháp và quy trình khoa học để rút ra những hiểu biết sâu sắc từ dữ liệu” (Saltz & Stanton, 2017) . Nhìn vào ở một khía cạnh nào đó, có thể xem KHDL như một thể mới của một tập hợp gồm các ngành khác nhau trong sự vận động phát triển không ngừng của khoa học máy tính, mô phỏng, thống kê, phân tích và toán học. Trọng tâm của nó nằm ở việc áp dụng các phương pháp tự động hóa cho việc phân tích một lượng lớn dữ liệu và từ đó rút ra các tri thức. Hình 1: Sơ đồ Venn về Data Science Nguồn: (Conway, 2011)
- 181 KHDL là nơi giao thoa của nhiều lĩnh vực khác nhau. Những trụ cột của KHDL bao gồm: tính toán, thống kê, toán học, các môn học định lượng và kiến thức khoa học chuyên ngành kết hợp để phân tích dữ liệu và cho ra quyết định tốt hơn. Theo sơ đồ Venn về KHDLcủa Drew Conway, chúng ta có thể thấy được ba nội dung chính của KHDL là: các kỹ năng thâm nhập (hacking skills), các kiến thức toán học và thống kê (math & statistics knowledge) và các khoa học chuyên ngành (domain science) (Trí, 2018) Với sự xuất hiện của các công nghệ mới, dữ liệu đã tăng lên theo cấp số nhân. Điều này đã tạo cơ hội để phân tích và rút ra những hiểu biết sâu sắc có ý nghĩa từ dữ liệu. Nó đòi hỏi kiến thức chuyên môn đặc biệt của một ‘Nhà khoa học dữ liệu’, người có thể sử dụng các công cụ thống kê và học máy khác nhau để hiểu và phân tích dữ liệu. Một nhà KHDL, chuyên về KHDL, không chỉ phân tích dữ liệu mà còn sử dụng các thuật toán học máy để dự đoán các sự kiện xảy ra trong tương lai. Do đó, chúng ta có thể hiểu KHDL là một lĩnh vực liên quan đến việc xử lý dữ liệu, phân tích và trích xuất thông tin chi tiết từ dữ liệu bằng nhiều phương pháp thống kê và thuật toán máy tính. Đây là một lĩnh vực đa ngành kết hợp toán học, thống kê và khoa học máy tính (DataFlair). KHDL có tầm ảnh hưởng đến nền kinh tế, được ứng dụng đa dạng theo từng lĩnh vực. Nhiều ngành kinh tế như ngân hàng, giao thông vận tải, thương mại điện tử hay chăm sóc sức khỏe đã có những bước nhảy vọt, cải tiến công nghệ, sản phẩm của mình. 3. ỨNG DỤNG CỦA DATA SCIENCE TRONG NGÀNH NGÂN HÀNG Ngân hàng là ngành ứng dụng KHDL nhiều nhất. Dữ liệu lớn và KHDL cho phép các ngân hàng trở nên cạnh tranh nhau hơn trên thị trường. Với Data Science, các ngân hàng quản lý nguồn tài nguyên của họ dễ dàng hơn, nhận biết vấn đề trục trặc sớm hơn và quản lý dữ liệu khách hàng hiệu quả hơn (DataFlair). 3.1. Mô hình hóa rủi ro (Risk Modeling) Mô hình rủi ro là một ưu tiên cao cho ngành ngân hàng; giúp họ hình thành các chiến lược mới để đánh giá hiệu suất của họ. Mô hình hóa rủi ro tín dụng (Credit Risk Modeling) là một trong những khía cạnh quan trọng nhất, cho phép các ngân hàng phân tích khoản vay của họ sẽ được hoàn trả như thế nào. Trong rủi ro tín dụng, có khả năng người vay không trả được nợ. Có nhiều yếu tố trong rủi ro tín dụng khiến nó trở thành một nhiệm vụ phức tạp đối với các ngân hàng. Với mô hình rủi ro, các ngân hàng có thể phân tích tỷ lệ vỡ nợ và phát triển các chiến lược để củng cố kế hoạch cho vay của họ. Với sự trợ giúp của dữ liệu lớn và KHDL, các ngành ngân hàng có thể phân tích và phân loại những người vỡ nợ trước khi xử phạt khoản vay trong trường hợp rủi ro cao. Mô hình hóa rủi ro cũng áp dụng cho hoạt động tổng thể
- 182 của ngân hàng nơi các công cụ phân tích được sử dụng để định lượng hiệu quả hoạt động của các ngân hàng và để theo dõi hoạt động của họ. 3.2. Phát hiện gian lận (Fraud Detection) Với những tiến bộ trong học máy, các công ty đã trở nên dễ dàng hơn trong việc phát hiện các gian lận và bất thường trong các mẫu giao dịch. Phát hiện gian lận liên quan đến việc giám sát và phân tích hoạt động của người dùng để tìm ra bất kỳ hình thức thông thường hoặc độc hại nào. Với sự gia tăng phụ thuộc vào Internet và thương mại điện tử để giao dịch, số lượng các vụ lừa đảo đã tăng lên đáng kể. Sử dụng KHDL, các ngành công nghiệp có thể tận dụng sức mạnh của học máy và phân tích dự đoán để tạo ra các công cụ phân cụm giúp nhận ra các xu hướng và mô hình khác nhau trong hệ sinh thái phát hiện gian lận. Có nhiều thuật toán khác nhau như K- means clustering, SVM (Support Vector Machine) hữu ích trong việc xây dựng nền tảng để nhận ra các hoạt động và giao dịch bất thường. Quá trình phát hiện gian lận bao gồm: • Lấy các mẫu dữ liệu để đào tạo mô hình. • Huấn luyện mô hình trên các bộ dữ liệu đã cho. Quá trình huấn luyện liên quan đến việc thực hiện một số thuật toán học máy để lựa chọn đặc trưng và phân loại. • Thử nghiệm và triển khai mô hình. Feature Train/Test K-means Preprocessing Selection using Dataset Clustering KNN Fraud (1) or Applying SVM SVM Classifier NotFraud (0) on test data Hình 2: Quá trình phát hiện gian lận Nguồn: (DataFlair) Ví dụ, hai thuật toán như K-mean clustering và SVM có thể được sử dụng để tiền xử lý và phân loại dữ liệu. K-means có thể được sử dụng để lựa chọn đặc trưng và SVM sau đó được áp dụng cho dữ liệu để phân loại nó thành lớp gian lận hoặc không gian lận.
- 183 3.3. Giá trị vòng đời của khách hàng (Customer Lifetime Value) Khách hàng là một phần thiết yếu của ngành ngân hàng. Họ đảm bảo một nguồn thu ổn định. Giá trị vòng đời của khách hàng cung cấp giá trị chiết khấu của doanh thu trong tương lai do khách hàng đóng góp. Các ngân hàng thường được yêu cầu dự đoán doanh thu trong tương lai dựa trên doanh thu trong quá khứ. Ngoài ra, các ngân hàng muốn biết việc giữ chân khách hàng và liệu họ có giúp tạo ra doanh thu trong tương lai hay không. Các ngân hàng muốn khách hàng của họ hài lòng và mang lại lợi ích họ cho hiện tại cũng như triển vọng trong tương lai. Các doanh nghiệp như lĩnh vực ngân hàng được yêu cầu phải dự đoán giá trị vòng đời của khách hàng. KHDL trong ngân hàng đóng một vai trò thiết yếu yêu cầu này. Với phân tích dự đoán, các ngân hàng có thể phân loại khách hàng tiềm năng và gán cho họ giá trị tương lai đáng kể để đầu tư nguồn lực của công ty vào họ. Trong khi các thuật toán phân loại giúp các ngân hàng có được khách hàng tiềm năng, việc giữ chân họ là một nhiệm vụ đầy thách thức khác. Với sự tăng trưởng trong cạnh tranh, các ngân hàng đòi hỏi một cái nhìn toàn diện về khách hàng để phân bổ nguồn lực của họ một cách tối ưu. Có nhiều công cụ khác nhau được sử dụng trong việc tiền xử lý, làm sạch và dự đoán dữ liệu. Có nhiều công cụ khác nhau như cây phân loại và hồi quy (CART- Classification and Regression Trees), mô hình tuyến tính tổng quát (GLM- Generalized Linear Models), Điều này cho phép các ngân hàng giám sát khách hàng của họ, đóng góp vào sự tăng trưởng và lợi nhuận của công ty. 3.4. Phân khúc khách hàng (Customer Segmentation) Trong phân khúc khách hàng, ngân hàng phân nhóm khách hàng dựa trên hành vi và đặc điểm chung của họ để có cách giải quyết phù hợp. Trong trường hợp này, các kỹ thuật máy học như phân loại và phân cụm đóng vai trò chính trong việc xác định khách hàng tiềm năng cũng như phân khúc khách hàng dựa trên các hành vi chung của họ. Một kỹ thuật phân cụm phổ biến là K-mean, được sử dụng rộng rãi để phân nhóm các điểm dữ liệu tương tự. Đây là một thuật toán học tập không giám sát, có nghĩa là dữ liệu mà nó được áp dụng không có bất kỳ nhãn nào và không có ánh xạ đầu vào-đầu ra. Một số cách khác nhau để phân khúc khách hàng giúp các tổ chức ngân hàng: • Xác định khách hàng dựa trên lợi nhuận của họ. • Phân khúc khách hàng dựa trên mức độ sử dụng các dịch vụ ngân hàng của họ. • Tăng cường mối quan hệ với khách hàng của họ.
- 184 • Cung cấp các chương trình và dịch vụ thích hợp thu hút các khách hàng cụ thể. • Phân tích phân khúc khách hàng để thực hiện và cải tiến dịch vụ. 3.5. Công cụ gợi ý (Recommendation Engines) Cung cấp trải nghiệm tùy chỉnh cho khách hàng là một trong những vai trò quan trọng của ngân hàng. Dựa trên các giao dịch của khách hàng và thông tin cá nhân để đề xuất các ưu đãi và dịch vụ mở rộng. Các ngân hàng cũng ước tính những sản phẩm mà khách hàng có thể quan tâm đến việc mua sau khi phân tích các lần mua trước đây. Với điều này, các ngân hàng sẽ có thể giới thiệu sản phẩm của các công ty đã liên kết với họ. Công cụ gợi ý cũng đề xuất cung cấp dịch vụ tập trung vào khách hàng hoặc sản phẩm dựa trên sở thích của họ. Các ngân hàng cũng có thể đưa ra những lời chào hàng có tính hấp dẫn cao đối với khách hàng. Có hai loại công cụ gợi ý được các ngân hàng sử dụng: • Lọc cộng tác dựa trên người dùng (User-Based Collaborative Filtering) • Lọc cộng tác dựa trên mục (Item-Based Collaborative Filtering) 3.6. Phân tích dự đoán theo thời gian thực (Real-Time Predictive Analytics) Phân tích dự đoán là quá trình sử dụng các kỹ thuật tính toán để dự đoán các sự kiện trong tương lai. Học máy là công cụ chính của phân tích dự đoán, là một công cụ lý tưởng để cải thiện chiến lược phân tích của các ngân hàng. Với sự gia tăng nhanh chóng của dữ liệu, có rất nhiều trường hợp sử dụng và yêu cầu phân tích dữ liệu lên đến đỉnh điểm. Có hai loại kỹ thuật phân tích chính: • Phân tích thời gian thực (Real-time analytics): cho phép khách hàng hiểu các vấn đề cản trở doanh nghiệp. • Phân tích dự đoán (Predictive analytics): Cho phép khách hàng lựa chọn kỹ thuật phù hợp để giải quyết vấn đề. Có những lĩnh vực như quản lý tài chính của các ngành ngân hàng cho phép các ngành quản lý tài chính và đề ra các chiến lược mới. 4. ỨNG DỤNG CỦA DATA SCIENCE TRONG NGÀNH TÀI CHÍNH KHDL đóng vai trò quan trọng trong quy trình tự động hóa nghiệp vụ tài chính kế toán. 4.1. Phân tích rủi ro (Risk Analytics) Phân tích rủi ro là một trong những lĩnh vực quan trọng của KHDL và kinh doanh thông minh (BI-Business Intelligence) trong lĩnh vực tài chính. Với phân tích và quản lý rủi ro, một công ty có thể đưa ra các quyết định chiến lược, tăng độ tin cậy và an toàn của công ty. Vì quản lý rủi ro đo lường tần suất mất mát và nhân nó với mức độ thiệt hại, nên
- 185 dữ liệu là cốt lõi của nó. Quản lý rủi ro là một lĩnh vực đa ngành, cần có kiến thức về toán học, thống kê và giải quyết vấn đề. Mặc dù dữ liệu có cấu trúc truyền thống luôn có thể được cung cấp trong bảng tính, nhưng dạng dữ liệu nâng cao hơn không có cấu trúc. Dạng dữ liệu lớn này cung cấp cho các tổ chức nhiều cơ hội. Có nhiều dạng rủi ro khác nhau mà một công ty phải đối mặt. Những rủi ro này bắt nguồn từ đối thủ cạnh tranh, tín dụng, thị trường, Các bước chính để quản lý rủi ro là xác định, theo dõi và ưu tiên các rủi ro. Có rất nhiều dữ liệu sẵn có như thông tin khách hàng, giao dịch tài chính. Do đó, các tổ chức huấn luyện về loại dữ liệu này để cải thiện các mô hình đánh giá rủi ro. Một khía cạnh quan trọng khác của quản lý rủi ro là xác minh khả năng trả được nợ của khách hàng. Để phân tích khả năng trả được nợ, các công ty thuê các nhà KHDL sử dụng các thuật toán học máy để phân tích các giao dịch được thực hiện bởi khách hàng (DataFlair). 4.2. Phân tích thời gian thực (Real-Time Analytics) Trong phân tích truyền thống, xử lý dữ liệu ở dạng lô. Đó là, việc xử lý dữ liệu chỉ mang tính lịch sử chứ không phải theo thời gian thực. Điều này gây ra các vấn đề cho các ngành khác nhau yêu cầu dữ liệu thời gian thực để có được thông tin chi tiết về hoàn cảnh hiện tại. Tuy nhiên, với những tiến bộ trong công nghệ và sự phát triển của các đường ống dữ liệu động (Dynamic Data Pipelines), giờ đây có thể truy cập dữ liệu với độ trễ tối thiểu. Với ứng dụng KHDL trong tài chính, các tổ chức có thể theo dõi các giao dịch, điểm tín dụng và các đặc tính tài chính khác mà không có bất kỳ vấn đề nào về độ trễ (DataFlair). 4.3. Phân tích khách hàng (Consumer Analytics) Cá nhân hóa khách hàng là một hoạt động chính của các tổ chức tài chính. Với sự trợ giúp của phân tích thời gian thực, các nhà KHDL có thể hiểu rõ hơn về hành vi của người tiêu dùng và có thể đưa ra các quyết định kinh doanh phù hợp. Các tổ chức tài chính như công ty bảo hiểm sử dụng phân tích khách hàng để đo lường giá trị vòng đời của khách hàng, tăng doanh số bán hàng chéo của họ cũng như giảm lượng khách hang “below zero” để tối thiểu hóa tổn thất. 4.4. Quản lý dữ liệu khách hàng (Customer Data Management) Các tổ chức tài chính cần dữ liệu. Trên thực tế, dữ liệu lớn đã tạo ra một cuộc cách mạng trong cách thức hoạt động của các tổ chức tài chính. Khối lượng và sự đa dạng của dữ liệu được đóng góp thông qua phương tiện truyền thông xã hội và một số lượng lớn các giao dịch. Dữ liệu có hai dạng: Dữ liệu có cấu trúc và dữ liệu phi cấu trúc. Mặc dù dữ liệu có cấu trúc dễ xử lý hơn, nhưng chính dữ liệu phi cấu trúc lại gây ra rất nhiều vấn đề. Dữ liệu
- 186 phi cấu trúc này có thể được xử lý bằng một số công cụ NoSQL và có thể được xử lý với sự trợ giúp của MapReduce. Kinh doanh thông minh (Business Intelligence) là khía cạnh quan trọng nhất của dữ liệu lớn. Các ngành sử dụng học máy để tạo ra thông tin chi tiết về khách hàng và trích xuất thông tin kinh doanh. Có nhiều công cụ khác nhau trong trí tuệ nhân tạo như xử lý ngôn ngữ tự nhiên, khai phá dữ liệu và phân tích văn bản tạo ra những hiểu biết sâu sắc có ý nghĩa từ dữ liệu. Hơn nữa, các thuật toán học máy phân tích xu hướng tài chính và những thay đổi trong giá trị thị trường thông qua phân tích kỹ lưỡng dữ liệu khách hàng. 4.5. Cung cấp các dịch vụ được cá nhân hóa (Providing Personalized Services) Các tổ chức tài chính chịu trách nhiệm cung cấp các dịch vụ được cá nhân hóa cho khách hàng của họ. Họ sử dụng nhiều kỹ thuật khác nhau để phân tích thông tin khách hàng và tạo ra những hiểu biết sâu sắc về các tương tác của họ. Hơn nữa, các tổ chức tài chính đang dựa vào phần mềm dựa trên nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên để cung cấp khả năng tương tác tốt hơn cho người dùng. Với dữ liệu được cung cấp bởi người dùng, các tổ chức tài chính có thể có được những hiểu biết hữu ích về nhu cầu khách hàng của họ. Điều này sẽ dẫn đến việc tăng lợi nhuận; giúp các tổ chức tối ưu hóa chiến lược và cung cấp dịch vụ tốt hơn cho khách hàng của họ. 4.6. Phát hiện gian lận (Fraud Detection) Gian lận là một mối quan tâm lớn của các tổ chức tài chính. Sự nguy hiểm của gian lận đã tăng lên cùng với sự gia tăng số lượng giao dịch. Tuy nhiên, với sự phát triển của dữ liệu lớn và các công cụ phân tích, giờ đây các tổ chức tài chính có thể theo dõi các gian lận. Một trong những hành vi gian lận phổ biến nhất trong các tổ chức tài chính là gian lận thẻ tín dụng. Việc phát hiện loại gian lận này là do những cải tiến trong các thuật toán đã tăng độ chính xác cho việc phát hiện bất thường. Hơn nữa, những phát hiện này cảnh báo các công ty về những bất thường trong các giao dịch mua tài chính, khiến họ phải khóa tài khoản để giảm thiểu thiệt hại. Các công cụ học máy khác nhau cũng có thể xác định các mẫu bất thường trong dữ liệu giao dịch và cảnh báo các tổ chức tài chính để điều tra thêm về nó. Có những gian lận liên quan đến bảo hiểm khác mà các ngân hàng phải đối phó. Sử dụng một số thuật toán phân cụm, các công ty có thể tách biệt và phân cụm các mẫu dữ liệu có vẻ rất đáng ngờ. 4.7. Giao dịch dựa trên thuật toán (Algorithmic Trading) Giao dịch thuật toán là phần quan trọng nhất của các tổ chức tài chính. Trong giao dịch thuật toán, có những công thức toán học phức tạp và các phép tính tốc độ cực nhanh
- 187 giúp các công ty tài chính đưa ra các chiến lược giao dịch mới. Dữ liệu lớn đã có tác động rất lớn đến giao dịch thuật toán và KHDL đã trở thành đặc trưng quan trọng nhất của nó. 5. KẾT LUẬN Tác động CMCN 4.0 và chuyển đổi số là vô cùng to lớn, tích cực lên mọi khía cạnh kinh tế, đời sống loài người; mang lại nhiều cơ hội phát triển rộng mở. KHDL sẽ phát triển mạnh mẽ hơn nữa trong tương lai và giúp cho con người tận dụng được tối đa tiềm năng của các nguồn dữ liệu lớn. KHDL sẽ làm cho các hệ thống trở nên thông minh hơn và góp phần xây dựng nên một nền kinh tế số hội nhập, hiện đại. Trong đó, con người sẽ có nhiều cơ hội thâm nhập sâu hơn vào dữ liệu, hỗ trợ đưa ra các quyết định tốt hơn trong nhiều lĩnh vực của cuộc sống. DANH MỤC TÀI LIỆU THAM KHẢO Conway, D. (2011). Data Science in the US Intelligence Community. IQT Quarterly, 2(4), 24-27. DataFlair. 6 Intriguing Applications of Data Science in Banking. Retrieved from DataFlair. (9/9/2020). 7 Breathtaking Applications of Data Science in Finance. Retrieved from DataFlair. What is Data Science? A Complete Data Science Tutorial for Beginners. Hà Quang Thụy, P. X. H., Nguyễn Trí Thành, Trần Trọng Hiếu, Trần Mai Vũ, Nguyễn Hữu Đức. (2020). Kinh tế số: Bối cảnh thế giới và liên hệ với Việt Nam. Tạp chí Công thương. Saltz, J. S., & Stanton, J. M. (2017). An introduction to data science: Sage Publications. Trí, T. N. D. M. (2018). Tổng quan về khoa học dữ liệu. Tạp chí thông tin và tư liệu, 6/2018, 16-23.