Ứng dụng học máy trong các nghiên cứu kinh tế

19 trang Gia Huy 6820

Download

Bạn đang xem tài liệu "Ứng dụng học máy trong các nghiên cứu kinh tế", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

ung_dung_hoc_may_trong_cac_nghien_cuu_kinh_te.pdf

Nội dung text: Ứng dụng học máy trong các nghiên cứu kinh tế

ỨNG DỤNG HỌC MÁY TRONG CÁC NGHIÊN CỨU KINH TẾ ThS.Hoàng Thị Thuý & Lê Thị Xuân Thu Khoa Quản trị, Trường Đại học Luật TP.HCM TÓM TẮT Bài tham luận cung cấp đánh giá toàn diện về những tiến bộ gần đây của Học máy trong các ứng dụng đặc biệt là các lĩnh vực mới nổi. Đầu tiên các tác giả giới thiệu các khái niệm về học máy và phân loại chúng theo giải thuật. Tiếp theo, dựa vào những nghiên cứu trước đây, các tác giả tổng hợp, phân tích những đóng góp ban đầu của Học máy đối với ngành kinh tế học. Kết quả cho thấy, các công cụ và mô hình của học máy kết hợp đã thể hiện những ưu điểm vượt trội hơn tiêu biểu là đối với các ứng dụng dự báo giá cổ phiếu, xu hướng giá tiền điện tử, dự báo nhu cầu sử dụng năng lượng, chiến lược giao dịch, phân tích xu hướng năng lượng, các vấn đề về chính sách, chiến lược. Cuối cùng thông qua bài viết, các tác giả đưa ra những nhìn nhận về hạn chế của Học máy và từ đó đề xuất những hướng nghiên cứu mở rộng của nó trong tương lai. Từ khóa: Học máy, mô hình, ứng dụng, kinh tế năng lượng, tài chính, chính sách, dự báo, đề xuất ABSTRACT The paper provides a comprehensive review of the recent advances in Machine Learning especially emerging applications. Firstly, the authors introduce the concepts of machine learning and classify them by algorithm. Next, based on previous studies, we synthesize and analyze the machine learning's early contributions to economics. The results show that the tools and models of combined machine learning have shown outstanding advantages, typically in the applications of stock price forecasting, cryptocurrency price trends, energy demand forecasting, energy trend analysis, policy and strategy issues. Finally, through the article, we give their views on the limitations of Machine Learning and then propose its further research directions in the future. Keywords: Machine learning, model, application, energy economics, finance, policy, forecasting, proposal 1. Tổng quan nghiên cứu 181
Học máy (Machine Learning, ML) đề cập đến một lớp mô hình khoa học có thể học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian. Nguồn gốc của ML bắt nguồn từ sự quan tâm của cộng đồng khoa học vào những năm 1950 và 1960 trong việc tái tạo lại việc học của con người thông qua các chương trình máy tính. Từ quan điểm này, ML trích xuất kiến thức từ dữ liệu, sau đó có thể được sử dụng để dự đoán và tạo ra thông tin mới. Thông tin này làm giảm sự không chắc chắn vì nó chỉ ra cách giải quyết các vấn đề cụ thể. ML đặc biệt hữu ích trong việc xử lý các tác vụ mà giải pháp phân tích không thể hướng dẫn rõ ràng, chẳng hạn như xử lý hình ảnh và giọng nói, nhận dạng mẫu hoặc các tác vụ phân loại phức tạp. Hiệu suất vượt trội của các mô hình ML trong việc xử lý, phân loại và dự báo bằng cách sử dụng dữ liệu phức tạp và quy mô lớn, đã làm cho chúng trở nên phổ biến trong nhiều lĩnh vực của ngành năng lượng. Một danh sách các ứng dụng trong ngành năng lượng bao gồm thăm dò mỏ dầu và khí đốt (Anifowose và cộng sự, 2017), quy trình dầu và khí (Zendehboudi và cộng sự, 2018), dự báo bức xạ mặt trời (Voyant và cộng sự, 2017), tối ưu hóa các lò phản ứng (Zeng và cộng sự, 2018), dự báo năng lượng gió (Heinermann và Kramer, 2016), hệ thống năng lượng gió (Marugán và cộng sự, 2018), dự đoán sự cố (Gupta và cộng sự, 2015), dự báo phụ tải điện (Jurado và cộng sự, 2015), và mối quan hệ giữa năng lượng và nước (Zaidi và cộng sự, 2018). ML cũng đã được sử dụng rộng rãi trong các ứng dụng liên quan đến phân tích kinh tế và tài chính, chẳng hạn như dự đoán giá và quản lý rủi ro. So sánh giữa các đặc điểm của ML với các mô hình kinh tế lượng truyền thống (ví dụ, mô hình tự hội quy tích hợp trung bình trượt ARIMA hoặc mô hình tự hồi quy phương sai không đồng nhất tổng quát GARCH) giải thích lý do cho sự phổ biến ngày càng tăng của ML trong kinh tế năng lượng. Ưu điểm của phương pháp ML so với các phương pháp được đề xuất bởi thống kê hay kinh tế lượng cổ điển là các thuật toán ML có thể quản lý một lượng lớn dữ liệu có cấu trúc và phi cấu trúc và đưa ra quyết định hoặc dự báo nhanh chóng. Hiệu suất vượt trội như vậy bởi vì các mô hình ML không đưa ra bất kỳ giả định nào được chỉ định trước về dạng hàm của phương trình, sự tương tác giữa các biến và phân phối thống kê của các tham số. Thay vào đó, các phương pháp ML tập trung vào việc đưa ra các dự đoán chính xác cho các biến kết quả. Các nhà nghiên cứu sử dụng mô hình học máy để giải quyết các vấn đề khác nhau liên quan đến kinh tế học. Học sâu (Deep Learning, DL), như một lĩnh vực máy học mới nổi, hiện đang được ứng dụng trong nhiều khía cạnh của xã hội ngày nay, từ xe tự lái đến nhận dạng hình ảnh, dự đoán nguy cơ, tin học, và tin sinh học (Casalino và cộng sự, 2017 hoặc 182Ardabil và cộng sự, 2019). Một số nghiên cứu so sánh đã đánh giá hiệu suất của các mô 182
hình DL với các mô hình ML tiêu chuẩn, ví dụ: máy vectơ hỗ trợ (SVM), K-láng giềng gần nhất (KNN) và mạng nơ-ron hồi quy tổng quát (GRNN) trong các ứng dụng kinh tế. Mặt khác, mô hình học máy kết hợp bao gồm hai hoặc nhiều thuật toán đơn lẻ và được sử dụng để tăng độ chính xác của các mô hình khác (Nosratabadi và cộng sự, 2020). Mô hình kết hợp có thể được hình thành bằng cách kết hợp hai thuật toán học máy dự đoán hoặc một thuật toán học máy và một phương pháp tối ưu hóa để tối đa hóa chức năng dự đoán (Torabi và cộng sự, 2019). Người ta đã chứng minh rằng các mô hình học máy kết hợp hoạt động tốt hơn các thuật toán đơn lẻ và cách tiếp cận như vậy đã cải thiện độ chính xác của dự đoán (Mosavi và cộng sự, 2018). Thuật toán học máy Ensemble là một trong những thuật toán Học có giám sát sử dụng nhiều thuật toán học máy để cải thiện quy trình học tập và tăng độ chính xác của dự đoán (Mosavi và cộng sự, 2019). Các mô hình Ensemble áp dụng các thuật toán đào tạo khác nhau để tăng cường đào tạo và học hỏi từ dữ liệu (Torabi và cộng sự, 2018). Mặc dù sử dụng rộng rãi ML trong kinh tế, theo hiểu biết tốt nhất của các tác giả, không có tài liệu tổng quan nào đánh giá một cách có hệ thống các tài liệu hiện có. Với những lợi ích của một nghiên cứu như vậy, bài báo này nhằm mục đích cung cấp một đánh giá về các bài báo được xuất bản gần đây trên các tạp chí liên quan đến kinh tế khác nhau. Bài đánh giá của chúng tôi tập trung vào các mục tiêu như sau: 1) Khái niệm Học máy và phân loại dựa trên các thuật toán. Các tác giả cung cấp những kiến thức chung nhất và sơ lược để người đọc có thể tiếp cận lĩnh vực này dễ dàng. 2) Các lĩnh vực ứng dụng của Học máy, các thuật toán thường được sử dụng trong các lĩnh vực đó thông qua việc đánh giá và tổng hợp những nghiên cứu trước đây. 3) Các lĩnh vực ứng dụng phổ biến và chưa được khám phá trong phân tích chính sách, chiến lược. 4) Đánh giá những hạn chế của Học máy và từ đó đề xuất những hướng nghiên cứu trong tương lai. 2. Khái niệm Học Máy Học máy (Machine Learning, ML) là một phương tiện trong Trí Tuệ nhân tạo, sử dụng các thuật toán cho phép máy tính có thể tự học từ dữ liệu để giải quyết những vấn đề cụ thể như làm cho máy tính có khả năng nhận thức cơ bản của con người (nghe, nhìn, hiểu, giải toán, ) và hỗ trợ cho con người xử lý một lượng thông tin khổng lồ phải đối diện hằng ngày (Vũ Hữu Tiệp, 2018). ML đóng một vai trò quan trọng trong nhiều ngành khoa học và các ứng dụng của nó là một phần trong cuộc sống hàng ngày của chúng ta. ML được sử 183
dụng để lọc thứ rác (email spam), để dự đoán thời tiết, trong chẩn đoán y tế, khuyến cáo sản phẩm, nhận diện khuôn mặt, phát hiện gian lận thẻ tín dụng, v.v. ML có 2 nhánh thuật toán cơ bản dựa vào cách chúng ta cấp dữ liệu huấn luyện cho mô hình, cách sử dụng và loại vấn đề cần xử lý đó là: học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning). Học có giám sát bao gồm các thuật toán đưa các dữ liệu đầu vào (input) thành các kết quả đầu ra (label) tương ứng. Đầu vào phải biết trước giá trị label của chúng và được dùng để dự đoán giá trị biến đầu ra hay còn gọi là biến trả lời. Tùy thuộc vào biến đầu ra là rời rạc hay liên tục mà chúng ta có thể phân biệt hai nhiệm vụ được giám sát: phân loại (Classification) hay hồi quy (Regression) và đây cũng là hai thuật toán điển hình thuộc nhóm này. Dữ liệu trong các thuật toán thuộc nhánh Học không giám sát chỉ có đầu vào mà không cần đầu ra. Nó được sử dụng chủ yếu để khám phá cấu trúc và mối quan hệ dữ liệu. Các thuật toán thuộc nhóm này có thể không dự đoán được đầu ra những vẫn trích xuất được các thông tin quan trọng dựa vào mối liên hệ giữa các điểm dữ liệu. Ứng dụng của Học không giám sát là giải quyết các bài toán phân cụm hay giảm chiều dữ liệu. Phân cụm sẽ phân tích các đặc trưng của dữ liệu thành các nhóm khác nhau, đưa dữ liệu đầu vào có những đặc tính gần giống nhau thành từng nhóm. Không phải tất cả các phương pháp giảm kích thước đều liên quan đến việc tạo các cụm; Các phương pháp cũ hơn như phân tích các thành phần chính có thể được sử dụng để giảm số chiều, trong khi các phương pháp hiện đại bao gồm thừa số hóa ma trận (tìm hai ma trận chiều thấp mà tích của nó gần đúng với ma trận lớn hơn), chính quy hóa trên chuẩn của ma trận, thừa số hóa Poisson phân cấp và mạng nơ-ron. Những công cụ này rất hữu ích như một bước trung gian thực nghiệm trong kinh tế học. Chúng cung cấp một cách thức theo hướng dữ liệu để tìm các bài báo tương tự, các bài đánh giá về nhà hàng, v.v. và do đó tạo ra các biến số có thể được sử dụng trong các phân tích kinh tế. Các biến này có thể là một phần của việc xây dựng các biến kết quả hoặc biến giải thích, tùy thuộc vào ngữ cảnh. Ví dụ, nếu một nhà phân tích muốn ước tính một mô hình nhu cầu của người tiêu dùng đối với các mặt hàng khác nhau, thì thông thường người ta sẽ mô hình hóa sở thích của người tiêu dùng dựa trên đặc điểm của các mặt hàng đó. Nhiều mục được liên kết với mô tả văn bản cũng như các bài đánh giá trực tuyến. Học không giám sát có thể được sử dụng để khám phá các mặt hàng có mô tả sản phẩm tương tự trong giai đoạn đầu của việc tìm kiếm. Học không giám sát còn có thể được sử dụng thêm để phân loại các bài đánh giá. Một chỉ số cho nhóm soát xét có thể được sử dụng trong các phân tích tiếp theo mà nhà phân tích không cần phải sử dụng đến các đánh giá; Dữ liệu sẽ 184
tiết lộ liệu một loại đánh giá nhất định có liên quan đến chất lượng cảm nhận của người tiêu dùng hay không. Một lợi thế của việc sử dụng phương pháp học không giám sát để tạo hiệp biến là dữ liệu kết quả hoàn toàn không được sử dụng. Do đó, mối quan tâm về tương quan giả giữa các hiệp biến được xây dựng và kết quả quan sát được ít có vấn đề hơn. Ngoài ra, còn có hai nhóm thuật toán là Học bán giám sát (Semi-supervised Learning) và Học tăng cường (Reinforcement Learning). Có những trường hợp khi mà ranh giới giữa Học giám sát và Học không giám sát không rõ ràng, tập huấn luyện bao gồm những cặp đầu ra, đầu vào và những dữ liệu chỉ có đầu vào. Khi đó ta phải sử dụng thuật toán của Học bán giám sát. Và có những bài toán không yêu cầu về dữ liệu huấn luyện, nhưng các mô hình phải học cách đưa ra quyết định bằng cách giao tiếp với môi trường xung quanh, nhận phản hồi từ môi trưởng để tự củng cố hành vi. Những thuật toán như vậy thuộc nhóm Học tăng cường. 3. Ứng dụng Học Máy trong nghiên cứu kinh tế Trong bài đánh giá gần đây về ứng dụng của Học máy của tác giả (Saeed Nosratabadi và cộng sự, 2020) đã dùng cơ sở dữ liệu 57 bài báo (bình duyệt đăng trên Thomson Reuters Web-of-Science (WoS) và Elsevier Scopus). Cơ sở dữ liệu của nghiên cứu này bao gồm đã được phân tích và phân loại theo hai tiêu chí: lĩnh vực nghiên cứu / ứng dụng và loại phương pháp. Dựa trên việc xem xét các bài báo theo ứng dụng, người ta thấy rằng các bài báo này được thiết kế để giải quyết các vấn đề về năm ứng dụng khác nhau, đó là Thị trường chứng khoán (37 bài), Tiếp thị (6 bài), Thương mại điện tử (8 bài), Phá sản doanh nghiệp (3 bài) và Tiền điện tử (3 bài). Ngoài ra, các bài báo được phân tích theo loại phương pháp, chỉ ra rằng 42 thuật toán học máy đã được sử dụng trong số 57 bài báo được đánh giá. Nghiên cứu thêm cho thấy rằng 9 bài báo đã sử dụng 9 mô hình học sâu đơn lẻ, 18 mô hình học sâu kết hợp, 7 mô hình máy học kết hợp và 8 mô hình tổng hợp. 3.1 Ứng dụng Học Máy trong Thị trường chứng khoán Việc áp dụng học máy, cụ thể là Học sâu (Deep Learning) vào thị trường chứng khoán đã trở nên phổ biến hơn so với các lĩnh vực kinh tế học, có đến 37 bài trên tổng số 57 bài báo được đánh giá thuộc nhóm này. Đầu tư vào thị trường chứng khoán có lãi, trong khi lợi nhuận càng cao thì rủi ro càng cao. Vì vậy, các nhà đầu tư luôn cố gắng xác định và ước tính giá trị cổ phiếu trước khi có bất kỳ hành động nào. Giá trị cổ phiếu thường bị ảnh hưởng bởi các yếu tố kinh tế và chính trị không thể kiểm soát được khiến việc xác định xu hướng thị trường chứng khoán trong tương lai khá là khó khăn. Không chỉ bản chất của thị trường chứng khoán rất dễ biến động và phức tạp, mà dữ liệu chuỗi thời gian tài chính cũng không cố định. Do đó, các mô hình dự báo truyền thống không đủ tin cậy để dự đoán giá trị cổ 185
phiếu. Các nhà nghiên cứu liên tục tìm kiếm các phương pháp luận mới dựa trên các thuật toán Học máy để nâng cao độ chính xác của các dự đoán đó. Dự báo giá cổ phiếu là mục tiêu của 29 trong số 37 bài báo. Các nghiên cứu khác ứng dụng Học máy trong phân tích bối cảnh của văn bản để trích xuất thông tin chủ quan, nhằm xác định xu hướng thay đổi trên thị trường chứng khoán. Ngoài ra, quản lý danh mục đầu tư, giao dịch theo thuật toán (tức là sử dụng hệ thống tự động được lập trình sẵn để giao dịch), giao dịch chứng khoán tự động, danh mục đầu tư có trách nhiệm với xã hội, dự đoán xu hướng chỉ số S&P 500 và dự đoán giá quyền chọn trao đổi-thương mại (EFT) là mục tiêu của các bài báo khác sử dụng phương pháp Học máy. Chuỗi thời gian tài chính đóng vai trò là nguồn dữ liệu của tất cả các nghiên cứu này, ngoại trừ các nghiên cứu nhằm phân tích quan điểm, sử dụng các nguồn dữ liệu khác nhau chẳng hạn như từ phương tiện truyền thông xã hội và tin tức tài chính. Các thuật toán được dùng chủ yếu để dự báo cổ phiếu ở đây là mạng bộ nhớ ngắn dài (Long Short-Term Memory, LSTM), Mạng nơ ron sâu (Deep Neural Network, DNN), Mạng nơ ron tích chập (Convolutional Neural Network, CNN), hoặc sử dụng dữ liệu chuỗi thời gian Tamura và cộng sự (2018) đã đưa ra phương pháp tiếp cận hai chiều để dự đoán giá trị cổ phiếu trong đó các chỉ số tài chính kỹ thuật của thị trường chứng khoán Nhật Bản được nhập làm dữ liệu đầu vào cho LSTM để dự đoán, sau đó dữ liệu về báo cáo tài chính của các công ty liên quan được truy xuất và được thêm vào cơ sở dữ liệu. Wang và cộng sự (2020) đã cố gắng tìm ra mô hình tốt nhất để dự đoán chuỗi thời gian tài chính của quản lý danh mục đầu tư nhằm tối ưu hóa việc hình thành danh mục đầu tư. Họ so sánh kết quả của LSTM với SVM, RF (Rừng ngẫu nhiên, Random Forest), DNN và mô hình trung bình động tích hợp tự động hồi quy (ARIMA) và nhận ra rằng LSTM phù hợp hơn với dự báo chuỗi thời gian tài chính. Sử dụng LSTM, Fister và cộng sự (2019) đã thiết kế một mô hình để giao dịch chứng khoán tự động. Họ cho rằng hiệu suất của LSTM cao hơn đáng kể so với các chiến lược giao dịch truyền thống, chẳng hạn như chiến lược giao dịch thụ động và dựa trên quy tắc cũ. Bên cạnh đó, Go và Hong (2019) đã sử dụng phương pháp DNN để dự đoán giá trị cổ phiếu. Đầu tiên, họ đào tạo phương pháp này bằng dữ liệu chuỗi thời gian, sau đó kiểm tra và xác nhận khả năng dự đoán của mô hình của họ. Song và cộng sự (2019) đã phát triển DNN sử dụng 715 tính năng đầu vào mới để dự báo biến động giá cổ phiếu. Họ cũng so sánh hiệu suất của mô hình của họ với các mô hình khác bao gồm các tính năng đầu vào dựa trên giá đơn giản. Để dự đoán hành vi thị trường chứng khoán, Chong, Han và Park (2017) đã kiểm tra hoạt động của DNN. Họ coi lợi nhuận cổ phiếu trong ngày với tần suất cao là 186
đầu vào trong mô hình của họ. Họ đã phân tích khả năng dự đoán bằng phân tích thành phần chính (PCA), tự động mã hóa. Kết quả từ nghiên cứu này cho thấy, DNN có khả năng dự đoán tốt với thông tin nhận được từ phần dư của chế độ tự động hồi quy. Ngoài ra, Sim và cộng sự (2019) đã phát triển một mô hình dự đoán giá cổ phiếu bằng cách điều chỉnh CNN. Hiệu suất dự đoán của CNN cho thấy dự báo giá cổ phiếu tốt hơn ANN (Mạng nơ ron nhân tạo, Artificial Neural Network) và SVM. Dingli và Fournier (2017) đã áp dụng CNN để dự đoán chuyển động trong tương lai của giá cổ phiếu và nhận thấy rằng độ chính xác dự đoán của mô hình của họ là 65% khi dự đoán giá của tháng tiếp theo và là 60% đối với giá của tuần tiếp theo. 3.2 Ứng dụng Học Máy trong Tiếp Thị Mục đích nghiên cứu của các bài báo thuộc nhóm tiếp thị cho thấy rằng các thuật toán học máy chủ yếu được sử dụng để nghiên cứu hành vi của khách hàng và các hoạt động khuyến mại, đó là lý do tại sao những bài báo này được xếp vào nhóm tiếp thị có nhãn. Như đã thấy trong bảng dưới, hai nghiên cứu áp dụng một phương pháp học sâu đơn và ba nghiên cứu sử dụng phương pháp học sâu kết hợp. Ngoài ra, những nghiên cứu này sử dụng nhiều nguồn dữ liệu khác nhau, chẳng hạn như dữ liệu chuỗi thời gian của khách hàng, các trường hợp nghiên cứu điển hình và phương tiện truyền thông xã hội (xem bảng 1). Ví dụ, Paolanti và cộng sự (2019) đã sử dụng mạng nơ-ron phức hợp sâu (Deep Convolutional Neural Network, DCNN) để phát triển một rô-bốt di động, được gọi là ROCKy, để phân tích bản đồ nhiệt theo thời gian thực của các cửa hàng bán lẻ để phát hiện tình trạng hết hàng (SOOS) và các hoạt động khuyến mãi. Dingli, Marmara, và Fournier (2017) đã nghiên cứu các giải pháp để xác định các mô hình và đặc điểm giữa dữ liệu giao dịch để dự đoán tình hình chuyển đổi của khách hàng trong ngành bán lẻ. Để làm như vậy, họ đã so sánh hiệu suất của CNN và máy Boltzmann bị hạn chế (RBM), nhận ra RBM hoạt động tốt hơn trong dự đoán "Churn Customer". Bảng 1: Phương pháp Học máy sử dụng trong tiếp thị Nguồn: (Saeed Nosratabadi và cộng sự, 2020) 187
3.3 Ứng dụng Học máy trong tiền điện tử Quá trình ra quyết định liên quan đến đầu tư vào tiền điện tử tương tự như đầu tư vào thị trường chứng khoán, nơi mà dự đoán về giá trị tương lai là yếu tố quyết định và hiệu quả đối với các quyết định đầu tư. Áp dụng mô hình học máy để dự đoán xu hướng giá tiền điện tử là một vấn đề nghiên cứu hấp dẫn đang nổi lên trong các tài liệu gần đây (xem Bảng 2). Ví dụ: Lahmiri và Bekiros (2019) đã áp dụng các phương pháp học sâu để dự đoán giá của các loại tiền điện tử, bao gồm Bitcoin, Digital Cash và Ripple, đồng thời so sánh hiệu suất dự đoán của LSTM và GRNN. Phát hiện của họ cho thấy rằng mô hình LSTM có hiệu suất tốt hơn so với GRNN (Mạng lưới nơ ron hồi quy tổng quát, Generalized Regression Neural Networks). Altan, Karasu và Bekiros (2019) tuyên bố rằng việc tích hợp LSTM và biến đổi wavelet (EWT) cải thiện hiệu suất của LSTM trong việc dự báo giá tiền điện tử khi thử nghiệm mô hình sử dụng dữ liệu chuỗi thời gian Bitcoin, Ripple, Digital Cash và Litecoin. Jiang và Liang (2017) đã phát triển một mô hình CNN để dự đoán giá của Bitcoin như một ví dụ về tiền điện tử. Họ đào tạo mô hình bằng cách sử dụng dữ liệu lịch sử về giá tài sản tài chính và sử dụng trọng số danh mục đầu tư làm đầu ra của mô hình. Bảng 2: Phương pháp Học Máy sử dụng trong tiền điện tử Nguồn : (Saeed Nosratabadi và cộng sự, 2020) 3.4 Ứng dụng Học máy trong Kinh tế năng lượng Trong những năm gần đây, nhiều nhà nghiên cứu đã ứng dụng Học máy trong các bài viết về lĩnh vực kinh tế năng lượng như dự báo giá dầu thô, khí đốt tự nhiên, điện, dự báo nhu cầu sử dụng năng lượng, chiến lược giao dịch, phân tích xu hướng năng lượng, Hamed Ghoddusi và cộng sự (2019) đã đánh giá một cách nghiêm túc 130 bài báo ứng dụng Học máy trong lĩnh vực này được xuất bản từ năm 2005 đến 2018 trên các tạp chí liên quan đến năng lượng và kinh tế hàng đầu Xếp hạng Tạp chí SCImago (SJR), Chỉ số trích dẫn Khoa học mở rộng (SCIE), Chỉ số trích dẫn Khoa học xã hội (SSCI) và Chỉ số trích dẫn Nghệ thuật & Nhân văn (A & HCI). Kết quả cho thấy Dự báo giá các loại năng lượng là phổ biến nhất chiếm 43 %, theo sau là dự báo/ mô hình nhu cầu sử dụng năng lượng với 39 %, các bài nghiên cứu về cấu trúc năng lượng chiếm 7%, Phân tích chính sách 6% (xem Hình 1). Hình 1: Tần suất tương đối của các ứng dụng sử dụng Học máy trong kinh tế năng lượng 188
Nguồn: (Hamed Ghoddusi và cộng sự, 2019) Dựa theo nghiên cứu của Hamed Ghoddusi và cộng sự (2019), ta cũng dễ dàng thấy được: Số lượng các bài báo sử dụng các thuật toán Học máy để ứng dụng trong Kinh tế năng lượng đăng trên các tạp chí cũng tăng dần từ năm 2005 đến 2018 (Xem Hình 2) Hình 2: Số bài báo ứng dụng học máy trong kinh tế năng lượng theo năm Nguồn: (Hamed Ghoddusi và cộng sự, 2019) Giá hàng hóa năng lượng thường thể hiện các đặc điểm phức tạp như phi tuyến tính, phụ thuộc vào độ trễ, không ổn định và phân cụm khiến việc sử dụng các mô hình truyền thống đơn giản trở nên khó khăn (Cheng và cộng sự, 2018). Các phương pháp ML có thể cung cấp hiệu suất dự báo cao hơn vì chúng có tính linh hoạt cao hơn trong việc xử lý các 189
động lực phức tạp bên trong. Phần lớn các bài báo tập trung vào dự đoán giá cả đều xem xét dự đoán giá dầu thô hoặc giá điện. Dự đoán giá khí đốt tự nhiên ít thường xuyên hơn nhiều. Các giải thuật dự báo giá dầu thô chủ yếu dựa trên phiên bản mạng nơ ron thần kinh cải tiến và lai, máy véc tơ hỗ trợ. Ngoài ra, việc kết hợp nhiều phương pháp tiếp cận tổng hợp đã trở nên phổ biến gần đây. Ví dụ như Yu và cộng sự (2008) sử dụng dạng phân tích thực nghiệm (Empirical Mode Decomposition, EMD) dưa trên Học mạng lưới thần kinh tổng hợp (Neural Network Ensemble Learning, NNEL) và Ding (2018) mở rộng cách tiếp cận này để dự đoán giá dầu. Yu và cộng sự (2017) đề xuất một cách tiếp cận dự báo tổng hợp, phương pháp dữ liệu thưa (Sparse Representation, SR) và Mạng lưới thần kinh truyền thẳng (Feedforward Neural Network, FNN) để cải thiện khả năng dự báo giá dầu. Các mô hình Học sâu như một phiên bản nâng cao hơn của mạng thần kinh nhân tạo, vẫn chưa được áp dụng rộng rãi để dự báo giá dầu thô. Một ngoại lệ là Zhao và cộng sự (2017) sử dụng thuật toán DL cho dự báo này. Bài báo kết hợp Bộ tự mã hóa khử nhiễu xếp chồng (Stacked Denoising Autoencoders, SDAE) - một kỹ thuật Học sâu - với tập hợp bootstrap (Bagging). Quy trình Bagging tạo ra nhiều tập dữ liệu để đào tạo một tập hợp các mô hình cơ sở SDAE. 3.5 Ứng dụng Học Máy trong Phân tích các chính sách, chiến lược Đã có một số ứng dụng thành công các phương pháp dự báo vào các vấn đề chính sách. Kleinberg và cộng sự (2015) cho rằng các phương pháp ML để dự báo đóng góp quan trọng vào việc phân tích chính sách và đưa ra các quyết định. Ví dụ như quyết định xem có nên thực hiện phẫu thuật thay khớp háng cho một bệnh nhân lớn tuổi hay không. Nếu bạn có thể dự đoán dựa trên đặc điểm cá nhân rằng bênh nhân sẽ chết trong vòng một năm, thì bạn không nên thực hiện phẫu thuật. Nhiều người Mỹ bị giam giữ trong khi chờ xét xử. Nếu bạn có thể dự đoán ai sẽ ra hầu tòa, bạn có thể cho tại ngoại nhiều hơn. Các thuật toán học máy hiện đang được sử dụng cho quyết định này ở một số lĩnh vực pháp lý. Một ví dụ tự nhiên khác là tính điểm tín dụng; một bài báo kinh tế của Bjorkegren và Grissen (2017) sử dụng phương pháp ML để dự đoán việc hoàn trả khoản vay bằng cách sử dụng dữ liệu điện thoại di động. Trong các ứng dụng khác, Goel, Rao và Shroﬀ (2016) sử dụng phương pháp ML để kiểm tra luật ―stop and frisk‖, sử dụng những gì có thể quan sát được về một vụ việc của cảnh sát để dự đoán xác suất kẻ tình nghi có vũ khí và họ chỉ ra rằng người da đen ít có khả năng hơn người da trắng sở hữu vũ khí. Glaeser và cộng sự (2016) đã giúp các thành phố thiết kế một cuộc thi xây dựng mô hình dự báo vi phạm quy định về sức khỏe trong các nhà hàng nhằm phân bổ nguồn lực thanh tra tốt hơn. Số lượng các bài nghiên cứu sử dụng ML cùng với hình ảnh từ vệ tinh và bản đồ đường phố để dự đoán nghèo đói, an toàn ngày 190
càng tăng (Naik và cộng sự, 2017). Glaeser, Kominers và cộng sự (2015) cho rằng có nhiều ứng dụng loại phương pháp dự đoán này. Nó được sử dụng để so sánh kết quả theo thời gian rất chi tiết, do đó có thể đánh giá tác động của nhiều chính sách và kéo theo sự thay đổi, chẳng hạn như sự tái sinh của các khu phố. Nói rộng hơn, các cơ hội mới được tạo ra bởi hình ảnh và cảm biến quy mô lớn có thể dẫn đến các loại phân tích mới về năng suất và phúc lợi. Dự đoán giúp cho việc đưa ra quyết định phù hợp hơn ví dụ những người gần như chắc chắn sẽ chết sớm không nên phẫu thuật thay khớp háng và người giàu không nên nhận viện trợ nghèo. Athey và cộng sự (2017) thảo luận về cách xác định những yếu tố có nguy cơ cao và những tác nhân cần can thiệp để có lợi nhất. Việc xác định những tác nhân như vậy là một câu hỏi suy luận nhân quả và việc trả lời nó đòi hỏi nhiều mục tiêu hơn là chỉ dự đoán. Có thể cần các thí nghiệm ngẫu nhiên hoặc thí nghiệm tự nhiên để ước tính những yếu tố không đồng nhất và chỉ định các chính sách tối ưu. Mặc dù, ML có rất nhiều ứng dụng trong phân tích chính sách, chiến lược nhưng theo nghiên cứu của các tác giả vẫn còn rất nhiều vấn hạn chế, cần mở rộng, khai thác đối với lĩnh vực này. Vấn đề đầu tiên, tính cân bằng trong mô hình ML, chẳng hạn như liệu các thuật toán có thúc đẩy phân biệt đối xử theo giới tính hoặc chủng tộc khi được sử dụng trong các cơ sở như tuyển dụng, quyết định tư pháp hay cho vay hay không. Có một số câu hỏi thú vị có thể được xem xét, làm thế nào các ràng buộc không cân bằng được loại bỏ? Loại cân bằng nào được mong muốn? Ví dụ, nếu một mô hình dự đoán được sử dụng để phân bổ các cuộc phỏng vấn việc làm dựa trên sơ yếu lý lịch, sẽ có hai loại lỗi, Loại I và Loại II. Đơn giản là chỉ ra rằng nói chung không thể cân bằng cả lỗi Loại I và Loại II trên hai nhóm người khác nhau (ví dụ: nam và nữ), vì vậy nhà phân tích phải chọn cái nào để cân bằng (hoặc cả hai). Xem Kleinberg, Mullainathan và Raghaven (2016) để phân tích thêm và phát triển tính công bằng vốn có trong thuật toán dự đoán. Nhìn chung, tài liệu về chủ đề này đã phát triển nhanh chóng trong hai năm qua và các tác giả hy vọng rằng khi các thuật toán ML được triển khai trong ngày càng nhiều ngữ cảnh, chủ đề sẽ tiếp tục phát triển. Các mô hình ML sẽ giúp phân bổ nguồn lực tốt hơn; các thuật toán có thể sử dụng nhiều thông tin hơn con người, và do đó giảm khả năng sai sót khi con người chỉ dựa vào các khuôn mẫu. Trong phạm vi mà các thuật toán không bị ràng buộc gây ra các hậu quả phân phối không mong muốn, thì có thể hạn chế các thuật toán. Tóm lại, các thuật toán có thể được đào tạo để tối ưu hóa các mục tiêu theo các ràng buộc, và do đó, việc áp đặt các mục tiêu xã hội lên các thuật toán có thể dễ dàng hơn so với các quyết định chủ quan của con người. 191
Vấn đề thứ hai, nảy sinh là tính ổn định của mô hình, ví dụ, để đáp ứng với sự thay đổi của mẫu hoặc sự thay đổi đến từ môi trường. Có rất nhiều ý tưởng liên quan trong học máy, bao gồm cả việc điều chỉnh miền (cách bạn làm cho một mô hình được đào tạo trong một môi trường hoạt động tốt trong môi trường khác), ―chuyển giao học tập‖ và những thứ khác. Mối quan tâm cơ bản là các thuật toán ML thực hiện các tìm kiếm toàn diện trên một số lượng rất lớn các biến quan sát đầu vào nhằm tìm kiếm mô hình tốt nhất dự đoán Y dựa trên X. Các mô hình sẽ tìm ra các mối quan hệ tinh tế giữa X và Y, một trong số đó có thể không ổn định xuyên thời gian hoặc trên các môi trường. Ví dụ: trong vài năm gần đây, có thể có nhiều video về mèo với đàn piano hơn là những video về chó với đàn piano. Do đó, sự hiện diện của cây đàn piano trong video có thể dự đoán mèo. Tuy nhiên, đàn piano không phải là đặc điểm cơ bản của loài mèo có khả năng giữ trong các môi trường, và vì vậy nếu xuất hiện hiện tượng khi chó chơi đàn piano, thì hiệu suất của thuật toán ML có thể bị ảnh hưởng. Đây có thể không phải là vấn đề đối với một công ty công nghệ sử dụng lại các mô hình của mình với dữ liệu mới hàng ngày, nhưng các mô hình dự đoán thường được sử dụng trong khoảng thời gian dài. Ví dụ, các mô hình chấm điểm tín dụng có thể được giữ cố định, vì việc thay đổi chúng khiến khó đánh giá rủi ro của nhóm người tiêu dùng chấp nhận tín dụng. Các mô hình tính điểm được sử dụng trong y học có thể được giữ cố định trong nhiều năm. Vấn đề thứ ba, khả năng thao túng. Trong ứng dụng sử dụng dữ liệu di động để chấm điểm tín dụng, một mối lo ngại là người tiêu dùng có thể lấy dữ liệu từ nhà cung cấp khoản vay (Bjorkegren và Grissen, 2017). Ví dụ, nếu một số kiểu hành vi nhất định giúp người tiêu dùng vay được khoản vay, thì họ sẽ tìm cách thay đổi để đạt được kiểu hành vi đó, chẳng hạn, nếu tiền trợ cấp được phân bổ cho các ngôi nhà trông nghèo nàn qua hình ảnh vệ tinh, các ngôi nhà hoặc làng mạc có thể sửa đổi diện mạo trên không của ngôi nhà đó để làm cho chúng trông kém hơn. Một lĩnh vực mở cho nghiên cứu trong tương lai liên quan đến cách hạn chế các mô hình ML để làm cho chúng ít bị thao túng hơn. Athey và Wager (2017) thảo luận về một số ví dụ khác điều này. Ngoài ra còn có những cân nhắc khác có thể được đưa vào ML bao gồm thời gian tính toán, chi phí thu thập và duy trì ―các tính năng‖ được sử dụng trong một mô hình, v.v. Ví dụ, các hãng công nghệ đôi khi sử dụng các mô hình đơn giản để giảm thời gian phản hồi cho các yêu cầu thông tin của người dùng theo thời gian thực. Nhìn chung, dự đoán của các tác giả là các nhà khoa học xã hội, đặc biệt là các nhà kinh tế sẽ đóng góp rất nhiều vào việc xác định các loại vấn đề, các hạn chế trong các nghiên cứu 192
hiện tại và đề xuất giải pháp cho chúng. Điều này không chỉ giúp việc ứng dụng ML trong chính sách tốt hơn mà còn tạo ra nguồn phong phú cho các nghiên cứu tiếp theo. 4 Những đề xuất về nghiên cứu Học máy Mặc dù Học máy với những công cụ và giải thuật có ứng dụng rất lớn trong nghiên cứu kinh tế trên nhiều lĩnh vực: tài chính, ngân hàng, tiếp thị, thương mại, du lịch, phân tích chính sách, chiến lược nhưng vẫn tồn tại những hạn chế khi áp dụng. Dưới đây chúng tôi đưa ra những hạn chế và đề xuất cách khắc phục cũng như hướng nghiên cứu mới trong tương lai nhằm cải thiện hiệu quả và tận dụng được tối ưu các mô hình Học máy. Các mô hình Học máy thường đòi hỏi số lượng quan sát đủ lớn để huấn luyện và làm tập kiểm tra. Đây là một rào cản lớn đối với việc áp dụng ML trong các lĩnh vực như kinh tế vĩ mô, bởi vì chỉ có một số quan sát hạn chế tồn tại (ví dụ, 50-100). (Dietterich, 2000) lập luận rằng việc áp dụng một phương pháp học máy kết hợp có thể giảm thiểu rủi ro liên quan đến việc thiếu dữ liệu. Nếu không có đủ dữ liệu, nhiều giả thuyết có cùng độ chính xác về huấn luyện có thể được chọn làm thuật toán. Do đó, các phương pháp kết hợp có thể giảm nguy cơ chọn sai mô hình bằng cách tổng hợp tất cả các mô hình như vậy. Hơn nữa, một biện pháp khắc phục khác được đề xuất là sử dụng lý thuyết kinh tế như một hướng dẫn để lựa chọn biến số phù hợp. Cách tiếp cận này đã được áp dụng để dự báo các biến số kinh tế vĩ mô như lạm phát và thất nghiệp, ví dụ Moshiri và cộng sự (1999), Moshiri và Cameron (2000), và Moshiri và Brown (2004) và cũng có thể được sử dụng trong các trường hợp như năng lượng tiêu thụ khi tần số dữ liệu thấp. Kết hợp một mô hình lý thuyết với các kỹ thuật ML là hướng đi cho nghiên cứu ML nói chung. Ví dụ, Gu và cộng sự (2018) đánh giá một số thuật toán ML và kết luận rằng chúng có thể cải thiện mô tả hành vi giá tài sản, đặc biệt là đo lường rủi ro so với các phương pháp kinh tế lượng truyền thống. Trong một số lĩnh vực kinh tế năng lượng (ví dụ, thị trường điện, nhu cầu phục hồi, đầu tư tối ưu), lý thuyết đưa ra hướng dẫn rõ ràng cho phân tích thực nghiệm. Các tác giả không tìm thấy bất kỳ bài báo lớn nào có chứa cả mô hình lý thuyết vi mô và mô hình ML. Do đó, đây là một câu hỏi mở và là cơ hội để mở rộng hướng phân tích trong tương lai theo hướng đạt được dữ liệu minh bạch và ứng dụng mạnh mẽ hơn. Bên cạnh đó, về mặt giải thuật các tiến bộ gần đây trong các kỷ thuật của Học sâu đang thực sự cách mạng hóa toàn bộ không gian ML. Nhờ cấu trúc nhiều lớp của chúng, các phương pháp DL cho phép thuật toán xử lý số lượng đầu vào lớn với độ chính xác cao. Các phương pháp DL rất có lợi khi xử lý một tập hợp lớn các quan sát ví dụ dữ liệu giao dịch trong ngày hay dữ liệu hình ảnh dựa trên GIS. 193
Một điều đáng chú ý là các học giả và nhà nghiên cứu doanh nghiệp thường xuyên sử dụng các kỹ thuật ML để hình thành các phương pháp dự đoán thị trường kinh tế trong tương lai và đưa ra một hệ thống giao dịch hiệu quả để tối đa hóa lợi nhuận (Choudhury và cộng sự, 2014). Đặc biệt, trong vài năm gần đây, ngày càng có nhiều nhà nghiên cứu khai thác các phương pháp ML trong biến động giá cả và biến động của các loại công cụ tài chính khác nhau (Cavalcante và cộng sự, 2016). Tuy nhiên, các bài báo, tài liệu về việc sử dụng các kỹ thuật ML để dự báo và thực hiện chiến lược giao dịch trên thị trường kinh tế năng lượng vẫn còn rất hạn chế. Và đây cũng là vấn đề mở cho các hướng nghiên cứu ứng dụng ML trong tương lai. Một hạn chế quan trọng của các tài liệu hiện tại về sử dụng ML trong kinh tế là một số bài báo nhấn mạnh quan điểm khoa học máy tính, tối ưu hóa các tham số tính toán trong khi quan điểm kinh tế hoặc tài chính có thể bị bỏ qua. Trong khi đó một số tài liệu khác tập trung vào ý nghĩa kinh tế hoặc tài chính mà không khám phá hết khả năng của các thuật toán để giải thích vấn đề đang nghiên cứu. Vì vậy những nghiên cứu vừa tận dụng được cả hai ý nghĩa kinh tế và phân tích thuật toán để giải quyết bài toán nên là xu hướng để phát triển. Một khía cạnh nữa là hầu hết các bài báo được đánh giá đều sử dụng các thuật toán học có giám sát trong khi việc áp dụng các phương pháp học không giám sát vào các lĩnh vực khác nhau như tiếp thị và quản lý rủi ro là rất hạn chế. Các vấn đề liên quan đến tiếp thị và quản lý khách hàng có thể được giải quyết bằng cách sử dụng các kỹ thuật phân nhóm như K-means để phân khúc khách hàng theo các đặc điểm nhân khẩu học hoặc hành vi khác nhau và khả năng họ vỡ nợ hoặc chuyển đổi công ty. Trong lĩnh vực quản lý rủi ro năng lượng, có thể xác định các sự kiện không mong muốn và hạn chế chúng bằng cách sử dụng các thuật toán xếp hạng hoặc phân tích thành phần chính của ML. 5 Kết luận Việc sử dụng Học máy để giải quyết các vấn đề liên quan đến kinh tế đang gia tăng đáng kể. ML đã cho thấy những đóng góp lớn vào sự tiến bộ của các mô hình kinh tế mới và các giải pháp dựa trên dữ liệu. Cung cấp các phương pháp khoa học tiên tiến mô tả một hình ảnh rõ ràng về dữ liệu trong các lĩnh vực liên quan đến kinh tế. Do đó, mục tiêu chính của nghiên cứu này là đánh giá, tổng hợp những ứng dụng trong kinh tế học trong rất nhiều lĩnh vực từ thị trường chứng khoán, tiếp thị, tiền điện tử, đến các ngành mới nổi gần đây như kinh tế năng lượng, phân tích chính sách, chiến lược. Bài tham luận của các tác giả cung cấp cái nhìn khái quát về Học máy cũng như những ứng dụng của nó dựa trên các tài liệu nghiên cứu trước đây. Nó góp phần cung cấp những hiểu biết về lĩnh vực theo chính các tác giả đó là những giải thuật và phương pháp hữu ích cho nghiên cứu kinh tế. Các tác giả thông qua 194
bài viết cũng đề cập đến các phương pháp Học máy đơn cũng như các phương pháp học máy kết hợp để đa dạng hóa các giải thuật giải quyết các bài toán thực tế hiệu quả hơn. Đồng thời, những hạn chế của Học máy và những ý tưởng đề xuất của các tác giả là cơ sở cho những nghiên cứu mở rộng đối với việc ứng dụng Học máy trong tương lai. TÀI LIỆU THAM KHẢO 1. Altan, A.; Karasu, S.; Bekiros, S., 2019, "Digital currency forecasting with chaotic meta-heuristic bio-inspired signal processing techniques", Chaos Solitons Fractals 2019, 126, 325–336. 2. Anifowose, F. A., J. Labadin, and A. Abdulraheem, 2017, "Ensemble machine learning: An untapped modeling paradigm for petroleum reservoir characterization", Journal of Petroleum Science and Engineering 151, 480–487. 3. Ardabili, S.; Mosavi, A.; Várkonyi-Kóczy, A.R, 2019, "Advances in machine learning modeling reviewing hybrid and ensemble methods", In Proceedings of the International Conference on Global Research and Education; Springer: Cham, Switzerland; pp. 215– 227. 4. Athey, S., G. Imbens, T. Pham, and S. Wager, 2017, ―Estimating Average Treatment Eﬀ ects: Supplementary Analyses and Remaining Challenges‖, American Economic Review 107 (5): 278– 81. 5. Athey, S., and S. Wager. 2017. ―Efcient Policy Estimation‖, Cornell University Library. https:// arxiv .org/ abs/ 1702.02896. 6. Bjorkegren, D., and D. Grissen, 2017, ―Behavior Revealed in Mobile Phone Usage Predicts Loan Repayment , SSRN Electronic Journal, https:// www .research gate .net/ publication 321902459_Behavior_Revealed_in_Mobile_Phone_Usage Predicts_Loan_Repayment. 7. Cavalcante, R. C., R. C. Brasileiro, V. L. Souza, J. P. Nobrega, and A. L. Oliveira, 2016, "Computational intelligence and financial markets: A survey and future directions", Expert Systems with Applications 55, 194–211. 8. Choudhury, S., S. Ghosh, A. Bhattacharya, K. J. Fernandes, and M. K. Tiwari, 2014, "A real time clustering and SVM based price-volatility prediction for optimal trading strategy", Neurocomputing 131, 419–426. 9. Chong, E.; Han, C.; Park, F.C.,2017, "Deep learning networks for stock market analysis and prediction: Methodology, data representations, and case studies", Expert Syst. Appl, 83, 187–205. 195
10. Cheng, F., T. Li, Y.-m. Wei, and T. Fan, 2018, "The VEC-NAR model for short-term forecasting of oil prices", Energy Economics. doi: 10.1016/j.eneco.2017.12.035. 11. Casalino, G.; Castellano, G.; Consiglio, A.; Liguori, M.; Nuzziello, N.; Primiceri, D, 2017, " A Predictive Model for MicroRNA Expressions in Pediatric Multiple Sclerosis Detection", In Proceedings of the International Conference on Modeling Decisions for Artificial Intelligence; Springer: Cham, Switzerland; pp. 177–188. 12. Dietterich, T. G., 2000, "Ensemble methods in machine learning. In International workshop on multiple classifier systems", pp. 1–15. Springer. doi: 10.1007/3-540- 45014-9_1. 13. Dingli, A.; Fournier, K.S., 2017, "Financial time series forecasting—A deep learning approach", Int. J. Mach. Learn. Comput.,7, 118–122. 14. Dingli, A.; Marmara, V.; Fournier, N.S., 2017, "Comparison of deep learning algorithms to predict customer churn within a local retail industry", Int. J. Mach. Learn. Comput., 7, 128–132. 15. Ding, Y., 2018, "A novel decompose-ensemble methodology with AIC-ANN approach for crude oil forecasting", Energy 154, 328–336. 16. Gupta, S., R. Kambli, S. Wagh, and F. Kazi, 2015, "Support-vector-machine-based proactive cascade prediction in smart grid using probabilistic framework", IEEE Transactions on Industrial Electronics 62 (4), 2478–2486. 17. Goel, S., J. M. Rao, and R. Shroﬀ , 2016,―Precinct or Prejudice? Understanding Racial Disparities in New York City’s Stop- and- Frisk Policy‖, Annals of Applied Statistics 10 (1): 365– 94. 18. Glaeser, E. L., A. Hillis, S. D. Kominers, and M. Luca, 2016, ―Predictive Cities Crowdsourcing City Government: Using Tournaments to Improve Inspection Accuracy‖, American Economic Review 106 (5): 114– 18. 19. Go, Y.H.; Hong, J.K., 2019, "Prediction of stock value using pattern matching algorithm based on deep learning", Int. J. Recent Technol. Eng, 8, 31–35. 20. Glaeser, E. L., S. D. Kominers, M. Luca, and N. Naik, 2015, ―Big Data and Big Cities: The Promises and Limitations of Improved Measures of Urban Life‖, NBER Working Paper no. 21778, Cambridge, MA. 21. Gu, S., B. T. Kelly, and D. Xiu, 2018, "Empirical asset pricing via machine learning". 22. Fister, D.; Mun, J.C.; Jagric, V.; Jagric, T., 2019, "Deep learning for stock market trading: A superior trading strategy?‖, Neural Netw. World 2019, 29, 151–171. 196
23. Heinermann, J. and O. Kramer, 2016, "Machine learning ensembles for wind power prediction", Renewable Energy 89, 671–679. 24. Jiang, Z.; Liang, J., 2017, "Cryptocurrency portfolio management with deep reinforcement learning", In Proceedings of the 2017 Intelligent Systems Conference (IntelliSys), London, UK, 7–8 September 2017; pp. 905–913. 25. Kleinberg, J., J. Ludwig, S. Mullainathan, and Z. Obermeyer, 2015, ―Prediction Policy Problems‖, American Economic Review 105 (5): 491– 95. 26. Kleinberg, J., S. Mullainathan, and M. Raghavan, 2016, ―Inherent Trade- Oﬀ s in the Fair Determination of Risk Scores‖, Cornell University Library, https:// arxiv.org/ abs/ 1609.05807. 27. Jurado, S., À. Nebot, F. Mugica, and N. Avellana, 2015, "Hybrid methodologies for electricity load forecasting: Entropy-based feature selection with machine learning and soft computing techniques", Energy 86, 276–291. 28. Lahmiri, S.; Bekiros, S., 2019, "Cryptocurrency forecasting with deep learning chaotic neural networks", Chaos Solitons Fractals 2019, 118, 35–40. 29. Marugán, A. P., F. P. G. Márquez, J. M. P. Perez, and D. Ruiz-Hernández, 2018, "A survey of artificial neural network in wind energy systems", Applied Energy 228, 1822–1836. 30. Mosavi, A.; Edalatifar, M, 2018, "A hybrid neuro-fuzzy algorithm for prediction of reference evapotranspiration", In Proceedings of the International Conference on Global Research and Education; Springer: Cham, Switzerland, pp. 235–243. 31. Mosavi, A.; Shamshirband, S.; Salwana, E.; Chau, K.-w.; Tah, J.H, 2019, "Prediction of multi-inputs bubble column reactor using a novel hybrid model of computational fluid dynamics and machine learning", Eng. Appl. Comput. Fluid Mech.13, 482–492. 32. Moshiri, S., N. E. Cameron, and D. Scuse, 1999, "Static, dynamic, and hybrid neural networks in forecasting inflation", Computational Economics 14 (3), 219–235. 33. Moshiri, S. and N. Cameron, 2000, "Neural network versus econometric models in forecasting inflation", Journal of forecasting 19 (3), 201–217. 34. Moshiri, S. and L. Brown, 2004, "Unemployment variation over the business cycles: a comparison of forecasting models", Journal of Forecasting 23 (7), 497–511. 35. Naik, N., S. D. Kominers, R. Raskar, E. L. Glaeser, and C. A. Hidalgo, 2017, ―Computer Vision Uncovers Predictors of Physical Urban Change‖, Proceedings of the National Academy of Sciences 114 (29): 7571– 76. 197
36. Nosratabadi, S.; Karoly, S.; Beszedes, B.; Felde, I.; Ardabili, S.; Mosavi, 2020, "A. Comparative Analysis of ANN-ICA and ANN-GWO for Crop Yield Prediction", In Proceedings of the 2020 RIVF International Conference on Computing and Communication Technologies (RIVF), Ho Chi Minh, Vietnam, 14–15 October 2020. 37. Paolanti, M.; Romeo, L.; Martini, M.; Mancini, A.; Frontoni, E.; Zingaretti, P., 2019, "Robotic retail surveying by deep learning visual and textual data", Robot. Auton. Syst., 118, 179–188. 38. Saeed Nosratabadi, Amirhosein Mosavi, Puhong Duan, Pedram Ghamisi, Ferdinand Filip, Shahab S. Band, Uwe Reuter, Joao Gama and Amir H. Gandomi, 2020, "Data Science in Economics: Comprehensive Review" of Advanced Machine Learning and Deep Learning Methods, MDPI, Basel, Switzerland, 2020. 39. Sim, H.S.; Kim, H.I.; Ahn, J.J, 2019, " Is Deep Learning for Image Recognition Applicable to Stock Market Prediction?", Complexity 2019. 40. Song, Y.; Lee, J.W.; Lee, J., 2019, "A study on novel filtering and relationship between input-features and target-vectors in a deep learning model for stock price prediction", Appl. Intell, 49, 897–911. 41. Tamura, K.; Uenoyama, K.; Iitsuka, S.; Matsuo, Y, 2018, "Model for evaluation of stock values by ensemble model using deep learning", Trans. Jpn. Soc. Artif. Intell, p 33. 42. Tashiro, D.; Matsushima, H.; Izumi, K.; Sakaji, H., 2019, "Encoding of high-frequency order information and prediction of short-term stock price by deep learning", Quant. Financ, 19, 1499–1506. 43. Torabi, M.; Mosavi, A.; Ozturk, P.; Varkonyi-Koczy, A.; Istvan, V., 2018, "A hybrid machine learning approach for daily prediction of solar radiation", In Proceedings of the International Conference on Global Research and Education; Springer: Cham, Switzerland, pp. 266–274. 44. Torabi, M.; Hashemi, S.; Saybani, M.R.; Shamshirband, S.; Mosavi, A. A Hybrid clustering and classification technique for forecasting short-term energy consumption. Environ. Prog. Sustain. Energy 2019, 38, 66–76. 45. Voyant, C., G. Notton, S. Kalogirou, M.-L. Nivet, C. Paoli, F. Motte, and A. Fouilloy, 2017, "Machine learning methods for solar radiation forecasting: A review", Renewable Energy 105, 569–582. 46. Vũ Hữu Tiệp, 2018, "Machine Learning cơ bản", Nxb, khoa học và kỷ thuật. 198
47. Wang, W.; Li, W.; Zhang, N.; Liu, K., 2020, "Portfolio formation with preselection using deep learning from long-term financial data", Expert Syst. Appl, 143, 113042. 48. Yu, L., S. Wang, and K. K. Lai, 2008, "Forecasting crude oil price with an EMD-based neural network ensemble learning paradigm", Energy Economics 30 (5), 2623–2635. 49. Yu, L., H. Xu, and L. Tang, 2017, "LSSVR ensemble learning with uncertain parameters for crude oil price forecasting", Applied Soft Computing 56, 692–701. 50. Zaidi, S. M. A., V. Chandola, M. R. Allen, J. Sanyal, R. N. Stewart, B. L. Bhaduri, and R. A. McManamay, 2018, "Machine learning for energy-water nexus: challenges and opportunities", Big Earth Data 2(3), 228–267. 51. Zendehboudi, S., N. Rezaei, and A. Lohi, 2018, "Applications of hybrid models in chemical, petroleum, and energy systems: A systematic review", Applied Energy 228, 2539–2566. 52. Zeng, Y., J. Liu, K. Sun, and L.-w. Hu, 2018, "Machine learning based system performance prediction model for reactor control", Annals of Nuclear Energy 113, 270– 278. 53. Zhao, Y., J. Li, and L. Yu , 2017, "A deep learning ensemble approach for crude oil price forecasting", Energy Economics 66, 9–16. 199