Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử
Bạn đang xem tài liệu "Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- mot_so_phuong_phap_goi_y_va_ung_dung_trong_thuong_mai_dien_t.pdf
Nội dung text: Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử
- Vietnam J. Agri. Sci. 2021, Vol. 19, No. 4: 520-534 Tạp chí Khoa học Nông nghiệp Việt Nam 2021, 19(4): 520-534 www.vnua.edu.vn MỘT SỐ PHƯƠNG PHÁP GỢI Ý VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ Hoàng Thị Hà1*, Ngô Nguyễn Thức2 1Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam 2Sinh viên K57 - Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam *Tác giả liên hệ: htha@vnua.edu.vn Ngày nhận bài: 20.07.2020 Ngày chấp nhận đăng: 29.03.2020 TÓM TẮT Hệ gợi ý (Recommender System) là công cụ được thiết kế nhằm cung cấp những khuyến nghị hữu ích về sản phẩm, dịch vụ, cho người dùng. Hệ gợi ý dựa trên dữ liệu về mối quan hệ giữa người dùng, sản phẩm và các hành vi của người dùng trong quá khứ đối với sản phẩm để đưa ra những gợi ý thông minh, phù hợp với sở thích của từng khách hàng. Hệ gợi ý giúp khách hàng nhanh chóng định vị được những sản phẩm họ quan tâm để từ đó đưa ra quyết định đúng đắn khi mua sắm online. Trong bài báo này, chúng tôi trình bày tổng quan một số phương pháp gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu quả thực hiện của mỗi phương pháp. Chúng tôi chỉ ra lợi ích mà các hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu ra những thách thức và giải pháp khắc phục. Kết quả thực nghiệm của chúng tôi trên 4 tập dữ liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy mỗi phương pháp đều có những ưu điểm và hạn chế riêng, không có phương pháp nào là tốt nhất trên tất cả các tiêu chí. Ngoài ra, chúng tôi cũng đưa ra quy trình chung để xây dựng hệ gợi ý trong các website thương mại và thực hiện tích hợp các kỹ thuật hệ gợi ý trong website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm mới (vấn đề này còn gọi là “Cold start problem”) của các phương pháp gợi ý cá nhân hóa. Từ khóa: Hệ gợi ý, lọc cộng tác, gợi ý dựa trên nội dung, hệ gợi ý kết hợp, thương mại điện tử. Some Methods of Recommender System and its Application in E-Commerce ABSTRACT The designed recommender system is a tool to provide important suggestions forusers or customers. Based on the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online. In this article, we present an overview of some methodologies of recommendation systems, techniques of recommender systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of recommender systems in e-commerce. Moreover, we report some challenges that the recommender systems are facing and list some solutions to solve these challenges. Our experimental results on the four datasets (Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all evaluation metrics. Finally, we built an e-commerce website that integrated some different techniques of recommender systems such as non-personalized methods, personalized methods to recommend the right product for each customer. The experimental system gives some diverse suggestions to overcome the problem "Cold start problem" of personalized methods. Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce. đổi hình thĀc giao dðch truyền thống. Ngày càng 1. ĐẶT VẤN ĐỀ có nhiều ngþąi lăa chọn hình thĀc mua sím trăc Trong nhĂng nëm gæn đåy, cùng vĆi să phổ tuyến. Trong khi đò, để mć rộng thð trþąng kinh biến cûa mäng Internet và máy tính, thþĄng doanh, các doanh nghiệp đã xåy dăng Āng dýng mäi điện tā đã phát triển nhanh chóng trên thþĄng mäi điện tā và cung cçp rçt nhiều sân phäm vi toàn cæu. ThþĄng mäi điện tā đã thay phèm trên website. Tuy nhiên, khi thông tin 520
- Hoàng Thị Hà, Ngô Nguyễn Thức quá nhiều, khách hàng sẽ tốn thąi gian để tìm động đþa ra nhĂng gợi ý thông minh, đa däng sân phèm họ cæn. Điều này, làm giâm să hài tĆi ngþąi dùng. lòng và să trung thành cûa khách. Để giâi quyết vçn đề này, ý tþćng chính cûa các chuyên gia 2. CÁC KỸ THUẬT HỆ GỢI Ý thþĄng mäi điện tā là thiết lêp hệ thống gợi ý thông minh nhìm khám phá ra các mặt hàng Các kỹ thuêt hệ gợi ý thþąng đþợc chia phù hợp nhçt cho tÿng ngþąi dùng. VĆi hệ thống thành hai nhóm chính là: hệ gợi ý cá nhân hóa gợi ý tă động, khách hàng có thể nhanh chóng và hệ gợi ý không cá nhân hóa. Chúng tôi têp truy cêp đþợc sân phèm hợp vĆi sć thích và nhu trung giĆi thiệu tóm tít phþĄng pháp gợi ý cæu cûa họ, tiết kiệm thąi gian tìm sân phèm không cá nhân hóa và một số thuêt toán gợi ý cá cho ngþąi dùng (Thomas, 2006). nhân hóa tiêu biểu thþąng đþợc sā dýng trong NhĂng nëm gæn đåy, các kỹ thuêt hệ gợi đã các trang thþĄng mäi điện tā. và đang đþợc nghiên cĀu, Āng dýng ć nhiều lïnh văc. Trong thþĄng mäi điện tā, hệ gợi ý mang 2.1. Hệ gợi ý không cá nhân hóa (non- läi nhiều lợi ích cho câ ngþąi cung cçp dðch vý personalized recommender systems ) và ngþąi sā dýng dðch vý (Ionos, 2017). Hæu hết Là nhòm phþĄng pháp không dăa vào hồ sĄ các công ty thþĄng mäi lĆn nhþ: Amazon cá nhân tÿng khách hàng mà chî dăa vào đặc (Amazon.com), CDNOW (www.cdnow.com), tính cûa sân phèm (sân phèm mĆi) và đánh giá eBay (eBay.com), Alibaba (Alibaba.com), tÿ cộng đồng nhþ: sân phèm bán chäy nhçt, sân MovieFinder (MovieFinder.com), Youtube.com, phèm đþợc đánh giá tốt nhçt,„ (Singh, 2019) Facebook.com,„ đều sā dýng các kỹ thuêt gợi ý trong website cûa họ để nâng cao trâi nghiệm 2.2. Hệ gợi ý cá nhân hóa (personalized cho khách hàng, nâng cao chçt lþợng dðch vý và recommender systems) tëng doanh thu bán hàng. Tuy nhiên, ć Việt Nam - một quốc gia có rçt nhiều tiềm nëng về Nhòm phþĄng pháp này đþợc đánh giá là thþĄng mäi điện tā (Viễn Thông, 2020) läi có số mang läi hiệu quâ cao đối vĆi thþĄng mäi điện tā. lþợng website thþĄng mäi tích hợp hệ gợi ý Nếu doanh nghiệp hiểu rõ tÿng khách hàng cûa không nhiều (Nguyễn Hùng Düng & Nguyễn mình dăa trên nhĂng gì họ tþĄng tác và mua Thái Nghe, 2013). Hiện Việt Nam đang cò 44% hàng trên mäng, doanh nghiệp có thể tþ vçn cho doanh nghiệp đã tham gia xåy dăng website khách hàng nhĂng sân phèm phù hợp vĆi mong thþĄng mäi, nhþng chî có 32% doanh nghiệp muốn và sć thích cûa khách hĄn (Google & đþợc đánh giá cao kênh bán hàng thông qua Temasek, 2018). Khách hàng sẽ tiết kiệm đþợc trang web (Nguyễn Thanh Hþng, 2019). thąi gian tìm kiếm sân phèm, mua đþợc nhĂng mòn hàng đúng sć thích. Tÿ đò, doanh nghiệp sẽ Bài báo này trình bày tổng quan các tëng đþợc số lþợng ngþąi mua hàng, tëng giá trð phþĄng pháp gợi ý, đánh giá hiệu quâ cûa các đĄn hàng, tëng doanh số bán hàng. thuêt toán gợi ý (Content-based, user-based và item-based) trên một số têp dĂ liệu chuèn bao Theo nghiên cĀu cûa Schafer & cs. (2001), gồm: Movielens, Epinions, BookCrossing và nếu doanh nghiệp sā dýng phþĄng pháp gợi ý cá LastFM. Chúng tôi thâo luên nhĂng điểm nhân hòa để gāi email tĆi khách hàng thì tỷ lệ mänh, điểm yếu cûa mỗi phþĄng pháp, thách giao dðch thông qua email cao hĄn gçp hai læn thĀc và giâi pháp khíc phýc khi xây dăng hệ gợi so vĆi các email đþợc gāi không áp dýng phþĄng ý trong thþĄng mäi điện tā. Đồng thąi, chúng tôi pháp này (Stephan, 2019). Do đò, các phþĄng đþa ra quy trình xåy dăng hệ gợi ý trong các pháp gợi ý cá nhån hòa làm tëng mĀc độ tþĄng website thþĄng mäi và thăc hiện cài đặt các kỹ tác và chuyển đổi trong giao dðch thþĄng mäi thuêt hệ gợi ý trong website thþĄng mäi điện tā. điện tā. Kết quâ cài đặt cho thçy, khi website đþợc tích Một số phþĄng pháp gợi ý thuộc loäi cá hợp các phþĄng pháp hệ gợi ý hệ thống sẽ tă nhân hóa nhþ sau: 521
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử 2.2.1. Gợi ý dựa trên nội dung (Content- ngþąi dùng đò kết hợp quan điểm cûa nhĂng based filtering) ngþąi dùng khác. Đåy là kỹ thuêt mänh và đã đþợc áp dýng khá thành công trong các hệ PhþĄng pháp gợi ý này dăa trên mô tâ cûa thống thþĄng mäi lĆn. Lọc cộng tác thu thêp sân phèm và profile cûa tÿng ngþąi dùng phân hồi tÿ nhiều ngþąi dùng đối vĆi sân phèm, (không quan tåm đến ngþąi dùng khác). Gợi ý dăa trên nội dung sẽ thu thêp hồ sĄ cûa ngþąi lþu trĂ phân hồi cûa ngþąi dùng dþĆi däng ma dùng: họ tên, giĆi tính, nghề nghiệp và tþĄng trên ngþąi dùng (users) - sân phèm (items). Mỗi tác cûa cá nhån ngþąi dùng trên các sân phèm, dòng là một vectĄ chĀa giá trð phân hồi cûa sau đò so sánh đặc điểm các sân phèm trong cĄ ngþąi dùng đối vĆi các sân phèm. Sau đò, tính sć dĂ liệu vĆi đặc điểm các sân phèm mà khách độ tþĄng tă giĂa các users hoặc giĂa các items hàng đã quan tåm để gợi ý cho khách hàng. trong hệ thống, tìm ra mối tþĄng quan và đþa ra gợi ý phù hợp. Độ tþĄng tă giĂa các user hoặc 2.2.2. Lọc cộng tác (Collaborative giĂa các item đþợc tính theo công thĀc Cosin Filtering - CF) hoặc Pearson. Lọc cộng tác gợi ý sân phèm tĆi ngþąi dùng Bâng 1 là ma trên biểu diễn đánh giá cûa dăa trên lðch sā tþĄng tác sân phèm cûa chính ngþąi dùng trên các sân phèm. Hình 1. Mô hình hệ gợi ý dựa trên nội dung Bâng 1. Ma trận biểu diễn người dùng - sân phẩm của tiếp cận lọc cộng tác 522
- Hoàng Thị Hà, Ngô Nguyễn Thức Cò hai phþĄng pháp lọc cộng tác: mäi điện tā lĆn nhþ Amazon, Tiki, Youtube User-based: Dă đoán dăa trên să tþĄng tă và Facebook. giĂa các users. Ý tþćng quan trọng cûa phþĄng 2.2.3. Phương pháp kết hợp pháp này là nhĂng khách hàng tþĄng tă có xu (hybrid method) hþĆng sā dýng nhĂng sân phèm tþĄng tă (Singh & Pramod, 2019). Nếu hai khách hàng A, PhþĄng pháp này kết hợp giĂa kỹ thuêt gợi B có lðch sā đánh giá các sân phèm tþĄng tă ý dăa trên nội dung và lọc cộng tác. Kỹ thuêt này đþợc xem là khá hiệu quâ và giâi quyết nhau thì User-basedsẽ dă đoán khách hàng A đþợc vçn đề “cold - start problem” trong rçt có khâ nëng sẽ quan tâm tĆi nhĂng sân phèm nhiều nghiên cĀu. Trang thþĄng mäi điện tā chþa đþợc trâi nghiệm nhþng đã đþợc khách điển hình đã Āng dýng phþĄng pháp này là hàng B thích và ngþợc läi. PhþĄng pháp này Spotify.com. Họ đã tích hợp phþĄng pháp hệ gợi phân tích ma trên user-item để tìm ra nhĂng ý tổng hợp để täo ra danh sách các bài hát hàng ngþąi dùng tþĄng tă. tuæn cho tÿng khách hàng riêng biệt. Website Item-based : Dă đoán dăa trên să tþĄng tă đã tổng hợp dĂ liệu ngþąi dùng dăa trên thói giĂa các items. Hai sân phèm i và i’ đã đþợc quen nghe nhäc và nhĂng ngþąi dùng tþĄng tă cộng đồng đánh giá tþĄng tă nhau thì có thể sẽ để täo ra một danh sách các bài hát độc đáo phù đþợc đánh giá tþĄng tă bći nhĂng ngþąi dùng hợp vĆi sć thích cûa tÿng khách hàng. còn läi. PhþĄng pháp này phån tích ma trên user-item để nhên diện các sân phèm tþĄng tă. 2.3. Mục tiêu của các phương pháp gợi ý Ngày nay, kỹ thuêt lọc cộng tác đþợc sā Mýc tiêu cûa các phþĄng pháp gợi ý đþợc dýng khá phổ biến trên các trang thþĄng thể hiện trong bâng 2. Hình 2.Tiến trình lọc cộng tác Hình 3. Lọc cộng tác dựa trên User-based và Item-based 523
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Hình 4. Mô hình hệ gợi ý kết hợp Bâng 2. Mục tiêu khái niệm của các phương pháp gợi ý Phương pháp (Methods) Mục tiêu (concept goals) Đầu vào (Inputs) Gợi ý không cá nhân hóa Gợi ý những sản phẩm mà người dùng có thể thích (Non-personalized dựa trên sản phẩm mới hoặc ý kiến cộng đồng. recommender systems) Lọc dựa trên nội dung Gợi ý những sản phẩm khách hàng có thể thích dựa Thuộc tính (item attributes) của sản phẩm (Content-based filtering) trên hồ sơ cá nhân của người dùng và độ tương tự hoặc Profiles của người dùng. giữa các sản phẩm trong cơ sở dữ liệu với những sản phẩm mà khách hàng đã thích trong quá khứ. Lọc cộng tác (Collaborative Gợi ý những sản phẩm mà người dùng có thể thích Đánh giá của User + Đánh giá của cộng Filtering) dựa trên những người dùng có sở thích tương tự. đồng Phương pháp kết hợp Gợi ý những sản phẩm mà người dùng có thể thích Thuộc tính của sản phẩm+ đánh giá của (Hybrid method) dựa trên việc kết hợp Content-based filtering và Users và cộng đồng. Collaborative Filtering. 3. VAI TRÒ CỦA HỆ GỢI Ý TRONG - Xây dăng lòng trung thành (Building THƯƠNG MẠI ĐIỆN TỬ Loyalty): Trong chiến lþợc kinh doanh, việc đät đþợc lòng trung thành cûa ngþąi tiêu dùng là Trong thþĄng mäi điện tā, hệ gợi ý đòng vai một điều cæn thiết. Khi lòng trung thành cûa trñ nhþ một “chuyên gia” thông minh hỗ trợ khách hàng tëng lên, lợi nhuên cüng sẽ tëng lên khách hàng trong quá trình tìm và chọn mua (Reichheld & F., 1993). Các hệ thống gợi ý câi sân phèm. Hệ gợi ý thúc đèy thþĄng mäi điện tā tiếnlòng trung thành bìng cách tìm hiểu, thu (Schafer & cs., 2001) theo các cách sau: thêp thông tin, nhu cæu, sć thích và các mối - Chuyển khách vãng lai thành ngþąi mua quan tâm cûa khách. Tÿ đò, sā dýng các thuêt hàng (Converting Browsers into Buyers): Khách toán thông minh cá nhån hòa để gợi ý phù hợp vãng lai thþąng ghé thëm website để xem trang chotÿng khách hàng, giúp họ hài lòng, có niềm web mà không mua hàng. Các hệ thống gợi ý sẽ tin quay läi trang web để mua hàng. hiểu nhu cæu cûa khách, hiển thð nhĂng sân VĆi nhĂng khâ nëng trên, hệ gợi ý mang läi phèm mà khách thích, hoặc đang muốn tìm trâi nghiệm tốt cho khách hàng, giúp khách mua. Bìng cách này, hệ thống sẽ chuyển nhĂng hàng giâm thąi gian tìm kiếm sân phèm, nâng khách vãng lai thành khách mua hàng. cao tỷ lệ chuyển đổi mua hàng, câi thiện việc bó - Tëng cþąng bán chéo (Increasing Cross- gió hàng và giĂ khách quay trć läi mua hàng. sell): Các hệ thống gợi ý câi thiện bán chéo bìng Tÿ đò, hệ gợi ý giúp các thþĄng nhån tëng giá cách đề xuçt các mặt hàng liên quan đến sân trð đĄn hàng trung bình, tëng doanh thu phèm, các sân phèm phý kiện bổ sung cho bán hàng (Dias & cs., 2008; Jordan, 2016; khách mua hàng. Stephan, 2019). 524
- Hoàng Thị Hà, Ngô Nguyễn Thức 4. THÁCH THỨC CỦA HỆ GỢI Ý TRONG website, lþợng khách hàng đánh giá trênsân THƯƠNG MẠI ĐIỆN TỬ VÀ GIẢI PHÁP phèm rçt ít, nên các thuêt toán gợi ý khò đoán KHẮC PHỤC đþợc sć thích cûa ngþąi dùng. Đåy cüng là một vçn đề lĆn cûa các hệ gợi ý (Sharma & Gera, 4.1. Vấn đề khách hàng mới, sân phẩm mới 2013). Bći dĂ liệu phâi đû lĆn các thuêt toán gợi (Cold-startproblem) ý mĆi có nhĂng gợi ý chính xác. Các nhà khoa học Một trong nhĂng thách thĀc đối vĆi bçt kỳ đã và đang cố gíng nghiên cĀu để làm giâm vçn hệ thống gợi ý nào là vçn đề ngþąi dùng mĆi (new đề này, nhþng hiện vén còn là một bài toán khó user) hoặc sân phèm mĆi (new item). Hồ sĄ cûa cæn đþợc nghiên cĀu nhiều hĄn. DþĆi đåy là một ngþąi dùng rỗng và họ chþa xếp häng bçt kỳ sân số giâi pháp đþợc đề xuçt (Khusro & cs., 2016): phèm nào. Vì vêy, các giâi thuêt gợi ý không thể Giâi pháp 1: Sā dýng mô hình gợi ý đa hiểu đþợc khách hàng và không dă đoán đþợc sć chiều (Adomavicius & cs., 2005) và sā dýng các thích, nhu cæu cûa họ (Sharma & Gera, 2013). kỹ thuêt hiệu quâ giâi quyết bài toán dă đoán Vçn đề này gọi là “Cold start problem” và có thể đối vĆi ma trên thþa nhþ giâi pháp cûa Xue & đþợc giâi quyết bìng cách sā dýng hệ gợi ý không cs. (2015), giâi pháp cûa Lei & cs. (2019). cá nhån hòa để gợi ý nhĂng sân phèm mĆi, Giâi pháp 2: Dăa trên nhĂng phân hồi tiềm nhĂng sân phèm bán chäy, nhĂng sân phèm èn cûa ngþąi dùng (implicit feedback) nhþ: lðch đþợc nhiều ngþąi đánh giá cao, (Schafer & cs., sā xem hàng, mua hàng„ để bổ sung dĂ liệu vào 2007; Mohamed & cs., 2019). ma trên ngþąi dùng - sân phèm nhìm hän chế mĀc độ thþa cûa ma trên ít ngþąi dùng đánh giá. 4.2. Vấn đề khâ năng mở rộng và hiệu suất Giâi pháp 3: Chia sẻ thông tin ngþąi dùng thời gian thực giĂa các trang web không có cänh tranh, đặc Khi lþợng dĂ liệu ngày càng lĆn dæn lên, biệt có thể khai thác thêm dĂ liệu tÿ các trang làm thế nào để các hệ gợi ý làm việc hiệu quâ mäng xã hội. Thông tin ngþąi dùng càng nhiều, đang là mối quan tâm cûa các nhà khoa học và càng đæy đû sẽ giúp các thuêt toán gợi ý hiểu cûa doanh nhân sā dýng hệ thống thþĄng mäi khách hàng hĄn và tþ vçn chính xác hĄn. Lþu ý, điện tā. VĆi website lĆn, hệ thống phâi täo ra các bên khi chia sẻ dĂ liệu ngþąi dùng phâi cam kết chî dùng dĂ liệu đþợc chia sẻ để phýc vý tþ các gợi ý trong vñng đĄn vð giây trong khi phýc vçn tốt hĄn và có trách nhiệm bâo vệ thông tin vý hàng trëm hoặc hàng ngàn ngþąi tiêu dùng ngþąi dùng. cùng một lúc. Số lþợng yêu cæu gợi ý đồng thąi ngày càng lĆn, số lþợng sân phèm ngày càng tëng, hành vi tþĄng tác cûa ngþąi dùng trên các 5. ĐÁNH GIÁ CÁC PHƯƠNG PHÁP GỢI Ý sân phèm ngày càng nhiều. Hiện täi, để giâi 5.1. Điểm mänh và điểm yếu của các quyết phæn nào vçn đề này ngoài việc đæu tþ lĆn phương pháp hệ gợi ý hĄn cho các hệ thống tính toán mänh cæn phâi áp dýng thêm các thuêt toán giâm chiều, xā lý Bâng 3 là kết luên cûa chúng tôi về nhĂng song song và đặc biệt nên chäy các thuêt toán þu điểm và hän chế cûa các phþĄng pháp hệ offline để có thể gợi ý online nhanh hĄn (Khusro gợi ý. & cs., 2016). Tuy nhiên, đåy là vçn đề khó và đang là một thách thĀc cûa các hệ thống gợi ý. 5.2. Đánh giá độ chính xác của các phương pháp gợi ý 4.3. Vấn đề thưa thớt của dữ liệu đánh giá 5.2.1. Dữ liệu thực nghiệm (Sparsity) Chúng tôi đánh giá hiệu quâ thăc hiện cûa Một thách thĀc nĂa đối vĆi hệ gợi ý täi các các thuêt toán content-based, user-based, item trang thþĄng mäi điện tā là să thþa thĆt về dĂ based đã đþợc giĆi thiệu ć trên bìng cách chäy liệu khách hàng đánh giá sân phèm. Rçt nhiều thā nghiệm trên 4 têp dĂ liệu chuèn: Movielens 525
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử (GroupLens, 1998), Epinions (Trademark RMSE NRMSE Notice, 2003), BookCrossing (University of Rating Rating max min Freiburg, 2004), LastFM (GroupLens, 2011). Trong đò: 5.2.2. Phương pháp đánh giá và môi trường 1 n 2 RMSE p r thử nghiệm ii n 1 a. Phương pháp đánh giá vĆi n là số quan sát, pi là giá trð dă đoán Chúng tôi chia têp dĂ liệu ra làm 2 phæn, đánh giá cûa sân phèm i và ri là giá trð đánh giá lçy ngéu nhiên 70% têp dĂ liệu để training và thăc tế cûa sân phèm i. 30% dĂ liệu còn läi để testing. Chúng tôi thăc Ratingmax, Ratingmin læn lþợt là điểm lĆn nhçt hiện 5 læn lặp trên các têp dĂ liệu.Độ đo và nhó nhçt cho phép ngþąi dùng đánh giá. NRMSE (Normalized Root Mean Square Error) và thąi gian thăc hiện (time) đþợc chúng tôi sā b. Môi trường thử nghiệm dýng để đánh giá hiệu quâ cûa các thuêt toán. Môi trþąng đþợc sā dýng thā nghiệm là Độ đo NRMSE dùng để xác đðnh sai số máy tính Intel(R) Corei5-6300U, CPU @ chuèn hóa cûa các thuêt toán và đþợc xác đðnh 2.5GHz, RAM 8GB và ngôn ngĂ Python trên hệ bìng công thĀc: điều hành Microsoft Window 10. Bâng 3. Điểm mänh và điểm yếu của các phương pháp gợi ý STT Phương pháp Điểm mạnh Điểm yếu 1 Gợi ý không cá nhân 1. Đơn giản 1. Gợi ý chung chung, không cá nhân hóa hóa (Non-personalized 2. Gợi ý không phụ thuộc vào dữ liệu của đến từng khách hàng. Vì vậy mọi khách đều recommender khách hàng trên hệ thống nên áp dụng được có kết quả gợi ý giống nhau. systems) cho mọi khách hàng, giúp tăng cơ hội chuyển đổi khách hàng. 2 Lọc dựa trên nội dung 1. Hệ thống không sử dụng dữ liệu của người 1. Hệ thống phải phân tích và dò tìm tất cả (Content-based dùng khác mà vẫn gợi ý được những sản các đặc trưng của sản phẩm để tạo ra danh filtering) phẩm phù hợp với sở thích của từng khác sách gợi ý, nên có thể chậm hoặc nếu hồ sơ hhàng riêng biệt. về sản phẩm không đúng có thể dẫn đến 2. Có khả năng gợi ý được cả những sản gợi ý sai. phẩm mới cho người dùng. 2. Không thể gợi ý nếu khách hàng không có lịch sử đánh giá xem/thích các sản phẩm trên hệ thống.Với khách hàng mới, hệ thống không thể cung cấp gợi ý phù hợp. 3. Không gợi ý được thêm các sở thích mới của khách. 4 Lọc cộng tác 1. Hệ thống không cần sử dụng đến hồ sơ 1. Không thể gợi ý nếu khách hàng chưa (Collaborative nhân khẩu học của người dùng để gợi ý từng tương tác với các mặt hàng. Filtering) sản phẩm. 2. Không thể gợi ý được các sản phẩm mới 2. Có khả năng dự đoán được sở thích và nhu hoặc sản phẩm chưa được ai đánh giá. cầu của người dùng mà không cần hiểu sản 3. Khi lượng sản phẩm lớn nhưng số lượng phẩm. khách hàng đánh giá không nhiều thì 3. Có thể gợi ý tới người dùng những sản phương pháp này không hiệu quả. phẩm bên ngoài sở thích đang có. Nhữngnhững sản phẩm này có thể phù hợp sở thích mới của họ. 5 Phương pháp tổng 1. Kết hợp tất cả các ưu điểm của phương 1. Không thể gợi ý cho người dùng mới hợp (Hybrid method) pháp Content-based filtering và Collaborative 2. Khi lượng sản phẩm lớn nhưng số lượng Filtering. khách hàng đánh giá không nhiều thì phương pháp này không hiệu quả. 526
- Hoàng Thị Hà, Ngô Nguyễn Thức Bâng 4. Thông tin các tập dữ liệu thử nghiệm Datasets #Items #Users # Rating Range Rating Mô tả Movielens 100K 1,700 1,000 100,000 1÷5 Chứa đánh giá của người dùng trên các các bộ phim. Mỗi bộ phim có các đặc trưng (id, title, realise date, type, rating, time ) Epinion 138,738 49,290 139,738 1÷5 Chứa quan điểm của người dùng về các sản phẩm thương mại BookCrossing 271,379 278,858 1,149,780 1÷10 Chứa đánh giá của người dùng về sách. LastFM 17,632 1,892 92,834 Số lần các bài hát Chứa danh sách top những bài hát được được bật bởi người dùng nghe nhiều nhất (2100 users users and 18,745) 5.2.3. Kết quâ thử nghiệm thuêt gợi ý cá nhån hòa nhþ: phþĄng pháp gợi ý dăa trên nội dung, phþĄng pháp gợi ý lọc cộng Kết quâ ć bâng 5 cho thçy, thuêt toán tác để thông báo cho khách hàng nhĂng sân Content - based có thąi gian chäy nhanh hĄn phèm họ có thể thích, hỗ trợ khách hàng trong User-based và Item-based, nhþng độ chính xác quá trình tìm mua sân phèm. không cao. GiĂa thuêt toán User-based và Item-based, nếu xét về sai số cûa dă đoán 6.1. Tổng quan về cách tiếp cận thìtiếp cên lọc cộng tác dăa trên sân phèm Cách tiếp cên tổng quan cûa chúng tôi đþợc (Item-based) cho sai số thçp hĄn (hay cho độ thể hiện trong hình 5. chính xác cao hĄn) tiếp cên lọc cộng tác dăa trênngþąi dùng (User - based) vĆi tỷ lệ 3/4 têp 6.2. Luồng xử lý chính trong hệ thống dĂ liệu. Tuy nhiên, xét về thąi gian thăc hiện thì phþĄng pháp lọc cộng tác dăa trên ngþąi Luồng xā lý chính trong hệ thống đþợc thể dùng thăc hiện nhanh hĄn nhiều so vĆi phþĄng hiện trong hình 6. pháp lọc cộng tác dăa trên sân phèm câ giai Giâi thích: Hệ thống sẽ kiểm tra xem khách đoän huçn luyện (training) và giai đoän kiểm hàng cò đëng nhêp hay không. Nếu khách hàng thā (testing) ć câ 4 têp dĂ liệu. Do đò, cò thể nói cò đëng nhêp, hệ thống sẽ kiểm tra xem khách phþĄng pháp lọc cộng tác dăa trên User - based hàng đã cò độ tþĄngtă vĆi ngþąi khác hay chþa, sẽ có khâ nëng mć rộng (scability) tốt hĄn nếu có thì sẽ sā dýng mô hình lọc cộng tác để phþĄng pháp Item - based. Vì vêy, khó có thuêt hiển thð thông tin gợi ý, ngþợc läi hệ thống sẽ toán nào là tốt nhçt trên mọi tiêu chí. Tùy theo kiểm tra xem khách hàng có thông tin cá nhân mýc đích gợi ý và Āng dýng thăc tế để chọn để quyết đðnh lăa chọn mô hình nhân khèu học phþĄng pháp gợi ý phù hợp. hoặc không cá nhån để đþa ra gợi ý cho khách hàng. Trþąng hợp gợi ý dăa trên mô hình không 6. TÍCH HỢP HỆ GỢI Ý TRONG HỆ THỐNG cá nhân thì sẽ đþa ra nhĂng sân phèm mĆi, sân BÁN HÀNG TRỰC TUYẾN phèm bán chäy, sân phèm đþợc nhiều khách hàng quan tâm. Để thā nghiệm trăc quan hệ gợi ý Āng dýng Trong trþąng hợp khách hàng không đëng trong thþĄng mäi điện tā, chúng tôi tiến hành nhêp, hệ thống sẽ kiểm tra lðch sā khách hàng xây dăng hệ thống bán sách trăc tuyến tích hợp đã tÿng truy cêp vào trang web dăa vào IP vĆi các thuêt toán gợi ý đã trình bày ć trên. máy tính mà khách hàng truy cêp, hệ thống sẽ Hệ thống sā dýng thuêt toán gợi ý không cá lþu vết läi lðch sā quá trình truy cêp. Nếu có nhån hòa để hiển thð các sân phèm mĆi, sân thông tin dăa theo đða chî IP, hệ thống sẽ đþa phèm bán chäy nhçt, sân phèm đþợc þa thích ra gợi ý về nhĂng sân phèm mà khách hàng đã nhçt. Đặc biệt, hệ thống tích hợp một số kỹ tÿng xem. 527
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Bâng 5. Sai số dự đoán và thời gian thực hiện trung bình 5 lần chäy của các phương pháp lọc cộng tác Thời gian(sec) Dataset Thuật toán NRMSE Training testing Movielens (100K) Content - based 0,317 0,093 0,027 User - based 0,280 1,126 3,107 Item - based 0,288 0,147 7,793 Epinion User - based 0,285 6,515 158,91 Item - based 0,254 7,518 3869,7 BookCrossing User - based 0,248 9,126 171,73 Item - based 0,282 20,142 4030,5 LastFM User - based 0,0131 4,313 165,398 Item - based 0,0103 39,326 4431,387 Ghi chú: giá trị tốt nhất của các tiêu chí trên mỗi tập dữ liệu được tô đậm. Thông tin về Users (products cataluge) Thông tin về sản phẩm Recommender System (products cataluge) Tương tác của User-item (peocduct (User product interactions) (products cataluge) (Peocduct Danh sách các sản phẩm gợi ý cho khách Hình 5. Tổng quan về cách tiếp cận 6.3. Tiến trình gợi ý trong hệ thống website sân phèm mĆi, sân phèm bán chäy, sân phèm thương mäi đþợc nhiều ngþąi đánh giá. Tiến trình gợi ý sân phèm trong hệ thống - Nhóm 2: Sā dýng nhóm thuêt toán cá thþĄng mäi điện tā đþợc thể hiện trong hình 7. nhån hòa đã trình bày ć mýc 2.2 để gợi ý cho khách hàng: thuêt toán nhân khèu học, thuêt Tiến trình này bao gồm 3 giai đoän: toán gợi ý dăa trên nội dung (content - based), Giai đoän 1: Thu thêp thông tin ngþąi dùng thuêt toán lọc cộng tác (Collaborative filtering) Để có thể dă đoán đþợc sć thích cûa ngþąi để đoán các sân phèm phù hợp vĆi khách hàng. dùng, hệ thống phâi học một mô hình ngþąi Giai đoän 3: Gợi ý: Giai đoän này, cën cĀ dùng (User model). Mô hình ngþąi dùng mà vào tÿng đặc điểm cûa khách hàng, hệ thống sẽ chúng tôi thu thêp là các dĂ liệu cûa ngþąi dùng dă đoán và gợi ý nhĂng sân phèm mà khách nhþ: thông tin cá nhån, thông tin lðch sā tþĄng hàng có thể thích. tác cûa ngþąi dùng trên sân phèm. Giai đoän 2: Sā dýng các thuêt toán gợi ý: 6.4. Một số giao diện kết quâ chính ứng với Giai đoän này, chúng tôi sā dýng dĂ liệu thu 3 giai đoän gợi ý của hệ thống thêp đþợc ć giai đoän 1 và dĂ liệu sân phèm để chäy 2 nhóm thuêt toán: 6.4.1. Trang đánh giá sản phẩm - Nhóm 1: Sā dýng thuêt toán gợi ý không Giao diện đánh giá sân phèm đþợc thể hiện cá nhân hóa (Non - personalized) để gợi ý các trong hình 8. 528
- Hoàng Thị Hà, Ngô Nguyễn Thức Hình 6. Luồng xử lý chính trong hệ thống Thu thập thông tin (Information collection) Phản hồi (Feedback) Học (Learning) Dự đoán/Gợi ý (Recommender System) Hình 7. Tiến trình gợi ý trong hệ thống 6.4.2. Một số trang huấn luyện mô hình kiếm một sân phèm, hệ thống sẽ hiển thð danh - Trang thống kê đánh giá sân phèm cûa sách nhĂng sân phèm mĆi và nhĂng sân phèm ngþąi dùng đþợc thể hiện trong hình hình 9. tþĄng tă mà nhiều ngþąi quan tåm để gợi ý cho khách hàng. - Trang đo lþąng độ tþĄng tă giĂa các ngþąi dùng đþợc thể hiện trong hình 10. b. Đối với khách hàng thành viên Nếu khách hàng là thành viên cûa hệ 6.4.3. Các kết quả gợi ý sản phẩm thống, tÿng cò đánh giá sân phèm, website sẽ a. Đối với khách hàng mới gợi ý nhĂng sân phèm mĆi, sân phèm nhiều Nếu là khách hàng mĆi (khách hàng chþa ngþąi quan tâm, sân phèm tþĄng tă. Ngoài ra, đánh giá bçt kỳ sân phèm nào), khi họ tìm hệ thống còn dăa vào độ tþĄng tă giĂa các ngþąi 529
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử dùng để hiển thð nhĂng sân phèm mà khách Nhþ vêy, bìng việc xây dăng một Āng dýng hàng chþa đþợc trâi nghiệm nhþng đã đþợc các thþĄng mäi điện tā có tích hợp đa däng các khách hàng tþĄng tă khác đánh giá cao. phþĄng pháp hệ gợi ý, website đã tă động đþa ra cho khách hàng các gợi ý khá thông minh, đa - Trang gợi ý nhĂng sân phèm ngþąi dùng däng, trăc quan, phù hợp vĆi tÿng cá nhân khách có thể thích đþợc thể hiện trong hình 12. hàng và đã khíc phýc đþợc vçn đề ngþąi dùng - Trang hiển thð nhĂng sân phèm khách mĆi, sân phèm mĆi. VĆi nhĂng khâ nëng trên cho hàng đã xem hoặc đã mua đþợc thể hiện trong thçy, hệ gợi ý mang läi trâi nghiệm tốt chokhách hình 13. hàng, giúp khách hàng giâm thąi gian tìm kiếm - Trang gợi ý sân phèm có thể đþợc mua sân phèm, tëng độ hài lñng, tëng cĄ hội mua cùng nhau đþợc thể hiện trong hình 14. hàng và nâng cao tỷ lệ chuyển đổi mua hàng. Hình 8. Giao diện đánh giá sân phẩm của người dùng Hình 9. Giao diện kết quâ đánh giá sân phẩm của người dùng 530
- Hoàng Thị Hà, Ngô Nguyễn Thức Hình 10. Giao diện đo lường độ tương tự giữa các người dùng Hình 11. Giao diện gợi ý cho người dùng mới 531
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Hình 12. Giao diện gợi ý các sân phẩm người dùng có thể thích Hình 13. Giao diện hiển thị những sân phẩm người dùng đã xem/mua Hình 14. Giao diện gợi ý các sân phẩm hay mua cùng nhau 532
- Hoàng Thị Hà, Ngô Nguyễn Thức 7. KẾT LUẬN TÀI LIỆU THAM KHẢO Adomavicius G., Sankaranarayanan R., Sen S. & Hệ gợi ý có vai trò rçt quan trọng trong Tuzhilin A. (2005). Incorporating contextual thþĄng mäi điện tā. Nó là một trong nhĂng vü information in recommender systems using a khí mänh mẽ giúp nhiều doanh nghiệp tëng multidimensional approach ACM Transactions on doanh số bán hàng, là một trong nhĂng nhân tố Information Systems (TOIS). pp. 103-145. täo nên să thành công cûa các trang thþĄng mäi Dias M.B., Locher D., Li M., El-Deredy W. & Lisboa P.J. (2008). The value of personalised điện tā và sẽ đþợc Āng dýng rộng rãi trong recommender systems to e-business: a case study. tþĄng lai. Proceedings of the 2008 ACM conference on Trong nghiên cĀu này, chúng tôi đã trình Recommender systems. pp. 291-294. bày tổng quan về hệ gợi ý, khám phá nhĂng tác GroupLens (1998). MovieLens 100K Dataset, Retrieved from động cûa hệ gợi ý đối vĆi thþĄng mäi điện tā. movielens/ on October 03, 2020. Bìng thăc nghiệm, chúng tôi đã so sánh đþợc Grouplens (2011). Last.FM. Retrieved from hiệu quâ thăc hiện cûa các phþĄng pháp gợi ý on Content-based, User-based và Item-based, October 03, 2020. đánh giá đþợc nhĂng điểm mänh, điểm yếu cûa Google & Temasek (2018). Báo cáoReport e-Conomy mỗi phþĄng pháp gợi ý. Ngoài ra, chúng tôi báo SEA 2018, Retrieved from . cáo thách thĀc cûa các phþĄng pháp gợi ý khi áp 6730/Report_e-Conomy_SEA_2018_by_Google_ dýng trong thþĄng mäi điện tā và chî ra giâi Temasek_v.pdf on March 20, 2020. pháp khíc phýc. Cuối cùng, chúng tôi đã xåy Ionos (2017). Recommendation systems in e- dăng thành công hệ thống bán hàng trăc tuyến commerce. US: IONOS Inc. Retrieved from có tích hợp các phþĄng pháp gợi ý khác nhau, eting/online-sales/how-to-use-recommendation- bao gồm kỹ thuêt gợi ý không cá nhân hóa systems-in-e-commerce on May 15, 2020. (Non-personalized) và các kỹ thuêt gợi ý cá Jordan T. (2016). New insight from Experian nhân hóa hiệu quâ nhþ: gợi ý dăa trên nội dung Marketing Services helps brands prepare for the (Content-based filtering), lọc cộng tác (User- holiday season. based, Item-based). Qua đò, ngþąi đọc hiểu đþợc Khusro S., Ali Z. & Ullah I. (2016). Recommender nền tâng lý thuyết hệ gợi ý, điểm mänh, điểm systems: issues, challenges, and research opportunities. In Information Science and yếu cûa các hệ gợi ý cüng nhþ quy trình xåy Applications (ICISA) 2016. Springer. In dăng một Āng dýng thþĄng mäi điện tā có tích Information Science and Applications (ICISA). hợp các phþĄng pháp gợi ý trong thăc tế. Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma & HþĆng nghiên cĀu trong tþĄng lai cûa lïnh Zihang Liu (2019). Recommendation for văc này còn khá rộng mć, đặc biệt là các kỹ Ridesharing Groups Through Destination Prediction on Trajectory Data. IEEE Transactions thuêt gợi ý cá nhân hóa. Chúng tôi sẽ tiếp týc on Intelligent Transportation Systems. 99: 14. nghiên cĀu, câi tiến Āng dýng các thuêt toán gợi Mohamed M.H., Khafagy M.H. & Ibrahim M.H. (2019). ý trong lïnh văc e-commerce, lïnh văc Recommender Systems Challenges and Solutions e-learning để trợ giúp ngþąi dùng trong quá survey. International Conference on Innovative trình mua hàng, tìm kiếm tài liệu cüng nhþ hỗ Trends in Computer Engineering (ITCE) trợ quá trình học têp trăc tuyến. Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013). Hệ thống gợi ý sản phẩm trong bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác Tạp chí Khoa học, LỜI CẢM ƠN Trường Đại học Cần Thơ. 31: 15. Nguyễn Thanh Hưng (2019). Báo cáo chỉ số thương Chúng tôi câm Ąn Khoa Công nghệ thông mại điện tử 2019. Hiệp hội thương mại điện tử tin, Học viện Nông nghiệp Việt Nam đã täo Việt Nam. điều kiện tốt nhçt để chúng tôi thăc hiện Reichheld & F.F. (1993). Loyalty-based management. nghiên cĀu này. Harvard business review. 71(2): 64-73. 533
- Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Schafer Ben J., Joseph Konstan & John Riedl (2001). International Conference Proceeding Series. ACM E-commence Recommendation Applications. press. New York, USA. 8. Data Mining and Knowledge Discovery. Trademark Notice (2003). Epinions dataset. Retrieved 5(1-2): 115-153. from on Sharma L. & Gera A. (2013). A survey of October 03, 2020. recommendation system: Research challenges. University of Freiburg (2004). BookCrossing, International Journal of Engineering Trends and Retrieved from Technology (IJETT). 4(5): 1989-1992. freiburg.de/~cziegler/BX/ on October 03, 2020 Singh P. (2019). A Survey of Recommendation Viễn Thông (2020). Thương mại điện tử Việt Nam Systems in Electronic Commerce. Apress, 2020 sẽ ra sao? Truy cập từ Berkeley, CA. pp. 123-157. Stephan S. (2019). Personalized Product tu-viet-nam-2020-se-ra-sao-4045309.html, ngày10 Recommendation Tips and Stats. Retrieved tháng 3 năm 2020. from Xue A.Y., Qi J., Xie X., Zhang R., Huang J. & Li Y. product-recommendations-stats/ on Feb 25, 2020. (2015). Solving the data sparsity problem in Thomas T. (2006). Designing recommender systems destination prediction. The VLDB Journal. for e-commerce: an integration approach. ACM 24(2): 219-243. 534