Các nhân tố ảnh hưởng đến quyết định chọn ngành hệ thống thông tin quản lý của sinh viên trường đại học kinh tế Huế

pdf 9 trang Gia Huy 18/05/2022 2430
Bạn đang xem tài liệu "Các nhân tố ảnh hưởng đến quyết định chọn ngành hệ thống thông tin quản lý của sinh viên trường đại học kinh tế Huế", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfcac_nhan_to_anh_huong_den_quyet_dinh_chon_nganh_he_thong_tho.pdf

Nội dung text: Các nhân tố ảnh hưởng đến quyết định chọn ngành hệ thống thông tin quản lý của sinh viên trường đại học kinh tế Huế

  1. CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN QUYẾT ĐỊNH CHỌN NGÀNH HỆ THỐNG THƠNG TIN QUẢN LÝ CỦA SINH VIÊN TRƯỜNG ĐẠI HỌC KINH TẾ HUẾ FACTORS AFFECTING STUDENTS’ CHOICE OF MAJOR IN MANAGEMENT INFORMATION SYSTEMS AT COLLEGE OF ECONOMICS, HUE UNIVERSITY ThS. Mai Thu Giang Trường Đại học Kinh tế, Đại học Huế Tĩm tắt Trong bối cảnh mục tiêu về phát triển giáo dục bền vững đang là chìa khĩa cho phát triển kinh tế bền vững thì sự hiểu biết qua lại giữa cơ sở đào tạo và người học là điều vơ cùng cần thiết. Tuy nhiên, chưa cĩ nghiên cứu nào thực hiện việc tìm ra những nhân tố ảnh hưởng đến quyết định chọn ngành Hệ thống Thơng tin Quản lý (HTTTQL) của sinh viên trường Đại học Kinh tế Huế. Nghiên cứu này nhằm mục đích tìm ra những nhân tố đĩ trên cơ sở ứng dụng phần mềm khai phá dữ liệu WEKA với các kỹ thuật trích chọn thuộc tính và phân lớp. Kết quả của nghiên cứu cho thấy cĩ 4 nhân tố quan trọng ảnh hưởng đến quyết định chọn ngành HTTTQL của sinh viên trường Đại học Kinh tế Huế, đĩ là tổng điểm xét tuyển của sinh viên, niềm đam mê ứng dụng Cơng nghệ thơng tin vào kinh tế, giới tính, và cơ hội việc làm sau khi tốt nghiệp. Từ khĩa: Phân lớp, trích chọn thuộc tính, khai phá dữ liệu, độ chính xác phân lớp, WEKA. Abstract Education for sustainable development is one of the most important keys in national sustainable development strategies so that the understanding each other between training institutions and learners is extremely necessary. However, there is a lack of studies that point out key factors affecting the choice of the major in Information Management System (MIS) of Hue College of Economics students. This study aims to find out those factors by applying WEKA application with feature selection and classification techniques. The result shows that Total score of entrance exams, Passion for studying and working with IT, gender, and job opportunities after graduation are the most important factors affecting the choice of MIS major of Hue college of economics students. Key words: Classification, features selection, data mining, classification accuracy, WEKA. 1. Đặt vấn đề Kinh tế phát triển dựa trên nền tảng giáo dục bền vững. Tuy nhiên, thực trạng của đào tạo đại học được thống kê bởi Báo người lao động chỉ rõ, trên 64% người tìm việc khơng xác định được mục tiêu nghề nghiệp khi học đại học, 50% số sinh viên ra trường phải đào tạo lại [9] . Điều đĩ đỏi hỏi các trường đại học cần cĩ chiến lược và những nghiên 684
  2. cứu cụ thể để thể giải quyết được những bất cập này, để khơng chỉ nâng cao số lượng đầu vào mà cịn nâng cao chất lượng đào tạo, nắm bắt tâm lý người học, định hướng nghề nghiệp cho sinh viên. Trong xu thế của giáo dục bền vững cùng với sự cạnh tranh ngày càng cao giữa các trường đại học, địi hỏi các trường phải tìm ra chiến lược đào tạo và thu hút đầu vào cho các chuyên ngành. Ngành Hệ thống Thơng tin Quản lý (HTTTQL) là một ngành mới và đang cĩ xu hướng được nhiều sinh viên lựa chọn. Tuy nhiên, số lượng sinh đăng ký học ngành Hệ thống Thơng tin Quản lý tại trường Đại học Kinh tế Huế vẫn chưa cao, thậm chí cĩ xu hướng giảm nhẹ. Số lượng đầu vào thấp nên chưa sử dụng được tối đa nguồn lực đào tạo và cơ sở vật chất trang bị cho đào tạo chuyên ngành. Do vậy, việc nghiên cứu để tìm ra những nhân tố tác động đến quyết định lựa chọn ngành HTTTQL của sinh viên rất quan trọng. Trên cơ sở đĩ, Trường Đại học kinh tế Huế cĩ thể đề ra được chiến lược đúng đắn, hiệu quả cho việc thu hút sinh viên để nâng cao số lượng cũng như chất lượng đầu vào cho chuyên ngành. Vấn đề tìm ra các nhân tố tác động đến lựa chọn chuyên ngành học đã được nhiều tác giả trong nước và nước ngồi nghiên cứu. Ví dụ, Keshishian và cộng sự đã nghiên cứu về các nhân tố động lực ảnh hưởng đến sự lựa chọn chuyên ngành học tại trường đại học của sinh viên Y Dược [6]; Nguyễn Thị Lan Hương đã nghiên cứu các nhân tố ảnh hưởng đến động cơ chọn ngành Quản trị Doanh nghiệp của sinh viên trường Cao đẳng Kinh tế Đà Nẵng [8]; Edmonds đã nghiên cứu những nhân tố ảnh hưởng đến lựa chọn chuyên ngành học và tìm ra sự khác biệt giữa các chuyên ngành tại trường Rowan University [4]. Mặc dù đã cĩ nhiều nghiên cứu được tiến hành nhưng chưa cĩ nghiên cứu nào được thực hiện để tìm ra các nhân tố ảnh hưởng đến sự lựa chọn ngành Hệ thống Thơng tin Quản lý của sinh viên trường Đại học Kinh tế, Đại học Huế. Nghiên cứu này sẽ ứng dụng phần mềm khai phá dữ liệu WEKA với hai kỹ thuật trích chọn thuộc tính và phân lớp để tìm ra các nhân tố quyết định đến sự lựa chọn ngành Hệ thống Thơng tin Quản lý của sinh viên. 2. Tổng quan nghiên cứu và cơ sở lý thuyết 2.1. Một số nghiên cứu liên quan đến đề tài Nghiên cứu của Yazici và cộng sự đã đưa ra được nhĩm các nhân tố tác động đến quyết định lựa chọn chuyên ngành học của sinh viên. Trong đĩ các nhân tố cĩ ảnh hưởng khác nhau, bao gồm uy tín của trường đại học, vị trí, chi phí, và tình trạng kinh tế xã hội của sinh viên. Ngồi ra, sự thú vị của ngành học, tiềm năng cơ hội làm việc và ảnh hưởng từ bố mẹ, giáo viên đối với sinh viên trong lựa chọn chuyên ngành học là những nhân tố cơ bản [13]. Nghiên cứu của Beggs và cộng sự đã xác định được 6 nhân tố ảnh hưởng lớn nhất đến quyết định chọn chuyên ngành của sinh viên bao gồm: đặc điểm chuyên ngành học phù hợp với sở thích cá nhân, đặc điểm của cá nhân, đặc điểm cơng việc, lợi ích về tài chính, tâm lý và lợi ích xã hội, thơng tin về ngành [2]. Nghiên cứu của Nguyễn Thị Lan Hương về những nhân tố ảnh hưởng đến động cơ chọn ngành quản trị doanh nghiệp, trên đối tượng là sinh viên trường Cao đẳng Kinh tế - 685
  3. Kế hoạch Đà Nẵng, đã đưa ra được mơ mình tham chiếu cơ đọng bao gồm: đào tạo liên thơng, cơ hội nghề nghiệp và đối tượng tham chiếu [8]. Trong đĩ đối tượng tham chiếu được xác định trong nghiên cứu bao gồm Thầy Cơ, Bố Mẹ, bạn bè, những sinh viên đã và đang học tại trường, người đang làm trong lĩnh vực, và các buổi nĩi chuyện của các chuyên gia về ngành. Tuy nhiên, một nghiên cứu khác lại cho rằng sinh viên nên đầu tư vào chuyên ngành giúp họ cĩ một tương lai ổn định, an tồn, và thành cơng trong tương lai. Quyết định đĩ khơng phải chỉ dựa trên những cảm tính của cá nhân mà là dựa vào sự phù hợp nhất đối với họ [12]. Kế thừa kết quả của các nghiên cứu trước [4] [8], và căn cứ vào đặc điểm đặc trưng của chuyên ngành Hệ thống Thơng tin Quản lý (HTTTQL), nghiên cứu này đã đề xuất 39 nhân tố tương ứng với 39 thuộc tính được sử dụng để đánh giá tác động đến quyết định chọn ngành HTTTQL của sinh viên bao gồm: giới tính, quê quán, dân tộc, ba mơn thi dự tuyển vào đại học, điểm thành phần 3 mơn dự tuyển vào đại học, tổng điểm (bao gồm điểm ưu tiên), nghề của Bố, nghề của mẹ, định hướng, Anh Chị Em trong gia đình, Thầy Cơ, bạn bè, người thân, điểm tuyển sinh đầu vào, đam mê tìm hiểu cơng nghệ thơng tin, đam mê ứng dụng cơng nghệ thơng tin vào kinh tế, đam mê cơng việc thống kê tính tốn, xu thế ngành, sự thách thức của chuyên ngành, thương hiệu và uy tín của ngành, đội ngũ giáo viên, giao thơng, điều kiện sinh hoạt, học phí, truyền thơng, hướng nghiệp, thăm quan tại trường, khung chương trình, nhu cầu về việc làm, cơ hội việc làm, cơ hội thăng tiến trong cơng việc, lương cao, mơi trường làm việc năng động, sáng tạo, chuyên nghiệp. Thuộc tính cuối cùng của các bản ghi sinh viên là trường dữ liệu được đặt tên “class”, trường này lưu với nội dung là “Yes” nếu sinh viên đang theo học ngành Hệ thống Thơng tin Quản lý; ngược lại được lưu là “No”. 2.2. Lý thuyết về phân lớp và trích chọn thuộc tính trong khai phá dữ liệu 2.2.1. Phân lớp Bao gồm các dự đốn của kết quả đầu ra dựa trên dữ liệu đầu vào cho trước. Để dự đốn kết quả đầu ra, các thuật tốn xử lý một tập dữ liệu, cịn gọi là tập huấn luyện (Traning set), gồm tập hợp các thuộc tính và cả thuộc tính kết quả tương ứng. Thuộc tính kết quả này được gọi là thuộc tính dự đốn hay cịn gọi là lớp (class). Thuật tốn tìm cách huấn luyện và khám phá mối quan hệ giữa các thuộc tính trên tập dữ liệu để dự đốn khả năng đầu ra. Sau đĩ, thuật tốn được cho một tập dữ liệu mới, cịn được gọi là tập kiểm thử (Testing set). Tập này cĩ chứa cùng tập hợp các thuộc tính, ngoại trừ thuộc tính dự đốn (tên của lớp – khơng được biết trước). Thuật tốn phân tích đầu vào, xử lý và đưa ra dự đốn. Độ chính xác của dự báo càng cao, giải thuật càng được đánh giá là “tốt” [10]. Hai kỹ thuật phân lớp thường được sử dụng trong phân tích dữ liệu giáo dục là Nạve Bayes và Cây quyết định (Decision tree). Trong đĩ, kỹ thuật Nạve Bayes phân lớp được dựa trên định lý Bayes về lý thuyết xác suất để đưa ra các phán đốn cũng như phân loại dữ liệu dựa trên các dữ liệu được quan sát và thống kê [1]. Mặt khác, Cây quyết định là một cây phân cấp cĩ cấu trúc, được dùng để phân lớp các đối tượng dựa vào dãy các luật. Các thuộc tính của đối tượng (khơng bao gồm thuộc tính phân lớp) cĩ thể thuộc kiểu dữ liệu khác nhau. Thuộc tính phân lớp, hay “class” phải cĩ kiểu dữ liệu nhị phân hoặc cĩ 686
  4. thứ tự. Cây quyết định sẽ sinh ra các luật để dự đốn lớp của các đối tượng chưa biết trên cơ sở dữ liệu về các đối tượng đã thu thập, và giá trị nút lá trong cây quyết định chính là nhãn của lớp [10]. Để đánh giá độ chính xác (trung bình) của mơ hình phân lớp, các nghiên cứu sử dụng nhiều phương pháp đánh giá khác nhau bao gồm: Holdout (Splitting): Dữ liệu được ngẫu nhiên chia thành tập dữ liệu huấn luyện (training) và tập dữ liệu kiểm thử (testing). Thơng thường 2/3 dữ liệu cấp cho huấn luyện, phần cịn lại dùng cho kiểm thử. Hai tập con được chia là 2 tập khơng giao nhau. K-fold cross validation: Nhằm tránh sự trùng lặp giữa các tập kiểm thử, tồn bộ các bản ghi trong cơ sở dữ liệu được chia ngẫu nhiên thành k tập con khơng giao nhau, cĩ kích thước xấp xỉ nhau. Mỗi lần (trong số k lần) lặp, một tập con được sử dụng làm tập kiểm thử - testing, (k-1) tập cịn lại dùng làm tập huấn luyện – training. Live-one-out cross validation:Thực hiện việc kiểm thử với dữ liệu huấn luyện (training) và dữ liệu kiểm thử (testing) trên cùng một bản ghi. Điều đĩ cĩ nghĩa là, sử dụng dữ liệu thu được từ một bản ghi để huấn luyện, sau đĩ dùng chính dữ liệu của bản ghi đĩ nhưng chưa dùng trong huấn luyện để kiểm tra độ chính xác theo phương pháp kiểm tra chéo [3]. 2.2.2. Trích chọn thuộc tính Mục đích của trích chọn thuộc tính là chọn tập con của tập các thuộc tính ban đầu, bằng cách loại bỏ các thuộc tính dư thừa, khơng liên quan hoặc khơng trợ giúp trong việc đưa ra dự đốn. Lựa chọn thuộc tính được chứng minh trong cả lý thuyết và thực hành thơng qua hiệu quả phân lớp, tăng độ chính xác của dự đốn và giảm bộ nhớ lưu trữ dữ liệu vào, giảm thời gian thực hiện phân lớp [7]. 3. Phương pháp nghiên cứu Đối tượng điều tra và kích thước mẫu: Sinh viên k49, hệ chính quy tại trường Đại học Kinh tế, Đại học Huế là đối tượng điều tra của nghiên cứu này. Để đảm bảo mức độ đại diện, tổng mẫu cần thiết là 300 mẫu, được xác định theo bảng tính của Israel [5]. Tương ứng với tổng thể hơn 1,000 sinh viên k49, mức độ tin cậy 95%. Thiết kế bảng hỏi: Bảng hỏi cấu trúc được xây dựng. Trong đĩ, các câu hỏi được căn cứ vào các thuộc tính đã đề xuất. Chuẩn hĩa dữ liệu: Dữ liệu thơ ban đầu được lưu trữ dưới dạng file excel (.xlsx). Chuẩn hĩa file dữ liệu về dạng file .ARFF (Attribute Relation File Format) để cĩ thể sử dụng được trong WEKA. Ứng dụng WEKA Trích chọn thuộc tính: Nghiên cứu sử dụng đánh giá thuộc tính dựa vào các lớp đã được định nghĩa trong WEKA. Với đánh giá thuộc tính đề tài sử dụng lớp CfsSubsetEval và sử dụng phương pháp tìm kiếm BestFirst search [11]. Phân lớp: Áp dụng hai phương pháp phân lớp phổ biến được dùng trong nghiên cứu khai phá dữ liệu giáo dục là Nạve Bayes và Decision tree. 687
  5. Mơ hình xử lý dữ liệu: Nghiên cứu đề xuất mơ hình xử lý dữ liệu như sau: Đánh giá độ Dữ liệu thơ chính xác và Trích chọn thuộc tính Dữ liệu sau Phân lớp thời gian trích chọn thực hiện Kết luận Những nhân tố quyết định và mơ hình phân lớp hiệu quả nhất Hình 1. Mơ hình xử lý dữ liệu Dữ liệu thơ ban đầu được áp dụng kỹ thuật trích chọn thuộc tính để tìm ra tập dữ liệu con. Bước tiếp theo, tập dữ liệu con này sẽ được áp dụng kỹ thuật phân lớp trên đĩ. Với mỗi giải thuật, các kết quả về độ chính xác phân lớp và thời gian thực hiện được lưu lại để đánh giá và so sánh. Cuối cùng, tập con những nhân tố quan trọng được khẳng định đồng thời với mơ hình phân lớp hiệu quả nhất được đề xuất. 4. Kết quả và thảo luận 4.1. Một số đặc điểm chính của đối tượng điều tra Kết quả điều tra cho thấy, nơi sinh của sinh viên được điều tra phân bố khơng đều trên 13 tỉnh. Trong đĩ, sinh viên sinh tại Huế chiếm tỷ lệ cao nhất với 63.67%, tiếp theo là Quảng Bình với 9%, và Quảng trị với 8.33% và Hà Tĩnh là 4.67%. Số lượng sinh viên thuộc ngành Hệ thống Thơng tin Quản lý tham gia trong điều tra là 126 sinh viên, chiếm 42% tổng số phiếu điều tra. Cịn lại, 174 mẫu tương ứng với 58% là sinh viên từ các ngành học khác. Bên cạnh đĩ, số lượng sinh viên nam tham gia vào điều tra 94 mẫu, chiếm 31.33% tổng số mẫu điểu tra; Số lượng sinh viên nữ là 206 sinh viên, tương ứng với 68.67%. Trong đĩ, số lượng sinh viên nam thuộc ngành Hệ thống Thơng tin Quản lý là 55 sinh viên, chiếm 58.51% tổng số sinh viên nam được hỏi; số lượng sinh viên nữ thuộc ngành Hệ thống Thơng tin Quản lý được hỏi là 71 sinh viên, chiếm 34.46% tổng số sinh viên nữ được hỏi. 4.2. Kết quả trích chọn thuộc tính Sau khi chạy mơ hình trích chọn thuộc tính trên WEKA, dựa trên lớp đánh giá thuộc tính CfsSubsetEval và phương pháp tìm kiếm BestFirst search, kết quả cho ra 4 688
  6. thuộc tính (tương ứng với 4 nhân tố) bao gồm: giới tính, tổng điểm thi (bao gồm điểm ưu tiên), cơ hội việc làm, đam mê ứng dụng cơng nghệ thơng tin vào kinh tế. Kết quả chạy trích chọn thuộc tính trong WEKA được thể hiện trong Hình 2: === Run information === === Attribute Selection on all input data === Search Method: Best first. Start set: no attributes Search direction: forward Stale search after 5 node expansions Total number of subsets evaluated: 246 Merit of best subset found: 0.549 Attribute Subset Evaluator (supervised, Class (nominal): 39 Class): CFS Subset Evaluator Including locally predictive attributes Selected attributes: 1,8,33,37 : 4 Gioi tinh Tong diem Dam me ung dung CNTT Viec lam Hình 2. Kết quả trích chọn thuộc tính Kết quả cho thấy, những nhân tố được rút ra được từ những nghiên cứu trước, ví dụ như, yếu tố về sự tác động các đối tượng tham chiếu (Bố mẹ, thầy cơ, anh chị em, bạn bè), kiến thức hữu ích đối với cá nhân, hay nhân tố về tầm ảnh hưởng của việc quảng bá ngành học của trường đối với sinh viên khơng phải là những nhân tố quyết định đến lựa chọn ngành học Hệ thống Thơng tin Quản lý của sinh viên trường Đại học Kinh tế. Mặt khác, kết quả này phản ánh, sinh viên quyết định chọn ngành Hệ thống Thơng tin Quản lý chưa cĩ sự tìm hiểu sâu về chuyên ngành được đào tạo, lựa chọn ngành dựa chủ yếu vào cảm tính chủ quan của cá nhân. Tuy nhiên, kết quả này phù hợp với thực tế đào tạo và đặc trưng ngành Hệ thống Thơng tin Quản lý so với các ngành học khác trong trường. Thứ nhất, về giới tính, tỷ lệ sinh viên nam theo học ngành này luơn cao hơn so với sinh viên nữ. Thứ hai, để an tồn khi lựa chọn ngành, sinh viên ngành Hệ thống Thơng tin Quản lý cũng như các ngành khác luơn chú trọng đến việc lựa chọn chuyên ngành cĩ điểm đầu vào phù hợp với tổng điểm thi của mình. Thứ ba, rõ ràng khi lựa chọn học ngành Hệ thống Thơng tin Kinh tế, sinh viên cĩ nhiều cơ hội tìm kiếm việc làm bởi vì sinh viên vừa được trang bị kiến thức và kỹ năng 689
  7. cả về lĩnh vực tin học và kinh tế. Do đĩ, sinh viên cĩ thể tìm kiếm được nhiều cơ hội việc làm và cĩ nhiều lựa chọn hơn so với một số ngành khác. Cuối cùng, sinh viên tham gia học chuyên ngành này thường cĩ khả năng tìm hiểu và ứng dụng cơng nghệ thơng tin vào kinh tế nhanh hơn so với các chuyên ngành chỉ đơn thuần về kinh tế. Chính điều này đã tác động đến yếu tố cuối cùng đĩ là sự đam mê ứng dụng Cơng nghệ thơng tin vào kinh tế. Áp dụng phương pháp xếp hạng (Ranker) trong trích chọn thuộc tính, chạy dữ liệu đầu vào là 4 thuộc tính đã được chọn. Kết quả cho thấy, thuộc tính Tổng điểm được xếp thứ tự ưu tiên cao nhất tương ứng với ảnh hưởng lớn nhất đến quyết định chọn ngành, sau đĩ đến đam mê ứng dụng Cơng nghệ thơng tin vào kinh tế, giới tính, và cuối cùng là cơ hội việc làm sau khi tốt nghiệp. 4.3. Kết quả độ chính xác của phân lớp và thời gian xử lý Sau khi trích chọn 4 thuộc tính đã nêu trên, nghiên cứu thực hiện việc so sánh độ phân lớp chính xác và thời gian thực hiện mơ hình phân lớp của dữ liệu trước và sau trích chọn.Bảng kết quả được tổng hợp dưới đây: Bảng 1. Độ chính xác của phân lớp, thời gian thực hiện trước và sau khi trích chọn thuộc tính Độ chính xác phân Lớp đã được định nghĩa Thời gian Kỹ thuật lớp trong WEKA (s) (%) Trước Sau trích Trước Sau trích trích chọn chọn trích chọn chọn BayesNet 89.33 90.00 0.19 0.08 Bayes Nạve Bayes 84.67 86.00 0.03 0.03 NạveBayesMultiomialTex 58.00 58.00 0.02 0.01 t NạveBayesUpdatable 84.67 86.00 0.05 0.02 DecisionStump 88.00 88.00 0.03 0.01 HoeffdingTree 84.67 86.34 0.14 0.06 J48 88.67 92.00 0.13 0.09 Tree LMT 90.00 90.00 18.3 0.88 RandomForest 92.67 93.33 0.56 0.31 RandomTree 88.33 90.00 0.06 0.02 REPTree 87.34 90.34 0.11 0.03 (Nguồn: Kết quả chạy mơ hình sử dụng WEKA) Kết quả cho thấy, về tổng thể đối với cơ sở dữ liệu đã thu thập của đề tài, kỹ thuật phân lớp dựa trên giải thuật Cây quyết định mang lại độ chính xác phân lớp cao hơn so với kỹ thuật dựa trên giải thuật Bayes. Ví dụ, kết quả về độ phân lớp chính xác cao nhất dựa trên Bayes là 90% - cho BayesNet sau khi trích chọn thuộc tính, trong khi đối với kỹ thuậtCây quyết định, tỷ lệ phân loại chính xác cao nhất thuộc về kết quả chạy RandomForest với 93.33%. Bên cạnh đĩ, độ phân lớp chính xác thấp nhất khi chạy Cây 690
  8. quyết định trên dữ liệu đã được trích chọn là 86.34% cho HoefdingTree, trong khi độ chính xác thấp nhất khi phân lớp dựa trên kỹ thuật Bayes chỉ đạt cĩ 58% cho BạveBayesMultiomialText trên cùng dữ liệu đầu vào. Cĩ sự cải thiện đáng kể về mức độ phân loại chính xác hơn sau khi thực hiện thao tác trích chọn dữ liệu so với dữ liệu thơ. Hơn thế nữa, với tất cả các trường hợp, thời gian thực hiện mơ hình phân lớp cũng nhanh hơn đáng kể sau khi trích chọn thuộc tính quan trọng.Ví dụ, xét với giải thuật phân loại tốt nhất thuộc nhĩm Bayes, trước khi trích chọn thuộc tính, BayesNet cho kết quả phân lớp chính xác là 89.33% với thời gian xây dựng mơ hình phân lớp là 0.19s, trong khi độ chính xác của phân lớp được tăng lên 90% và thời gian xử lý chỉ cịn 0.08s sau khi dữ liệu đã được trích chọn. Thêm vào đĩ, cĩ thể thấy với giải thuật tốt nhất thuộc nhĩm Cây quyết định, mơ hình phân lớp dựa trên RandomForest cho kết quả độ chính xác phân lớp sau khi trích chọn dữ liệu cao hơn trước khi trích chọn 0.66%, trong khi thời gian xử lý giảm 0.25s. Đặc biệt, đối với giải thuật J48 thể hiện sự chênh lệch lớn nhất về độ chính xác phân lớp giữa trước và sau trích chọn. Độ chính xác tăng 3.33% từ 88.67% trước trích chọn lên 92% sau khi trích chọn dữ liệu, nhưng thời gian xử lý lại giảm xuống từ 0.13s chỉ cịn 0.09s. Mơ hình phân lớp cho độ chính xác tốt nhất dựa trên 4 thuộc tính đã được trích chọn là dựa trên giải thuật RandomForest, với độ chính xác 93.33%, được thực hiện trong 0.31s. 5. Kết luận Căn cứ vào kết quả của nghiên cứu, 4 nhân tố quan trọng ảnh hưởng đến quyết định lựa chọn ngành Hệ thống Thơng tin Kinh tế đã được xác định theo thứ tự giảm dần: Tổng điểm (bao gồm điểm ưu tiên), đam mê ứng dụng Cơng nghệ thơng tin vào kinh tế, giới tính, và cơ hội việc làm. Kết quả trên cho thấy, sinh viên ngành Hệ thống Thơng tin Quản lý đã lựa chọn ngành học của mình chủ yếu dựa vào điểm tổng xét tuyển phù hợp với điểm tuyển sinh của ngành, và dựa vào cảm tính cũng như mong muốn chủ quan của cá nhân, chưa cĩ sự tìm hiểu sâu sắc về ngành học. Nghiên cứu này cũng phần nào phản ánh một thực trạng là vai trị của nhà trường và các đối tượng tham chiếu trong việc lựa chọn ngành học này của sinh viên là chưa rõ ràng. Chính điều này đã dẫn đến một thực tế mà nhà trường đang phải đối mặt là sinh viên khơng đáp ứng được yêu cầu đào tạo do khơng biết trước yêu cầu về đào tạo, vì vậy khơng cĩ sự chuẩn bị trước về mặt kiến thức cũng như tinh thần để cĩ thể đáp ứng được yêu cầu về đầu ra. Để tăng chất lượng đào tạo, đồng thời tăng số lượng sinh viên đăng ký nhập học chuyên ngành này, vai trị của nhà trường trong việc định hướng nghề nghiệp trong các buổi hướng nghiệp cho học sinh trung học phổ thơng cần được tăng cường. Bên cạnh đĩ, việc quảng bá về ngành học cũng cần được thực hiện để người học biết đến chuyên ngành, cơ sở vật chất dành cho đào tạo chuyên ngành, đội ngũ giảng viên, yêu cầu về đầu vào, đầu ra, phẩm chất của người học, trên cơ sở đĩ, người học tự mìnhcĩ định hướng rõ ràng hơn, tin tưởng hơn đối với chuyên ngành theo học, và họ sẽ trở thành trung tâm của hoạt 691
  9. động học tập. Khi người học đã chủ động và là trung tâm của hoạt động học tập thì nhà trường đã đạt được một trong những nhân tố vơ cùng quan trọng đánh giá giáo dục bền vững, điều này chính là cơ sở cho sự phát triển bền vững về mọi mặt, trong đĩ cĩ phát triển kinh tế bền vững. TÀI LIỆU THAM KHẢO Ahmed, Abeer Badr El Din, and Ibrahim Sayed Elaraby. 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer Application and Technology: 2 (2):43-47. Beggs, Jeri Mullins, John H Bantham, and Steven Taylor. 2008. Distinguishing the factors influencing college students'choice of major. College Student Journal: 42 (2):381. Bottou, Léon, Corinna Cortes, John S Denker, Harris Drucker, Isabelle Guyon, Lawrence D Jackel, Yann LeCun, Urs A Muller, Edward Sackinger, and Patrice Simard. 1994. Comparison of classifier methods: a case study in handwritten digit recognition. Paper read at Pattern Recognition, 1994. Vol. 2-Conference B: Computer Vision & Image Processing., Proceedings of the 12th IAPR International. Conference on. Edmonds, Jill. 2012. Factors influencing choice of college major: what really makes a difference? Israel, Glenn D. 1992. Determining sample size: University of Florida Cooperative Extension Service, Institute of Food and Agriculture Sciences, EDIS Gainesville. Keshishian, Flora, Joseph M Brocavich, R Thomas Boone, and Somnath Pal. 2010. Motivating factors influencing college students' choice of academic major. American journal of pharmaceutical education: 74 (3):46. Koller, Daphne, and Mehran Sahami. 1996. Toward optimal feature selection. Stanford InfoLab. Lan Hương, Thị Nguyễn 2012. Nghiên cứu các yếu tố ảnh hưởng đến động cơ chọn ngành quản trị doanh nghiệp của sinh viên trường Cao đẳng Kinh tế-Kế hoạch Đà Nẵng. My, Trà. 2005. Báo người lao động. Voznika, Fabricio, and Leonardo Viana. 2007. Data Mining Classification. WekaSource. Available from ( Xiao, Zhenyu, Dengfeng Wang, and Yang Liu. 2009. Economic environment and personality: how do they influence investment decisions and regret? Social Behavior and Personality: 37 (10):1297-1304. Yazici, Sedat, and Yazici Asli. 2010. Students' choice of college major and their perceived fairness of the procedure: Evidence from Turkey. Educational Research and Evaluation: 16 (4):371-382. 692