Banner

Tên đề tài: “HỆ THỐNG GỢI Ý DỰA TRÊN NĂNG LƯỢNG

Tác giả: Trần Thị Cẩm Tú, Khóa: 2020

Ngành: Hệ thống thông tin; Mã số: 62480104. Nhóm ngành: Máy tính và công nghệ thông tin

Người hướng dẫn: GS.TS. Huỳnh Xuân Hiệp - Trường Đại học Cần Thơ

  1. Tóm tắt nội dung luận án

Mục tiêu của bài toán lọc cộng tác là tìm ra các ánh xạ chính xác và hiệu quả từ dữ liệu được đánh giá trước đó tại các mục của người dùng. Cải thiện lọc cộng tác dựa trên mục (IBCF) và lọc cộng tác dựa trên người dùng (UBCF) liên quan đến việc hiểu toán học của các phép đo khoảng cách và tìm sự cân bằng phù hợp giữa việc tính toán độ tương đồng và cung cấp các khuyến nghị chính xác. Tuy nhiên, các phép đo khoảng cách phổ biến cho các mô hình khuyến nghị chỉ tập trung vào đo các giá trị xếp hạng theo cặp giữa một người dùng và một người dùng khác hoặc giữa một mục và một mục khác. Trong luận án này, chúng tôi đã đề xuất một mô hình khuyến nghị mới, đó là xây dựng một mô hình lọc cộng tác theo tiếp cận thế năng. Phương pháp thống kê năng lượng tập trung vào việc đo các giá trị xếp hạng của một đối tượng với tất cả các giá trị xếp hạng của đối tượng khác; khoảng cách năng lượng cung cấp ước tính cải tiến về khoảng cách năng lượng. Các kết quả thử nghiệm được phát triển trên tập dữ liệu Jester5k và MovieLens100k, với các phương pháp phân hoạch dữ liệu như cross-validation, split, boostrap. Bên cạnh đó, để so sánh kết quả của mô hình đề xuất với các mô hình có sẵn trong gói recommenderlab, chúng tôi cũng đã sử dụng các giá trị Precision-Recall, F-measure, Accuracy, Threat Score, Matthews Correlation Coefficient (MCC),... để đánh giá độ chính xác của mô hình. Ngoài ra các chỉ số để đánh giá sai số như: RMSE, MAE, MSE,...cũng được sử dụng để so sánh sai số của mô hình đề xuất với các mô hình gợi ý khác. Kết quả thực nghiệm cho thấy việc sử dụng thống kê năng lượng trong hệ thống khuyến nghị đã cải thiện chất lượng của các khuyến nghị được tạo ra.

  1. Những kết quả mới của luận án

-  Đề xuất phương pháp thống kê khoảng cách năng lượng dựa trên tiếp cận mối quan hệ tương thích giữa các người dùng và giữa các mục tin. Phương pháp này giúp lựa chọn được độ đo phù hợp cho các mô hình gợi ý lọc cộng tác. 

-  Đề xuất mô hình gợi ý lọc cộng tác dựa trên thống kê khoảng cách năng lượng. Mô hình đề xuất giải quyết cho lớp bài toán gợi ý nhằm đo sự thiếu tương thích giữa người với người dùng và giữa mục tin với mục tin. Kết quả thực nghiệm trên hai tập dữ liệu Jester5k và Movielens cho thấy mô hình đã hỗ trợ tốt cho người dùng khi số lượng xếp hạng đã biết (given) càng lớn thì các giá trị Precision, Recall và F1 càng cao. Ngoài ra, sai số RMSE và MAE của mô hình đề xuất thấp hơn sai số RMSE và MAE của mô hình được so sánh.

-  Đề xuất mô hình gợi ý nhóm dựa trên năng lượng. Cách tiếp cận này dựa trên khoảng cách năng lượng giữa người dùng và người dùng để tạo ra mô hình đề xuất riêng; sau đó, sử dụng thống kê thế năng để xác định mối quan hệ giữa một nhóm người dùng và một nhóm người dùng, và cuối cùng là đưa ra danh sách các gợi ý cho nhóm. Mô hình được thực nghiệm trên hai tập dữ liệu Jester5k và MovieLens. Kết quả thực nghiệm cho thấy mô hình gợi ý lọc cộng tác nhóm dựa trên năng lượng có độ chính xác cao hơn so và sai số thấp hơn với các mô hình được so sánh có sẵn.

-  Đề xuất xây dựng hệ thống gợi ý với tương quan khoảng cách, sử dụng độ đo tương quan khoảng cách với tiếp cận thống kê năng lượng để cải thiện độ chính xác của mô hình gợi ý lọc cộng tác dựa trên người dùng. Qua kết quả thực nghiệm trên hai tập dữ liệu: tập dữ liệu Jester5k cho thấy mô hình sử dụng tương quan khoảng cách có độ chính xác cao hơn so với mô hình sử dụng một số độ đo tương đồng có sẵn trong gói “recommenderlab”.

  1. Các ứng dụng/khả năng ứng dụng trong thực tiễn, các vấn đề cần tiếp tục nghiên cứu

Luận án có thể tiếp tục mở rộng các hướng nghiên cứu như sau:

- Xây dựng Recbole tương thích dựa trên phương pháp thống kê năng lượng cho mô hình gợi ý lọc cộng tác nhằm giảm thời gian tính toán, tăng độ chính xác, và giảm sai số tối đa cho các hệ thống gợi ý trực tuyến đáp ứng được các yêu cầu của người dùng.

- Xây dựng mô hình gợi ý lọc cộng tác dựa trên đồ thị (Graph based recommendation) sử dụng phương pháp thống kê năng lượng.

- Xây dựng mô hình gợi ý lọc cộng tác với thống kê năng lượng và thử nghiệm trên tập dữ liệu với vector xếp hạng của người dùng và mục tin có kích thước không bằng nhau.

- Xây dựng mô hình gợi ý lọc cộng tác với năng lượng và so sánh với các phương pháp khác như phương pháp phân rã ma trận (là một state-of-the-art trong hệ thống gợi ý hiện nay)

- Xây dựng mô hình so sánh với các baseline mạnh hơn (SVD++, NMF. NCF, LightGCN) và trên bộ dữ liệu lớn hơn (Movielens-1M/20M).

  1. Content of thesis summary

The goal of the collaborative filtering problem is to find the accurate and efficient mappings from previously rated data at items of the users. Improving Item-based collaborative filtering (IBCF) and User-based collaborative filtering (UBCF) involves understanding the mathematics of distance measures and finding the right balance between calculating similarity and providing the recommendations very accurate. However, common distance measures for recommendation models only focus on measuring pairwise rating values between a user and another user or between an item and another item. In this paper, we propose a new recommendation model, which is to build a collaborative filtering model based on the potential energy approach. The energy statistics method focuses on measuring the rating values of an object with all the rating values of other objects; the energy distance provides an improved estimate of the energy distance. Experimental results are developed on the Jester5k and MovieLens100k datasets, with the data partitioning methods such as cross-validation, split, and boostrap. In addition, to compare the results of the proposed model with the available models in the recommenderlab package, we also used the indexes: Precision-Recall, F-measure, Accuracy, Threat Score, Matthews Correlation Coefficient (MCC),... to evaluate the accuracy of the models. In addition, the error evaluation indexes such as: RMSE, MAE, MSE,... all are also used to compare the error of the proposed models with other suggested models. Experimental results show that the using of energy statistics in the recommender system has improved the quality of the generated recommendations.

  1. The novel aspects from the thesis

The key findings of the dissertation can be summarized as follows:

- Proposed an energy distance statistical method based on user and item compatibility relationships. This approach helps in selecting the most suitable measurement metric for collaborative filtering recommendation models. 

-  Proposed a collaborative filtering recommendation model based on energy distance statistics. This model addresses recommendation problems by measuring incompatibility between users and between items. Experimental results on the Jester5k and Movielens datasets demonstrate that the model effectively supports users. As the number of known ratings (Given) increases, the values of Precision, Recall, and F1-score also improve. Additionally, the RMSE and MAE errors of the proposed model are lower than those of the comparison models.

- Proposed a group recommendation model based on energy distance. This approach first utilizes energy distance between users to create individual recommendation models. Then, it applies potential energy statistics to determine relationships between user groups before generating group recommendation lists. The model was tested on Jester5k and MovieLens datasets. Experimental results indicate that the energy-based collaborative filtering group recommendation model achieves higher accuracy and lower errors compared to pre-existing comparison models.

- Proposed the development of a recommendation system using distance correlation, integrating energy statistical approaches to enhance the accuracy of user-based collaborative filtering models. Experimental results on two datasets, particularly Jester5k, demonstrate that the distance correlation-based model achieves higher accuracy compared to models utilizing pre-existing similarity measures available in the “recommenderlab” package.

  1. Application prospect and suggestions for further study

The dissertation can be expanded into the following research directions:

Develop a compatible Recbole based on the energy statistics method for collaborative filtering recommendation models to reduce computation time, increase accuracy, and minimize maximum error for online recommendation systems that meet user requirements.

Build a graph-based collaborative filtering recommendation model using the energy statistics method.

Develop a collaborative filtering recommendation model with energy statistics and experiment on datasets with user and item ranking vectors of unequal sizes.

Build a collaborative filtering recommendation model with energy and compare it with other methods, such as matrix factorization (which is a state-of-the-art approach in current recommendation systems).

Develop a model for comparison with stronger baselines (SVD++, NMF, NCF, LightGCN) and on larger datasets (MovieLens-1M/20M).

 

 

Hướng dẫn HVCH nhập Kế hoạch học tập lên Hệ thống quản lý

Số lượt truy cập

29115819
Hôm nay
Tuần này
Tháng này
Tổng số lượt truy cập
17953
153419
607502
29115819
Vinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.x