MỘT PHƯƠNG PHÁP HỌC BÁN GIÁM SÁT CHO LỌC KẾT HỢP

Đỗ Thị Liên, Nguyễn Duy Phương



DOI: 10.15625/vap.2016.00052

Abstract


Hệ tư vấn (recommender systems) là hệ thống tự động cung cấp thông tin phù hợp và gỡ bỏ thông tin không phù hợp cho mỗi người dùng. Hệ tư vấn được xây dựng dựa trên hai kỹ thuật lọc thông tin chính: Lọc cộng tác (collaborative filtering) và lọc nội dung (content-based filtering). Lọc nội dung thực hiện hiệu quả trên các dạng thông tin văn bản nhưng gặp khó khăn trong trích chọn đặc trưng đối với các dạng thông tin đa phương tiện. Lọc cộng tác thực hiện tốt trên tất cả các dạng thông tin nhưng gặp phải vấn đề dữ liệu thưa, người dùng mới và sản phẩm mới. Trong bài báo này, chúng tôi đề xuất một mô hình lọc kết hợp giữa lọc cộng tác và lọc nội dung bằng phương pháp học bán giám sát. Mô hình được xây dựng dựa trên hai thủ tục bán giám sát: bán giám sát tập đánh giá người dùng cùng tập đặc trưng sản phẩm và bán giám sát tập đánh giá sản phẩm cùng tập đặc trưng người dùng. Bán giám sát tập đánh giá người dùng cùng tập đặc trưng sản phẩm cho phép ta phát hiện ra những sản phẩm mới có khả năng phù hợp cao đối với người dùng này. Bán giám sát tập láng giềng theo sản phẩm cùng tập đặc trưng người dùng cho phép ta phát hiện ra những người dùngmới có khả năng phù hợp cao đối với sản phẩm này. Hai thủ tục bán giám sát thực hiện đồng thời và bổ sung qua lại cho nhau các giá trị dự đoán chắc chắn để nâng cao kết quả tư vấn. Kết quả thử nghiệm trên các bộ dữ liệu thực về phim cho thấy phương pháp đề xuất tận dụng hiệu quả ưu điểm và hạn chế đáng kể nhược điểm của mỗi phương pháp lọc.

Keywords


Tư vấn cộng tác, tư vấn theo nội dung, hệ tư vấn lai, tư vấn bằng phương pháp học có giám sát, tư vấn bằng phương pháp học không giám sát, tư vấn bằng phương pháp học bán giám sát



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn