MỘT GIẢI PHÁP QUẢN LÝ DỮ LIỆU THAM GIA PHÂN LỚP TRONG MÔ HÌNH HỌC BÁN GIÁM SÁT

Phạm Anh Phương, Quách Hải Thọ



DOI: 10.15625/vap.2017.00059

Abstract


Mô hình học máy tiên tiến với phương pháp phân lớp bán giám sát đã thu hút sự quan tâm của nhiều nhà nghiên cứu, một vài nghiên cứu đã chỉ ra rằng trong một số trường hợp các phương pháp phân lớp bán giám sát thực hiện không hiệu quả bằng các phương pháp phân lớp có giám sát, từ đó làm giảm độ tin cậy trong các ứng dụng thực tế. Với mong muốn phát triển một phương pháp phân lớp bán giám sát có tính đến độ an toàn của tập dữ liệu huấn luyện để thực hiện phân lớp tốt hơn so với phương pháp có giám sát, bài báo này đề xuất một giải pháp quản lý dữ liệu tham gia phân lớp đối với mô hình học bán giám sát bằng cách kiểm soát sự cân bằng giữa phân lớp bán giám sát và phân lớp có giám sát khi có sự tham gia của các dữ liệu không gán nhãn trong việc phân lớp. Các kết quả thực nghiệm cho thấy hiệu suất tổng thể của giải pháp chúng tôi đề xuất có khả năng cạnh tranh để áp dụng với mô hình học bán giám sát.

Keywords


Semi-supervised classification; Semi-supervised improvement; Manifold; Clustering; least-square support vector machine (LS-SVM)



Copyright (c) 2018 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn