MỘT SỐ VẤN ĐỀ VỀ KHAI PHÁ ĐỒ THỊ CON THƯỜNG XUYÊN ĐÓNG

Hoàng Minh Quang, Vũ Đức Thi, Vũ Thị Lan Anh



DOI: 10.15625/vap.2017.00075

Abstract


Phân loại hay phân lớp dữ liệu là một phương pháp quan trọng trong khai phá dữ liệu. Có rất nhiều phương pháp phân loại dữ liệu, trong số đó phân loại dữ liệu bằng cây quyết định là một phương pháp phổ biến và hiệu quả. Các thuật toán như ID3 hay C4.5 được ứng dụng trong nhiều ứng dụng để phân loại dữ liệu. Trong bài báo này chúng tôi đề xuất một phương pháp sinh cây quyết định từ bảng quyết định nhất quán không dựa trên hàm thông tin Entropy như các thuật toán ID3 hay C4.5 đang thực hiện mà vẫn mang lại hiệu quả tương đương thậm chí còn tốt hơn.

Keywords


phân loại dữ liệu, cây quyết định, rút gọn thuộc tính, rút gọn đối tượng, thuật toán xây dựng cây quyết định



Copyright (c) 2019 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn