VỀ CẢI TIẾN PHƯƠNG PHÁP FUZZY RANDOM FOREST, ỨNG DỤNG CHO PHÂN LỚP DỮ LIỆU KHÔNG CHẮC CHẮN

Nguyễn Anh Thơ, Nguyễn Long Giang, Cao Chính Nghĩa



DOI: 10.15625/vap.2016.00099

Abstract


Các thuật toán khai phá dữ liệu và máy học truyền thống thực hiện phân lớp với dữ liệu đã được xử lý để loại bỏ dữ liệu nhiễu, dữ liệu thiếu chính xác và dữ liệu không đầy đủ, dữ liệu không chắc chắn. Chúng tôi phát hiện ra rằng độ chính xác phân lớp có thể được cải thiện với dữ liệu không chắc chắn khi sử dụng sức mạnh ngẫu nhiện của phương pháp Fuzzy Random Forest (FRF) để tăng sự đa dạng của cây và sự linh hoạt của tập mờ. Chúng tôi mở rộng phương pháp FRF để xử lý với bộ với các giá trị thiếu, dữ liệu không chắc với kỹ thuật cắt tỉa cây trước khi bổ sung vào trong rừng, mà rất có thể cải thiện được độ chính xác phân lớp và kích thước bộ nhớ lưu trữ các cây của FRF.

Keywords


Cây quyết định mờ, rừng ngẫu nhiên mờ, phân lớp mờ, phân hoạch mờ



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn