SO SÁNH MÔ HÌNH HỌC SÂU VỚI CÁC PHƯƠNG PHÁP HỌC TỰ ĐỘNG KHÁC TRONG PHÂN LỚP DỮ LIỆU BIỂU HIỆN GEN MICROARRAY

Huỳnh Phước Hải, Nguyễn Văn Hoà, Đỗ Thanh Nghị



DOI: 10.15625/vap.2017.00099

Abstract


Hiện nay các mô hình học sâu (Deep Learning) tiêu biểu như mô hình mạng nơron tích chập (Convolutional Neural Networks - CNNs) được ứng dụng thành công trong bài toán phân lớp ảnh, văn bản, nhận dạng tiếng nói. Ưu điểm của các mô hình học sâu là tự động học các đặc trưng của dữ liệu để thiết lập các đặc trưng mới và phân lớp dữ liệu. Trong bài báo này chúng tôi đề xuất xây dựng mô hình kiến trúc mạng nơron tích chập để phân lớp dữ liệu biểu hiện gen microarray có số chiều lớn. Kết quả thực nghiệm trên 10 tập dữ liệu biểu hiện gen microarray được lấy từ ngân hàng dữ liệu y sinh (Kent Ridge) và cơ sở dữ liệu Gene Expression Omnibus (GEO) của NCBI cho thấy rằng mô hình mạng nơron tích chập có độ chính xác cao hơn các mô hình đơn giản như k láng giềng (k Nearest Neighbors - kNN), cây quyết định (Decision Tree). Mạng nơron tích chập đạt được độ chính xác tương đương với mô hình máy học véctơ hỗ trợ (Support Vector Machines - SVM), rừng ngẫu nhiên (Random Forest) và tốt hơn so với Adaboost và Bagging của cây quyết định.

Keywords


Mô hình học sâu, mạng nơron tích chập, phân lớp dữ liệu biểu hiện gen microarray, k láng giềng, cây quyết định, máy học véctơ hỗ trợ, rừng ngẫu nhiên, Bagging, Adaboost



Copyright (c) 2019 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn