ÁP DỤNG MÔ HÌNH ẨN KẾT HỢP THUẬT TOÁN BIMETA TRONG VIỆC GOM NHÓM TRÌNH TỰ METAGENOMIC

Văn Đình Vỹ Phương, Trần Văn Lăng, Trần Văn Hoài, Lê Văn Vinh



DOI: 10.15625/vap.2016.0007

Abstract


Phân nhóm và xác định loài trong metagenomic là một trong những bài toán lớn của lĩnh vực Sinh-Tin học hiện nay. Bài báo trình bày giải pháp gom nhóm các trình tự trong metagenomic áp dụng mô hình ẩn (Latent Dirichlet Allocation) để tìm chủ đề ẩn có ý nghĩa, làm chủ đề đặc trưng cho trình tự. Từ chủ đề đặc trưng, tiến hành xác định nhóm của trình tự bằng phương pháp Kullback Leibler dựa trên sự phân bổ của chủ đề thay vì tính toán trực tiếp giữa các trình tự. Giải pháp kế thừa thuật toán BiMeta, tạo các nhóm trình tự gốc dựa vào thông tin trùng lắp trước khi áp dụng mô hình ẩn tìm chủ đề, khi đó, dữ liệu phân tích để tìm chủ đề ẩn được giảm đáng kể.

Keywords


metagenomic, gom nhóm, trình tự, LDA



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn