MÔ HÌNH DỰ ĐOÁN GEN TƯƠNG QUAN VỚI HỆ THỐNG VẬT CHỦ DÙNG TRONG TÁI TỔ HỢP

Dương Thị Kim Chi, Trần Văn Lăng



DOI: 10.15625/vap.2017.00049

Abstract


Gen mục tiêu là đoạn gen quý được dùng để nhân dòng hay tổng hợp protein trong y học, dược học bằng công nghệ tái tổ hợp. Nhu cầu sử dụng codon của gen mục tiêu trong quá trình dịch mã rất khác biệt giữa các loài nên dự đoán tốt sự tương quan về xu hướng sử dụng codon cho quá trình này sẽ nâng cao hiệu quả biểu hiện cho gen mục tiêu. Với số lượng gen lớn, phân bố codon trong hệ thống biểu hiện không đều (thưa) nên khó xác định mức độ đáp ứng của các hệ thống biểu hiện. Trong phạm vi bài viết chúng tôi đề xuất giải pháp xây dựng mô hình dự đoán tương quan của gen mục tiêu với hệ thống vật chủ biểu hiện dựa trên phương pháp học máy và thuật toán phân lớp kết hợp Extreme Gradient Boosting Mô hình đề xuất cho kết quả tốt hơn về thời gian thực thi và độ dự đoán cũng chính xác hơn so với mô hình được xây dựng bằng Random Forest trên cùng bộ dữ liệu huấn luyện và bộ dữ liệu kiểm thử.

Keywords


DNA tái tổ hợp, Relative Synonymous Codon Usage, Gradient Boosting Tree, Extreme Gradient Boosting, Regression Trees, Random Forest



Copyright (c) 2018 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn