RÚT TRÍCH VÀ CHUẨN HÓA KHÁI NIỆM Y TẾ TRÊN TÀI LIỆU LÂM SÀNG

Huỳnh Hữu Nghĩa, Hồ Quốc BảoDOI: 10.15625/vap.2017.00098

Abstract


Các bác sĩ và những người chăm sóc sức khỏe thường xuyên có nhu cầu cập nhật thông tin từ những kết quả nghiên cứu khoa học và tham khảo những kết quả điều trị từ các tài liệu trong hồ sơ bệnh án điện tử. Bên cạnh đó, bệnh nhân (hoặc thân nhân) cũng có quyền hiểu biết về bệnh án của mình và nhiều kiến thức liên quan, sự hiểu biết này càng giúp cho quá trình điều trị được tốt hơn. Tuy nhiên, việc cập nhật và hiểu biết về tài liệu bệnh án đối với người dùng (bác sĩ, người chăm sóc sức khỏe, bệnh nhân,...) đang gặp vấn đề quá tải về số lượng tài liệu, tài liệu y tế được tạo ra hàng ngày và lưu trữ trong các hệ thống máy tính. Vì vậy, việc rút trích những thông tin có ích (khái niệm và mối quan hệ) từ tài liệu y tế cung cấp cho người dùng là một nhu cầu rất thiết thực. Tài liệu y tế được viết theo ngôn ngữ tự nhiên và trình bày theo dạng văn bản không có cấu trúc (hoặc bán cấu trúc), cho nên việc rút trích thông tin từ tài liệu là một thách thức đối với các hệ thống xử lý ngôn ngữ tự nhiên Thời gian gần đây, cộng đồng nghiên cứu đang tập trung giải quyết những bài toán liên quan đến rút trích thông tin y tế chẳng hạn như: rút trích khái niệm, mối quan hệ và sự kiện. Trong phạm vi bài báo này, nhóm tác giả trình bày một hướng tiếp cận rút trích và chuẩn hóa khái niệm y tế xuất hiện trong các tài liệu lâm sàng, trong đó nhóm tác giả đề xuất một bộ nhãn gán cho từng token, tập đặc trưng phân lớp nhãn token và xây dựng hệ thống rút trích khái niệm dựa trên thuật toán phân lớp học máy CRF (Conditional Random Fields). Hướng tiếp cận được sử dụng tham gia diễn đàn nghiên cứu SemEval 2015, kết quả do tổ chức SemEval đánh giá và công bố, hiệu quả của hệ thống đạt độ chính xác (precision) là 0.720, độ bao phủ (recall) là 0.690 và độ hài hòa (F-score) là 0.704.

Keywords


Rút trích thông tin lâm sàng; Rút trích khái niệm y tế; Xử lý ngôn ngữ tự nhiênCopyright (c) 2019 PROCEEDING of Publishing House for Science and TechnologyPROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn