ỨNG DỤNG ĐỒ THỊ CÓ HƯỚNG KHÔNG TRỌNG SỐ NHẬN DIỆN TỪ TRONG VĂN BẢN TIẾNG KHMER

Trần Văn Nam, Sơn Phú Quý, Nguyễn Thị Huệ, Phan Huy Khánh



DOI: 10.15625/vap.2017.000111

Abstract


Chúng tôi tiếp tục thực hiện bài toán tách từ còn tồn động ở bài báo trước [5]. Bài báo đề xuất giải pháp tách từ dựa trên so khớp âm tiết, sử dụng kho ngữ liệu cấu trúc âm tiết tiếng Khmer đã xây dựng, sử dụng kết quả so khớp được thực hiện xây dựng đồ thị có hướng không có trọng số đón nhận từ vựng. Từ đó có được tất cả các cách phân tách câu. Hướng tiếp cận hoàn toàn khả thi và có kết quả thử nghiệm đạt độ chính xác cao, nhận diện từ mới ở mức âm tiết, nhận diện câu có nhập nhằng, góp phần giải quyết bài toán tách từ ứng dụng hiệu quả trong xử lý tiếng Khmer.

Keywords


đồ thị, tách từ, kho ngữ liệu cấu trúc âm tiết, nhập nhằng, tiếng Khmer



Copyright (c) 2019 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn