PHÂN TÍCH CÚ PHÁP CÂU ĐƠN TIẾNG VIỆT ĐỂ XÂY DỰNG CÔNG CỤ DECONVERTER
DOI: 10.15625/vap.2017.00089
Abstract
Ngôn ngữ UNL (Universal Networking Language) đã được nhiều nhà nghiên cứu sử dụng như một ngôn ngữ trung gian trong dịch tự động. Hệ thống dịch tự động dựa vào UNL bao gồm hai thành phần chính là EnConverter và DeConverter. DeConverter sử dụng để tạo ra ngôn ngữ tự nhiên từ biểu thức UNL dựa vào bộ từ điển UNL - ngôn ngữ tự nhiên và tập luật giải mã. Trong bài báo này, chúng tôi trình bày giải pháp xây dựng công cụ chuyển đổi một biểu thức UNL có một hay nhiều nút con sang câu tiếng Việt tương ứng gọi là DeCovie. Chúng tôi tiến hành phân tích ngữ pháp giữa biểu thức UNL có một hoặc nhiều nút con và câu đơn trong tiếng Việt và đề xuất loại luật để chuyển đổi từ biểu thức UNL sang câu đơn tiếng Việt. Chúng tôi sử dụng 200 biểu thức UNL để chuyển đổi sang tiếng Việt, kết quả dịch rất tốt so với các công cụ Deconverter khác.
Keywords
Dịch máy, Ngôn ngữ mạng dùng chung, dịch liên ngôn ngữ, xử lý ngôn ngữ tự nhiên, giải mã
Full Text:
PDF (Tiếng Việt)Copyright (c) 2019 PROCEEDING of Publishing House for Science and Technology
PROCEEDING
PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY
Website: http://vap.ac.vn
Contact: nxb@vap.ac.vn