PHÂN TÍCH CÚ PHÁP CÂU ĐƠN TIẾNG VIỆT ĐỂ XÂY DỰNG CÔNG CỤ DECONVERTER

Phan Thị Lệ Thuyền, Võ Trung Hùng



DOI: 10.15625/vap.2017.00089

Abstract


Ngôn ngữ UNL (Universal Networking Language) đã được nhiều nhà nghiên cứu sử dụng như một ngôn ngữ trung gian trong dịch tự động. Hệ thống dịch tự động dựa vào UNL bao gồm hai thành phần chính là EnConverter và DeConverter. DeConverter sử dụng để tạo ra ngôn ngữ tự nhiên từ biểu thức UNL dựa vào bộ từ điển UNL - ngôn ngữ tự nhiên và tập luật giải mã. Trong bài báo này, chúng tôi trình bày giải pháp xây dựng công cụ chuyển đổi một biểu thức UNL có một hay nhiều nút con sang câu tiếng Việt tương ứng gọi là DeCovie. Chúng tôi tiến hành phân tích ngữ pháp giữa biểu thức UNL có một hoặc nhiều nút con và câu đơn trong tiếng Việt và đề xuất loại luật để chuyển đổi từ biểu thức UNL sang câu đơn tiếng Việt. Chúng tôi sử dụng 200 biểu thức UNL để chuyển đổi sang tiếng Việt, kết quả dịch rất tốt so với các công cụ Deconverter khác.

Keywords


Dịch máy, Ngôn ngữ mạng dùng chung, dịch liên ngôn ngữ, xử lý ngôn ngữ tự nhiên, giải mã



Copyright (c) 2019 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn