MỘT GIẢI PHÁP VIỆT HÓA CÁCH PHÁT ÂM CÁC TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT
DOI: 10.15625/vap.2017.00060
Abstract
Các ứng dụng liên quan đến xử lý ngôn ngữ tự nhiên và tiếng nói cho tiếng Việt thường gặp khó khăn khi văn bản đầu vào chứa các từ ngữ của tiếng nước ngoài, trong đó phổ biến nhất là tiếng Anh. Để có thể xử lý văn bản một cách đầy đủ, các từ ngữ nước ngoài này cần được phiên âm sang một dạng có thể đánh vần được trong tiếng Việt. Bài báo này đưa ra một giải pháp Việt hóa cách phát âm các từ vựng tiếng Anh dựa trên từ điển CMU và các quy tắc ngôn ngữ học. Bằng việc nghiên cứu sự tương đồng về ngữ âm giữa tiếng Anh và tiếng Việt cùng với các quy tắc ghép âm vần, thanh điệu trong tiếng Việt, chúng tôi đã tạo bảng ánh xạ từ một âm vị tiếng Anh sang một âm vị tiếng Việt và triển khai thuật toán tách một chuỗi âm vị tiếng Anh thành các âm tiết tương ứng trong tiếng Việt. Từ đó chúng tôi xây dựng được một công cụ tự động phiên âm một từ vựng tiếng Anh bất kỳ thành chuỗi âm tiết tiếng Việt. Công cụ này đã được tích hợp vào một phần mềm chuyển văn bản thành tiếng nói và cho thấy tính hữu dụng của nó.
Keywords
Xử lý ngôn ngữ tự nhiên, ngữ âm học, âm vị học, từ điển CMU, bảng phiên âm quốc tế
Full Text:
PDF (Tiếng Việt)Copyright (c) 2018 PROCEEDING of Publishing House for Science and Technology
PROCEEDING
PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY
Website: http://vap.ac.vn
Contact: nxb@vap.ac.vn