MỘT GIẢI PHÁP VIỆT HÓA CÁCH PHÁT ÂM CÁC TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT

Triệu Thị Ly Ly, Bùi Thanh Sơn, Lê Thị Hà Bình, Ninh Khánh DuyDOI: 10.15625/vap.2017.00060

Abstract


Các ứng dụng liên quan đến xử lý ngôn ngữ tự nhiên và tiếng nói cho tiếng Việt thường gặp khó khăn khi văn bản đầu vào chứa các từ ngữ của tiếng nước ngoài, trong đó phổ biến nhất là tiếng Anh. Để có thể xử lý văn bản một cách đầy đủ, các từ ngữ nước ngoài này cần được phiên âm sang một dạng có thể đánh vần được trong tiếng Việt. Bài báo này đưa ra một giải pháp Việt hóa cách phát âm các từ vựng tiếng Anh dựa trên từ điển CMU và các quy tắc ngôn ngữ học. Bằng việc nghiên cứu sự tương đồng về ngữ âm giữa tiếng Anh và tiếng Việt cùng với các quy tắc ghép âm vần, thanh điệu trong tiếng Việt, chúng tôi đã tạo bảng ánh xạ từ một âm vị tiếng Anh sang một âm vị tiếng Việt và triển khai thuật toán tách một chuỗi âm vị tiếng Anh thành các âm tiết tương ứng trong tiếng Việt. Từ đó chúng tôi xây dựng được một công cụ tự động phiên âm một từ vựng tiếng Anh bất kỳ thành chuỗi âm tiết tiếng Việt. Công cụ này đã được tích hợp vào một phần mềm chuyển văn bản thành tiếng nói và cho thấy tính hữu dụng của nó.

Keywords


Xử lý ngôn ngữ tự nhiên, ngữ âm học, âm vị học, từ điển CMU, bảng phiên âm quốc tếCopyright (c) 2018 PROCEEDING of Publishing House for Science and TechnologyPROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn