CẢI THIỆN HIỆU NĂNG HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT VỚI THÔNG TIN VỀ PHƯƠNG NGỮ

Phạm Ngọc Hưng, Trịnh Văn Loan, Nguyễn Hồng Quang, Trần Vũ Duy



DOI: 10.15625/vap.2016.0009

Abstract


Tiếng Việt là ngôn ngữ có thanh điệu và có nhiều phương ngữ khác nhau. Ảnh hưởng của yếu tố phương ngữ tới các hệ thống nhận dạng tự động tiếng Việt nói là đáng kể. Có nhiều phương pháp khác nhau đã được nghiên cứu và áp dụng cho nhận dạng phương ngữ như GMM (Gaussian Mixture Model), Supervector,... Bài báo trình bày kết quả thử nghiệm nhận dạng phương ngữ tiếng Việt và việc cải thiện hiệu năng của hệ thống nhận dạng tiếng Việt khi có thông tin về phương ngữ. Ngữ liệu dùng cho nhận dạng là phương ngữ của ba giọng Hà Nội, Huế, Thành phố Hồ Chí Minh đại diện cho ba miền Bắc, Trung, Nam. Mô hình GMM đã được dùng để nhận dạng phương ngữ. Kết quả thử nghiệm cho thấy, tỷ lệ nhận dạng đúng phương ngữ tiếng Việt đạt 71% khi sử dụng các tham số MFCC kết hợp với F0 chuẩn hóa theo trung bình của F0, tăng 12% so với trường hợp chỉ sử dụng MFCC. Tỷ lệ nhận dạng tiếng Việt nói sử dụng HMM được nâng cao khi bổ sung thông tin về phương ngữ với lỗi từ là 6,76%, giảm 2,61% so với trường hợp chưa có thông tin phương ngữ.

Keywords


Nhận dạng phương ngữ, tiếng Việt, GMM, HMM, MFCC, tần số cơ bản, nhận dạng tiếng Việt nói



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn