NHẬN DẠNG PHƯƠNG NGỮ TIẾNG VIỆT  SỬ DỤNG MFCC VÀ TẦN SỐ CƠ BẢN

Phạm Ngọc Hùng; Trịnh Văn Loan; Nguyễn Hồng Quang

doi:10.15625/vap.2015.000190

NHẬN DẠNG PHƯƠNG NGỮ TIẾNG VIỆT SỬ DỤNG MFCC VÀ TẦN SỐ CƠ BẢN

Phạm Ngọc Hùng, Trịnh Văn Loan, Nguyễn Hồng Quang

DOI: 10.15625/vap.2015.000190

Abstract

Nhận dạng phương ngữ đã được nghiên cứu cho nhiều ngôn ngữ trên thế giới tuy nhiên với phương ngữ tiếng Việt, nghiên cứu theo phương diện xử lý tín hiệu đến nay vẫn còn hạn chế, chưa có nhiều công trình được công bố. Tiếng Việt là ngôn ngữ có nhiều phương ngữ khác nhau. Ảnh hưởng của yếu tố phương ngữ tới các hệ thống nhận dạng tự động tiếng nói là rất đáng kể. Nếu biết trước tiếng nói cần nhận dạng thuộc phương ngữ nào thì việc nhận dạng nội dung sẽ thuận lợi hơn do ngữ liệu được tổ chức phù hợp cho từng phương ngữ. Bài báo này sẽ trình bày phương pháp sử dụng đặc trưng MFCC kết hợp với khai thác thông tin về tần số cơ bản (F0) của tiếng Việt để thực hiện nhận dạng phương ngữ tiếng Việt dựa trên mô hình GMM. Kết quả thử nghiệm trên bộ ngữ liệu phương ngữ tiếng Việt cho thấy việc kết hợp các tham số F0 và MFCC so với chỉ dùng MFCC đã tăng tỷ lệ nhận dạng đúng phương ngữ từ 64.2% lên 70.3%.

Keywords

Tần số cơ bản, MFCC, GMM, nhận dạng phương ngữ tiếng Việt

Full Text:

PDF (Tiếng Việt)

PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn