ĐÁNH GIÁ TÍNH DỄ ĐỌC CỦA VĂN BẢN TIẾNG VIỆT DỰA TRÊN WORDNET

Phạm Duy Tâm, Trần Minh Hùng, Lương An Vinh, Đinh Điền



DOI: 10.15625/vap.2016.00013

Abstract


Tính dễ đọc của một văn bản là tổng hợp các yếu tố của văn bản tác động tới khả năng đọc và hiểu hoàn toàn nội dung của văn bản. Việc đánh giá tính dễ đọc có vai trò rất lớn trong quá trình soạn thảo văn bản nhằm xác định đúng đối tượng độc giả muốn hướng đến. Những nghiên cứu về tính dễ đọc của văn bản đã được thực hiện từ lâu trên thế giới nhưng chủ yếu là cho tiếng Anh và một số ngôn ngữ phổ biến khác,… Đối với tiếng Việt, đã có 2 công trình nghiên cứu về vấn đề này nhưng chỉ thực hiện trên các đặc trưng bề mặt của ngôn ngữ như độ dài từ, độ dài câu,… Trong bài báo này, chúng tôi tiến hành thực nghiệm lại một phương pháp đánh giá tính dễ đọc của văn bản dựa trên bộ từ điển ngữ nghĩa WordNet cho tiếng Anh và tiến hành một số thay đổi để thực nghiệm trên bộ WordNet tiếng Việt. Những kết quả đạt được cho thấy đây là một phương pháp tiềm năng và có thể sử dụng làm cơ sở cho các nghiên cứu sau này về đánh giá tính dễ đọc văn bản cho tiếng Việt.

Keywords


Tính dễ đọc của văn bản – text readablity, từ điển ngữ nghĩa WordNet



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn