ỨNG DỤNG KỸ THUẬT ĐỊNH DANH TỪ DỮ LIỆU VIDEO VÀO VIỆC NHẬN DẠNG CON NGƯỜI, HÀNH ĐỘNG VÀ ĐỊA ĐIỂM XUẤT HIỆN

Phạm Thế Phi, Đỗ Thanh Nghị



DOI: 10.15625/vap.2016.00096

Abstract


Bài viết này đề xuất một phương pháp mới để truy hồi video với các chú thích nội dung bằng văn bản không hoàn chỉnh. Ý tưởng chính là việc sử dụng cơ chế suy diễn Bayes để dự đoán định danh của con người, hành động và địa điểm họ xuất hiện trong các khung hình video. Một vài mô hình truy hồi video với khả năng tích hợp các chứng cứ xuất hiện của ảnh và văn bản không hoàn chỉnh được đề xuất và so sánh. Trong các thí nghiệm, bài viết sử dụng các tập của bộ phim truyền hình Buffy the Vampire Slayer làm các tập dữ liệu huấn luyện và kiểm thử. Mô hình mạng Bayes được đề xuất có khả năng cho phép kết hợp nhiều thuộc tính của video như hình ảnh và văn bản, xử lý các câu truy vấn trong đó có nhiều thực thể có quan hệ ngữ nghĩa với nhau và quan trọng nhất là có khả năng suy luận ra các thực thể nếu chúng không được nhắc tới trong văn bản nhưng lại xuất hiện trong các khung hình.

Keywords


Khai thác dữ liệu đa phương tiện, lập chỉ mục và truy hồi video



Copyright (c) 2017 PROCEEDING of Publishing House for Science and Technology



PROCEEDING

PUBLISHING HOUSE FOR SCIENCE AND TECHNOLOGY

Website: http://vap.ac.vn

Contact: nxb@vap.ac.vn