Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng

Bài viết "Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng" trình bày một phương pháp xây dựng tập dữ liệu tiếng Việt cho bài toán tìm kiếm câu hỏi tương đồng.Tác giả xây dựng được 7911 cặp câu hỏi được gán nhãn. Đồng thời, tập dữ liệu này cũng được thử nghiệm đánh giá trên một số mô hình học máy cơ bản.