01 - Trường Công nghệ thông tin và Truyền thông
Duyệt 01 - Trường Công nghệ thông tin và Truyền thông theo Chủ đề "Báo điện tử"
- Ấn phẩmỨng dụng thuật toán tf-idf và bert trong phát triển website đọc báo(Đại học Bách khoa Hà Nội, 2025) Nguyễn Thanh Tùng; Nguyễn Đức TiếnĐặt vấn đề lý do chọn đề tài, các giải pháp hiện tại và hạn chế cũng như mục tiêu và định hướng giải pháp của đề tài. Trình bày tổng quan về các hệ thống gợi ý, các phương pháp phổ biến trong lĩnh vực này và giới thiệu chi tiết về TF-IDF, BERT, PCA, cũng như cosine similarity. Giới thiệu kiến trúc hệ thống, mô hình dữ liệu và luồng hoạt động của hệ thống gợi ý bài báo. Mô tả quá trình cài đặt và triển khai hệ thống, bao gồm các bước tiền xử lý dữ liệu, vector hóa bài báo và tính toán độ tương đồng giữa các vector. Đánh giá và so sánh kết quả giữa hai phương pháp TF-IDF và BERT, đồng thời thảo luận về các hạn chế và hướng phát triển trong tương lai. Nêu bật những kết quả đạt được và định hướng mở rộng hệ thống trong các nghiên cứu tiếp theo.