Thông tin tài liệu
Nhan đề : | Enhancing automatically taxonomy construction via sentence embeddings and large language models |
Nhan đề khác : | Nâng cao xây dựng phân cấp khái niệm tự động thông qua mô hình nhúng câu và mô hình ngôn ngữ lớn |
Tác giả : | Trần Chí Cương |
Người hướng dẫn: | Cao Tuấn Dũng |
Từ khoá : | Ngôn ngữ |
Năm xuất bản : | 2024 |
Nhà xuất bản : | Trường đại học Bách Khoa Hà Nội |
Tóm tắt : | Giới thiệu phương pháp mới để xây dựng phân loại chủ đề tự động bằng cách sử dụng mô hình ngôn ngữ lớn (LLM). Phương pháp này khắc phục hạnh chế của word2vec - chỉ tập trung vào mối quan hệ cú pháp và không nắm bắt được ngữ nghĩa sâu hoặc ngữ cảnh trong văn bản dài. Tạo điểm tương đồng giữa các cặp từ khóa, mô hình nhúng câu được huấn luyện để nhận diện mối quan hệ ngữ nghĩa và ý nghĩa phụ thuộc vào ngữ cảnh, xây dựng phân loại chính xác và ý nghĩa hơn. |
URI: | http://dlib.hust.edu.vn/handle/HUST/26685 |
Trong bộ sưu tập: | Ths-Công nghệ thông tin |
XEM MÔ TẢ
9
XEM & TẢI
5
Danh sách tệp tin đính kèm:
Khi sử dụng tài liệu trong thư viện số bạn đọc phải tuân thủ đầy đủ luật bản quyền.