Thông tin tài liệu
Title: | Enhancing automatically taxonomy construction via sentence embeddings and large language models |
Other Titles: | Nâng cao xây dựng phân cấp khái niệm tự động thông qua mô hình nhúng câu và mô hình ngôn ngữ lớn |
Authors: | Trần Chí Cương |
Advisor: | Cao Tuấn Dũng |
Keywords: | Ngôn ngữ |
Issue Date: | 2024 |
Publisher: | Trường đại học Bách Khoa Hà Nội |
Abstract: | Giới thiệu phương pháp mới để xây dựng phân loại chủ đề tự động bằng cách sử dụng mô hình ngôn ngữ lớn (LLM). Phương pháp này khắc phục hạnh chế của word2vec - chỉ tập trung vào mối quan hệ cú pháp và không nắm bắt được ngữ nghĩa sâu hoặc ngữ cảnh trong văn bản dài. Tạo điểm tương đồng giữa các cặp từ khóa, mô hình nhúng câu được huấn luyện để nhận diện mối quan hệ ngữ nghĩa và ý nghĩa phụ thuộc vào ngữ cảnh, xây dựng phân loại chính xác và ý nghĩa hơn. |
URI: | http://dlib.hust.edu.vn/handle/HUST/26685 |
Appears in Collections: | Ths-Công nghệ thông tin |
ABSTRACTS VIEWS
9
VIEWS & DOWNLOAD
5
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.