Thông tin tài liệu
Title: | Tự động trích xuất thông tin sản phẩm trên web ứng dụng kỹ thuật Simhash |
Authors: | Phạm Nguyễn Tuấn Anh |
Advisor: | Nguyễn Khanh Văn |
Keywords: | Công nghệ thông tin; Ứng dụng |
Issue Date: | 2011 |
Publisher: | Trường Đại học Bách khoa Hà Nội |
Abstract: | Khái quát bài toán trích xuất thông tin cho dữ liệu bán cấu trúc. Một số phương pháp sử dụng trong bài toán trích xuất thông tin cho dữ liệu bán cấu trúc. Peweb - hệ thống bóc tách thông tin sản phẩm dựa trên tính toán entropy. Tự động trích xuất thông tin sản phẩm trên web ứng dụng kỹ thuật simhash. |
Description: | Luận văn (Thạc sỹ khoa học) - Ngành Công nghệ thông tin |
URI: | http://dlib.hust.edu.vn/handle/HUST/14902 |
Appears in Collections: | Ths-Công nghệ thông tin |
ABSTRACTS VIEWS
43
VIEWS & DOWNLOAD
161
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.