
3
Học viên thực hiện: Vũ Văn Tú, CB160544, Lớp: Thạc sĩ CNTT 2016B
Mục lục Trang
Lời cam đoan .................................................................................................................................. 4
Danh sách các từ viết tắt và thuật ngữ ............................................................................................ 6
Danh sách các kí hiệu dùng trong luận văn .................................................................................... 6
Danh sách hình vẽ ........................................................................................................................... 7
Danh sách bảng ............................................................................................................................... 7
MỞ ĐẦU ........................................................................................................................................ 8
Chương 1 - TỔNG QUAN .............................................................................................................. 9
Chương 2 - CƠ SỞ LÝ THUYẾT LIÊN QUAN .......................................................................... 11
2.1 Các kiến thức về xác suất thống kê ............................................................................................11
2.1.1 Phân phối Multinomial ......................................................................................................11
2.1.2 Phân phối Dirichlet ............................................................................................................12
2.2 Mô hình đồ thị xác suất ..............................................................................................................12
2.3 Các thuật toán tối ưu cơ bản trong học máy ...............................................................................15
2.3.1 Gradient Descent ...............................................................................................................17
2.3.2 Expectation-Maximization ................................................................................................18
2.3.3 Conditional Gradient Descent (Frank Wolfe) ....................................................................20
Chương 3 - MÔ HÌNH CHỦ ĐỀ VÀ BÀI TOÁN CỰC ĐẠI HOÁ PHÂN PHỐI HẬU NGHIỆM
TRONG MÔ HÌNH CHỦ ĐỀ ....................................................................................................... 23
3.1 Mô hình chủ đề Latent Diriclet Allocation [1] ...........................................................................23
3.2 Bài toán suy diễn trong mô hình chủ đề .....................................................................................28
3.3 Thuật toán Online Maximum a Posteriori Estimation (OPE) ....................................................30
Chương 4 – THUẬT TOÁN CẢI TIẾN GENERALIZED ONLINE MAXIMUM A
POSTERIORI ESTIMATION (G-OPE) ....................................................................................... 34
Chương 5 – KẾT QUẢ THỰC NGHIỆM .................................................................................... 37
5.1 Thuật toán Online-OPE ..............................................................................................................37
5.2 Các độ đo thử nghiệm .................................................................................................................38
5.2.1 Độ đo xác suất dự đoán (Log Predictive Probability) .......................................................38
5.2.2 Độ đo chất lượng chủ đề (Normalized Pointwise Mutual Information) ............................39
5.3 Dữ liệu và các tham số khi thử nghiệm ......................................................................................40
5.4 G-OPE với các tham số ! khác nhau ..........................................................................................41
5.5 So sánh Online-GOPE với các thuậ t toán học khác cho LDA ...................................................43
KẾT LUẬN ................................................................................................................................... 46
TÀI LIỆU THAM KHẢO ............................................................................................................ 47