ThesisAuthors : Nguyễn Thị Thuận; Advisor : Nguyễn Linh Giang (2006)
Trình bày mô hình bài toán quyết định Markov; lý thuyết tổng quan về phương pháp học tăng cường (Reinforcement Learning), lịch sử phát triển và các lĩnh vực ứng dụng của phương pháp học tăng cường; đặc điểm và các bước thực hiện của từng loại giải thuật học tăng cường và bài toán thử nghiệm, kịch bản thử nghiệm, các kết quả thu được.