Browsing by Subject Q325.6

Jump to: 0-9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
or enter first few letters:  
Showing results 1 to 2 of 2
  • OER000003520.pdf.jpg
  • Ebooks (Sách điện tử)


  • Authors : Marc G., Bellemare; Will, Dabney; Mark, Rowland (2023)

  • Cuốn sách trình bày các ý tưởng cốt lõi về học tăng cường phân phối cung cấp một lý thuyết toán học để mô tả các kết quả ngẫu nhiên do quyết định của tác nhân gây ra qua. Các tác giả hướng dẫn người đọc thông qua các phát triển thuật toán và toán học, mô tả, tính toán, ước tính và đưa ra quyết định dựa trên hiệu quả ngẫu nhiên.

  • 000000208335-TT.pdf.jpg
  • Thesis


  • Authors : Nguyễn Thị Thuận;  Advisor : Nguyễn Linh Giang (2006)

  • Trình bày mô hình bài toán quyết định Markov; lý thuyết tổng quan về phương pháp học tăng cường (Reinforcement Learning), lịch sử phát triển và các lĩnh vực ứng dụng của phương pháp học tăng cường; đặc điểm và các bước thực hiện của từng loại giải thuật học tăng cường và bài toán thử nghiệm, kịch bản thử nghiệm, các kết quả thu được.