-Authors : Đỗ Lê Ngọc Tân; Advisor : Trần Thị Anh Xuân (2024)
Tổng quan về các ứng dụng thực tế về xử lý tiếng nói. Sử dụng mô hình nhận dạng đầu cuối Conformer-CTC kết hợp khả năng biểu diễn ngữ cảnh dài hạn của Transformer và khả năng xử lý ngữ cảnh cục bộ của lớp CNN, giúp hệ thống nhận dạng tiếng nói một cách chính xác hơn, đặc biệt trong môi trường nhiễu. Sử dụng phương pháp học máy, với ngôn ngữ lập trình Python và thư viện Pytorch để xây...