ĐA1-2025
Duyệt ĐA1-2025 theo Tác giả "Khuất Ngọc Sơn"
Ấn phẩm
Chuyển đổi cuộc gọi sang đoạn hội thoại tiếng Việt
2025, Khuất Ngọc Sơn, Lê Thanh Hương
Sử dụng các mô hình xử lý âm thanh tiên tiến như Whisper, Wav2Vec hay Whisperx để xử lý dữ liệu cuộc gọi. Đề xuất giải pháp gồm ba giai đoạn chính: chuyển đổi âm thanh cuộc gọi sang văn bản bản thông qua các mô hình nhận diện giọng nói, hậu xử lý đoạn văn bản hội thoại và rút được văn bản tóm tắt, và sử dụng mô hình GPT để trích xuất thông tin quan trọng như tên khách hàng, sản phẩm quan tâm, và kết quả cuộc gọi. Phát triển một quy trình tích hợp từ nhận diện giọng nói đến trích xuất thông tin, giúp tăng hiệu suất và giảm chi phí xử lý thủ công. Kết quả thử nghiệm cho thấy hệ thống đạt độ chính xác cao trong cả hai bước nhận diện và trích xuất, hứa hẹn mang lại giá trị thực tiễn cao trong lĩnh vực telesale và chăm sóc khách hàng.