2013-04-05 268 views
19

Tôi biết chủ đề câu hỏi chung của nó, nhưng tôi vẫn muốn biết thư viện nhận dạng giọng nói nhanh nhất trong C++ là gì?Thư viện nhận dạng giọng nói nhanh nhất C++

Hiện tại tôi đang sử dụng Microsoft SAPI với kniect. Nó hoạt động tốt và nhận ra các từ nhưng chậm chạp của nó, một số lần mất 1,2 giây để nhận ra một từ và trong trường hợp của tôi độ trễ này gây ra rất nhiều vấn đề tương tác cho người dùng.

Tôi đã kiểm tra mẫu được cung cấp cùng với kinect, trong đó rùa di chuyển sang trái theo các từ được nhận dạng nhưng thậm chí là chậm một chút. Vì vậy, tôi đã tự hỏi nếu có bất kỳ thư viện nhanh hơn sau đó sapi, có thể được sử dụng trong trường hợp như một robot bằng cách sử dụng nhận dạng giọng nói, bạn nói "trái" rồi "đúng" nhưng robot tiếp tục di chuyển sang trái và rẽ phải sau 1,2 giây của nó một chút bực bội cho người dùng.

+1

Bạn nên nghiên cứu sâu về vấn đề này. –

Trả lời

9

Vấn đề không phải là nhanh, nhưng cách thích hợp để sử dụng API. Nhận dạng giọng nói là một quá trình tốn thời gian nên mẹo chính là bắt đầu nhận dạng âm thanh ngay sau khi được ghi lại, song song với bản ghi. Sau đó, đến thời điểm kết thúc cụm từ được nói, bạn sẽ có gần như tất cả các kết quả và có thể phản ứng ngay lập tức.

Thời gian phản hồi là 0,2 giây có thể đạt được theo cách này, nhưng bạn cần API linh hoạt hơn để thực hiện việc này. Một lựa chọn tốt là CMUSphinx, khung công nhận nhận dạng ngôn ngữ nguồn mở mà bạn có thể sử dụng để triển khai

+0

"Tôi hoàn toàn đồng ý với bạn. Và đạo đức của điều đó là": - bạn phải biết cách lập trình nó. – SChepurin