Tôi đang cố gắng sử dụng tính năng nhận dạng giọng nói trong .net để nhận dạng bài phát biểu của podcast trong một tệp mp3 và nhận kết quả dưới dạng chuỗi. Tất cả các ví dụ tôi đã thấy có liên quan đến việc sử dụng micrô nhưng tôi không muốn sử dụng micrô và cung cấp tệp mp3 mẫu làm nguồn âm thanh của tôi. Bất cứ ai có thể chỉ cho tôi bất kỳ tài nguyên hoặc đăng một ví dụ.Sử dụng System.Speech để chuyển đổi tệp mp3 thành văn bản
EDIT -
tôi chuyển đổi các tập tin âm thanh để wav
tập tin và cố gắng mã này vào nó. Nhưng nó chỉ trích xuất 68 từ đầu tiên.
public class MyRecognizer {
public string ReadAudio() {
SpeechRecognitionEngine sre = new SpeechRecognitionEngine();
Grammar gr = new DictationGrammar();
sre.LoadGrammar(gr);
sre.SetInputToWaveFile("C:\\Users\\Soham Dasgupta\\Downloads\\Podcasts\\Engadget_Podcast_353.wav");
sre.BabbleTimeout = new TimeSpan(Int32.MaxValue);
sre.InitialSilenceTimeout = new TimeSpan(Int32.MaxValue);
sre.EndSilenceTimeout = new TimeSpan(100000000);
sre.EndSilenceTimeoutAmbiguous = new TimeSpan(100000000);
RecognitionResult result = sre.Recognize(new TimeSpan(Int32.MaxValue));
return result.Text;
}
}
Có, tính năng này hoạt động. Tôi cũng đã chỉnh sửa câu trả lời của bạn và thêm rằng nếu OP sử dụng WinForms/WPF, anh ta nên chạy mã trong một chuỗi riêng biệt, bởi vì nếu không nó sẽ chặn chuỗi giao diện người dùng. – ProgramFOX
+1 - Bổ sung tốt. – keyboardP
Tôi nhận được lỗi này khi tôi sử dụng mã của bạn ở trên: 'MyProgram.vshost.exe Thông tin: 0: SAPI không thực hiện lựa chọn bảng chữ cái ngữ âm.' – Micro