Có anyway để encorporate Dragon NaturallySpeaking vào một chương trình hướng sự kiện? Ông chủ của tôi sẽ thực sự thích nó nếu tôi sử dụng DNS để ghi lại đầu vào bằng giọng nói của người dùng mà không cần ghi nó vào màn hình và lưu nó trực tiếp vào XML. Tôi đã làm nghiên cứu trong vài ngày và tôi không thể nhìn thấy một cách để điều này xảy ra mà không có (thực sự tốn kém) SDK, tôi thậm chí không biết rằng nó sẽ làm việc sau đó.Rồng lập trình tự nhiênSpeaking
Microsoft có khả năng viết chương trình (Python), nơi trình nhận dạng giọng nói của nó có thể đợi cho đến khi phát hiện sự kiện diễn thuyết và sau đó xử lý nó. Nó cũng có chất lượng tiện dụng của việc có thể đề xuất các cụm từ thay thế cho cụm từ mà nó nghĩ là phỏng đoán tốt nhất và ghi tệp .wav để sử dụng sau này. Mã mẫu:
spEngine = MsSpeech()
spEngine.setEventHandler(RecoEventHandler(spEngine.context))
class RecoEventHandler(SpRecoContext):
def OnRecognition(self, StreamNumber, StreamPosition, RecognitionType, Result):
res = win32com.client.Dispatch(Result)
phrase = res.PhraseInfo.GetText()
#from here I would save it as XML
# write reco phrases
altPhrases = reco.Alternates(NBEST)
for phrase in altPhrases:
nodePhrase = self.doc.createElement(TAG_PHRASE)
Tôi dường như không làm DNS thực hiện việc này. Gần nhất tôi có thể làm-hickey nó là:
while keepGoing == True:
yourWords = raw_input("Your input: ")
transcript_el = createTranscript(doc, "user", yourWords)
speech_el.appendChild(transcript_el)
if yourWords == 'bye':
break
Nó thậm chí có tác dụng phụ khủng khiếp khiến người dùng nói "dòng mới" sau mỗi câu! Không phải là giải pháp ưu tiên chút nào! Có anyway để làm cho DNS làm những gì Microsoft Speech không?
FYI: Tôi biết giải pháp hợp lý sẽ chỉ đơn giản là chuyển sang Microsoft Speech nhưng hãy giả sử, chỉ dành cho cười và cười khúc khích, rằng đó không phải là một lựa chọn.
CẬP NHẬT - Có ai đã mua SDK không? Bạn có thấy nó có ích không?
@WarrenP: Anh chàng này sử dụng nó cho 40% -60% sự phát triển của mình. Đúng là nó không hữu ích, nhưng sử dụng Natlink và VI/Emacs anh ta có một thiết lập khá ngọt ngào. http://www.youtube.com/watch?v=8SkdfdXWYaI –
@WarrenP Bạn đã từng thử nó chưa? Tôi sử dụng nó tất cả các thời gian và nó nhanh hơn nhiều so với việc sử dụng bàn phím (mặc dù tôi sử dụng bàn phím kể từ khi tôi 6 có nghĩa là tôi có một WPM khá cao). Đối với lập trình, tôi đồng ý rằng nó cần cải tiến, nhưng nó vẫn hữu ích. Xem [Làm thế nào chúng ta có thể sử dụng Dragon NaturallySpeaking để mã hiệu quả hơn?] (Http://productivity.stackexchange.com/q/3605/2476) –
Tôi có thể gõ ở 120 WPM. Tôi chưa bao giờ thấy văn bản TIẾNG ANH cho người dùng nói tiếng Anh đạt 40 WPM. Xác định Wpm CAO? –