我怎样才能把MP3转换成文本? 我从会议和会议logging了一些logging(logging中有一个单一的声音,这是我的声音)。 我认为使用语音转换为文本工具而不是简单地用手抄录将会更容易,更智能。 我知道那里有技术,特别是使用Asterisk和Podcasts的VoIP应用,但是它们是什么?我怎样才能使用它们?
我试图用Windows 7来识别演讲,但是它总是将演讲视为一个命令,或者只是说“那是什么?”。 我怎样才能得到所有的演讲? 码: SpeechRecognizer _speechRecognizer; public Window1() { InitializeComponent(); // set up the recognizer _speechRecognizer = new SpeechRecognizer(); _speechRecognizer.Enabled = false; _speechRecognizer.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(_speechRecognizer_SpeechRecognized); }
在问这个问题之前,我检查了所有与此问题有关的stackoverflow其他线程没有任何成功,所以请不要回答与其他线程的链接,:) 我想保存/logging谷歌识别服务用于语音文本操作的audio(使用RecognizerIntent或SpeechRecognizer)。 我经历了很多想法: onBufferReceived来自RecognitionListener:我知道,这是行不通的,只是testing它看看会发生什么,onBufferReceived永远不会被调用(用JB 4.3testing星系连接) 使用媒体logging器:不工作。 这是破坏语音识别。 话筒只允许一个操作 试图find识别服务在保存临时audio文件之前执行语音到文本api复制它,但没有成功 我几乎绝望,但我只是注意到,谷歌保持应用程序正在做我所需要做的! 我放了一些使用logcat的保持应用程序,应用程序也调用“RecognizerIntent.ACTION_RECOGNIZE_SPEECH”(如我们,开发人员)来触发语音文本。 但是,如何保持audio? 它可以是一个隐藏的API? 是谷歌“作弊”:)? 感谢您的帮助 最好的祝福
我想build立一个使用语音识别的应用程序。 我曾经见过像谷歌这样的大公司实现了这个function,但是我很好奇在初创阶段这样做。 任何人都看着这个? 有没有什么工具可以帮我们做到这一点?