语音识别软件开发人员
那么文件最后说了,我需要在我的手腕上轻松几个月。 因为我是一名.NET开发人员,这可能会使我的生活停滞一段时间,而我并不急于做这件事。 这就是说,开发人员有没有什么好的免提select? 任何人都有成功使用任何语音识别软件在那里?
POSTSCRIPT:我已经恢复了我的arm,双手编程不成问题。 龙自然地说,工作得不错,但速度较慢,不像键盘那样编程比我想象的要快。
它在那里,它工作…
这里有很多的语音识别程序,其中Dragon NaturallySpeaking是我认为是使用最广泛的语音识别程序之一。 我自己也使用过它,并且对它的质量印象深刻。 那是两三年前的事情,现在事情已经进一步改善了。
但是这并不容易…
即使它工作得非常好,我也不会说这是一个简单的解决scheme。 培训课程需要时间,即使如此,也会犯错误。 与打字相比,速度非常慢,所以我不得不一直对自己说:“不要拿起键盘,不要拿起键盘,…”(之后我会拿起键盘)。 我自己往往咕a一下,这也没有使事情变得更好,或者;-)。 尤其是第一周可能会令人沮丧。 如果你的声音太大,你甚至会听到与声音有关的问题 。
特别是对于程序员!
总而言之,这对于编写普通文本/散文的人来说无疑是一个可行的解决scheme。 作为一个程序员,你处于一个完全不同的领域,对此,没有真正的解决scheme。 事情现在可能已经改变,但如果他们有,我会感到惊讶。
有什么问题? 大多数SR软件是为了识别正常语言而build立的。 程序员编写非常神秘的东西,而且很难find在普通语言和代码之间进行转换的软件。 例如,你将如何规定:
if (somevar == 'a') { print('You pressed a!'); }
在平均的SR程序中使用这些命令,这是一个巨大的痛苦:“如果空格左括号等于符号等号撇号拼写撇号…”。 而且我甚至不谈论导航代码。 曾经注意到在编程时你使用了多less键盘,以及与普通用户使用键盘的方式有什么不同?
如何充分利用它
到目前为止,我只和Dragon NaturallySpeaking(DNS)合作过,所以我只能说这个产品。 有一些有趣的插件和网站针对像程序员这样的人:
- Vocola是一个非官方的插件,可以让您轻松地将自己的命令添加到DNS。 基本上我发现它是必不可less的。 您还可以find其他程序员编写的命令集,例如导航代码。 它基于用Python编写的软件包,所以还有一些更高级和更高级的软件包。 还可以查看Vocola的资源页面 。 (警告:当我使用它时,安装Vocola时出现了一些问题;请查看下面的新闻组获取信息!)
- SpeechComputing.com是一个有许多有趣讨论的论坛/新闻组。 一个好地方开始。
结束语
看来这个问题的最佳解决scheme是:
- find实际编码的方法。
- 尝试恢复。 我有点不情愿推荐这本书,但对于RSI /腕pipe和其他慢性疼痛问题的人来说,它似乎工作得非常好: JE Sarno,Mindbody处方 。 我现在正在使用它,我认为这绝对值得一读。
我使用Dragon NaturallySpeaking 10 Professional来指定VB.net和TSQL。 VB.net本质上更接近于“口语”语言,但我没有看到任何理由不能为C#或其他人工作。 我从一个完全空白的词汇开始,从头开始构build,以满足我的需求(这就是为什么我使用专业版)。
以下是基本步骤(假定您已经创build并培训了一个用户):
- 基于“基本一般 – 空听写”创build一个新词汇。
- 没有它扫描您的文件或电子邮件。
- 添加具有特定发音的关键字列表(Dim,ByVal \ by-val等)。
- 创build一个包含所有代码的.txt文档减去评论。
- 从这个文件中收集单词并添加发音。
- 使用文档来训练词汇的语言模型。
如果有人有兴趣,我会有机会写更详细的内容。
编辑:
以下是如何指定SQL代码 。 如果您是数据库开发人员,此处创build的单词列表可以包含在其他词汇表中。
查看使用Python进行语音编码 。
另一个想法是find另一个好的开发者来配对程序。 它对我来说真的很好。 我不必放慢脚步,最终生成质量更好的代码 – 或者至less不必重新审查。
对于所有的Linux人员,我想分享一些链接。
让我们从西蒙开始 – 开源语音识别软件:
- 西蒙倾听 – 非营利组织的研究和学徒
- simon:开源语音识别相关的博客
- HTK语音识别工具包 – 内部使用的引擎
- 开源大词汇量CSR引擎Julius
- 不是在关于西蒙fetings的shlashdot
和其他一些:
- 侏儒语音控制
- https://wiki.ubuntu.com/SpeechRecognition
- http://en.wikipedia.org/wiki/Speech_recognition_in_Linux
- VoiceCode
和
- 相关的stackoverflow关于文本到语音识别工具的Linux的问题。
我知道我有点偏离主题,对语音识别软件一无所知。 不过,您可能会发现调查将键盘更改为Dvorak布局非常有用,而我听说这种布局对于手腕来说更为贴心。
几年前,我尝试了龙,这是一个肮脏的词和短语的噩梦 – 不推荐。 我知道这是当时最好的事情,所以我不乐观。
作为同胞患者,build议是:
- find一个尽可能lessOT的工作
- 尝试各种键盘。 根据我的经验,在全职笔记本电脑上工作效果最好。
- 开始一个低中度压力举重的计划。
至于手腕问题,我在10年前双手学会了用鼠标。
令人惊讶的是,容易,并大大缓解了紧张局势。 目前,我正在使用一台笔记本电脑,并按下触摸板button正在紧张我的拇指。
小心。 这些问题可能比人们想象的要长。
你可能会添加一个标签“人体工程学”或什么的 – 标题可以被看作是关于语音识别的发展。
语音编程的黄金标准是VoiceCode 。 如果我没有记错,他们支持C ++和Python。
如上所述,Dragon Naturally Speaking是目前最好的语音识别软件,然而微软语音识别(Microsoft Speech Recognition)也不甘落后,并与Vista捆绑在一起。
Vocola最近被移植到MSR,并具有.Net集成function。
一些提示
- 学习听写需要一些时间。 只是因为你可以说话并不意味着你知道如何使用语音识别软件
- 熟练使用SR和键盘/鼠标的混合要比完全免提操作容易得多。
- 使用CodeRush或类似的键入less。
我开始用我的左手做鼠标,这不仅帮助了我,还允许我更自由地使用我的右手,如果你在编写代码的时候写了很多东西的话,这对你有很大的帮助。并同时写下…
当我的问题开始时,我把一个水袋放在我的手腕下,我喜欢它! 我所拥有的包是完美的,它很长,我把它放在键盘之前,所以我可以在那里rest我的手腕….直到有一天我踩着它…
龙自然地说首选和Vocola。 Autohotkey尽可能自动化。 不容易编程。 我试过了; 几乎不可能。 看看约翰·萨诺的治疗背痛。 这让我更好。 我整天回到编程!
另外一个关键的问题在这里,我发现,拆分keboard分成两个部分和其他特殊的键盘帮助,只是检查出kinesis。 我在diigo收集了关于这种硬件的信息:
- http://www.diigo.com/user/wierzowiecki/keyboard%20ergonomics
- http://www.diigo.com/user/wierzowiecki/keyboard%20rsi 。
直接链接如何:
- http://www.fentek-ind.com/ergo.htm – 不同的东西
- Kinesis Advantage的轮廓键盘(可编程!)
- 一些脚踏开关可以连接到键盘(例如用于开窗)
- http://www.kinesis-ergo.com/freestyle.htm – 到目前为止,我发现即使使用两个普通的键盘也比一个好,所以我认为分离的自由式也可以工作
- http://www.typematrix.com/ – 另一个解决scheme
- http://www.maltron.com/ – 有时候一只手比另一只手更容易受到伤害
- http://www.keybowl.com/ – 这看起来也很有趣
- 我相信还有很多其他有趣的解决scheme
还有一件事! 记住锻炼的rest时间。 经常锻炼(例如小锻炼 – 每半小时一次)让事情变得更好!
- http://www.workrave.org/ – 这会提醒你rest时间;)
Scott Hanselman使用语音识别相当多 。
我在1996年使用了Dragon Dictate,原因和你一样。 这是缓慢的,但比不工作更好。 我发现通过用代码填充4×8白板,然后让别人input代码,可以更容易地编写代码。然后,我使用DD进行debugging。
而当你在这里,你可能会看Deborah Quilter关于RSI 的书。 他们非常丰富。
我找不到一个链接(我看过),但有键盘只有5个键,让你用一只手打字,我假设你只有一个坏手腕。
如果我find一个链接,我会试着给你发消息。