我应该在Android中使用什么样的OCR Java库?

我想build立一个Android应用程序,通过一个OCR库,应该扫描图片从中提取文本。

我应该使用什么Java库?

不知道它有多好(它肯定需要先培训),但有Ron Cemer的Java OCR库 。

如果您正在寻找一个非常可扩展的选项或者有一个特定的问题领域,您可以考虑使用Java面向对象的神经引擎来自己动手。

我在一个个人项目中成功地使用它来识别来自这个图像的字母,你可以在这里find我的应用程序的OCR组件的所有源代码。

尝试tesseract,结帐这篇文章http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html和这个例子http://code.google.com/p/mezzofanti/

编辑:更多的事实 – tesseract是谷歌使用的最好的开源OCR之一 – 有许多语言的培训数据 – mezzofanti是一个使用tesseract的android应用程序 – 当心:OCR确实使用了大量的CPUfunction。 尝试使用T-Mob G1对OCR A4页面进行OCR将花费大量时间,结果可能不会令您印象深刻;-)

您可以使用Google文档中的OCRfunction。 检查文档列表数据API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR