Tag: ocr

Android OCR库

有谁知道任何可用的库或示例代码,可用于开发一个应用程序,读取相机捕获的图像中的文本? 类似于Google Goggles,但仅用于阅读文字。

在VS 2013中使用带有JS / jQuery的Microsoft OCR库

我目前正在使用Windows 8.1应用程序,我正在使用networking语言,主要是jQuery(cordovatypes的项目),因为它可能会在其他平台上使用。 我需要使用Microsoft OCR Library(不是Tesseract或其他的,我知道它们,但现在我真的需要使用这个)来分析图像,并在我的应用程序中使用提取的文本。 我从MSDN下载了JavaScript示例应用程序,然后启动它:它正在全面工作(当然,在VS 2013中安装OCR插件之后)。 我现在正在尝试将OCR引擎集成到我的应用程序中(我也在自己的项目中安装了OCR插件),但它根本不起作用。 实际上,当我尝试在我的机器上启动我的应用程序时,执行失败,并返回此错误消息: ms-appx中第11行第5列的不可处理的exception://io.cordova.blankcordovaapp/www/scripts/myscript.js 0x800a1391 – JavaScript执行错误:«WindowsPreview»未定义 这里是代码的“错误”部分(这是在我的脚本的开始): $(document).ready(function () { "use strict"; // Keep objects in-scope across the lifetime of the scenario. var FileToken = ""; // Define namespace and API aliases. var FutureAccess = Windows.Storage.AccessCache.StorageApplicationPermissions.futureAccessList; // Should be initialising the OCR engine var OCR = WindowsPreview.Media.Ocr; var […]

math公式的OCR库

我需要一个开放的OCR库,能够扫描复杂的打印math公式(例如一些通过LaTeX生成的公式)。 我想要得到一些类似LaTeX的输出(或者只是一些AST类的数据)。 有没有这样的事情? 还是现在的OCR技术只能parsing面向行的文本? (请注意,我也在Metaoptimize上发布了这个问题,因为有些人可能有更多的知识。) OpenAI也将这个问题描述为im2latex 。

通过OCR从T恤照片中提取代码

我最近看到一个背上有一些Perl代码的T恤衫。 我拍了一张照片,把代码剪掉了: 接下来,我试图通过OCR从图像中提取代码,所以我安装了Tesseract OCR和Python绑定pytesser 。 Pytesser只能在TIFF图像上工作,所以我把图像转换成GIMP并input下面的代码(Ubuntu 9.10): >>> from pytesser import * >>> image = Image.open('code.tif') >>> print image_to_string(image) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "pytesser.py", line 30, in image_to_string util.image_to_scratch(im, scratch_image_name) File "util.py", line 7, in image_to_scratch im.save(scratch_image_name, dpi=(200,200)) File "/usr/lib/python2.6/dist-packages/PIL/Image.py", line 1406, in save save_handler(self, fp, filename) […]

我应该在Android中使用什么样的OCR Java库?

我想build立一个Android应用程序,通过一个OCR库,应该扫描图片从中提取文本。 我应该使用什么Java库?

如何使tesseract只识别数字,当他们混合字母?

我想用tesseract只识别数字。 问题是我有混合 数字和字母,当我使用SetVariable(“tessedit_char_whitelist”,“0123456789”) 对于每个符号tesseract返回错误的数字。 我可以设置一个阈值,以便tesseract省略相似度较低的符号吗? 注:我设置tesseract只识别数字,所以没有0和0之间的混淆。

如何获得索引服务和MODI在OCR上生成全文?

我已configuration索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像。 我还安装了MS Office 2003+并正确configuration了MS Office Document Imaging(MODI),这样我就可以在图像上执行OCR,甚至可以将OCR文本embedded到TIFF中。 索引服务能够索引并查找手动OCR并重新保存文本数据的TIFF(使用MS Document Imaging工具)。 事实certificate,在Windows XP SP2中部署的数据执行保护(DEP)认为MODI是恶意的,拒绝让它发挥作用。 我已经能够通过完全closuresDEP来实现它,但是我发现这个解决scheme是不够的。 有没有更好的解决scheme,使其工作,而不禁用DEP?

限制字符tesseract正在寻找

是否可以限制tesseract正在寻找的字符集(例如只search字母az)? 这将大大改善我的结果。

什么是车牌检测的好algorithm?

背景 对于我在大学的最后一个项目,我正在开发车牌检测应用程序。 我认为自己是一名中级程序员,但是我的math知识缺乏中学以上的知识,这使得制定正确的方程式比实际上更难。 我花了很多时间查找学术论文,例如: 在图像中检测车辆牌照 使用图像显着性的强大的车牌检测 车牌图像的局部增强用于车牌检测 说到math,我迷路了。 由于这种testing,各种graphics图像被certificate是有效的,例如: 至 然而,这种方法只适用于特定的图像,如果这些技术应用于不同的图像,我相信会发生较差的转换。 我读过一个叫做“底帽形态变换”的公式,它有以下几点: 基本上,变换保留了图片的所有黑色细节,并消除了其他所有内容(包括较大的黑色区域和较亮的区域)。 我无法find有关这方面的很多信息,但报告结尾附近的文件中的图像显示了它的有效性。 其他限制 在C#中开发 将项目仅限于英国注册牌照 我可以select要转换的图像作为演示 题 我需要关于我应该关注什么转换技术的build议,以及哪些algorithm可以帮助我。 编辑:新信息目前继续 – 车牌照检测

如何从图像中识别车牌/车牌号码(ANPR)?

我有一个网站,允许用户上传汽车的图像,我想放置一个隐私filter,以检测车牌上的牌照,并模糊他们。 模糊不是一个问题,但有一个图书馆或组件(开源优先),这将有助于在照片中find许可证? 注意事项; 我知道没有什么是完美的,这种types的图像识别将提供假阳性和阴性。 我明白,我们可以要求用户select模糊的区域,我们也会这样做,但问题是具体关于以编程方式查找数据; 所以诸如“让一个人检查每个图像”等答案是没有帮助的。 这种软件方法在英国被称为“自动车牌识别”,但我不能看到它作为库的任何实现。 任何语言都很棒,但.Net是首选。