Tag: ocr

如何在使用PHP的网站上实现OCR?

在Linux服务器上是否有任何免费的OCR库与PHP或Python协同工作? 这个想法是能够上传图像并从中提取字符,或允许用户“绘制字符”,并将其从所述图像中parsing出来。

如何selectTesseract和OpenCV?

我最近遇到了Tesseract和OpenCV 。 它看起来像Tesseract是一个成熟的OCR引擎,OpenCV可以用作创buildOCR应用程序/服务的框架。 我尝试在我的一些图像上使用Tesseract,其准确性似乎不错。 后来,我遇到了一个非常简单的使用OpenCV来使用Python进行OCR的教程 ,给我留下了深刻的印象。 几分钟后,我完成了系统的训练,其准确性很好。 但是,当然,采取这种方法意味着我需要使用大型训练集广泛地训练我的系统。 我的具体问题如下: 如何selectTesseract和使用OpenCVbuild立一个自定义的OCR应用程序? 有针对不同语言的Tesseract可用的培训数据集。 OpenCV是否有类似的东西,所以我不必为了实现OCR而着手开展工作? 哪一个更适合想要成为商业应用? 有什么build议么? 注 :我在计算机视觉领域有24个小时的工作经验,但愿意花时间和精力学习先决条件。

reCaptcha是否被破解/黑客入侵/ OCR已被破解?

有没有使用任何编程方法来击败reCAPTCHA? 我感兴趣的是看到证​​据和潜在的certificate,特别是reCAPTCHA已经被完全自动化,无人的方法所淘汰。 澄清, 不要以任何方式寻找涉及人类的reCAPTCHA作弊解决scheme,无论是负责填写CAPCHA,色情search者或Mechanical Turk的团队。 我也没有寻找替代reCAPTCHA,如select动物的types,或背景字段或JavaScript欺骗。

笔画宽度转换(SWT)实现(Java,C#…)

最近我发现了笔画宽度变换,正如下面的研究论文所logging的那样: 用行程宽度变换在自然场景中检测文本 。 鲍里斯Epshtein,Yonathan Wexler和Eyal Ofek。 IEEE计算机视觉和模式识别国际会议,2010年。 该algorithm旨在从自然场景中检测和提取文本。 但是,我找不到任何实现,从文件中我发现很难确定有关algorithm的所有细节,所以我可以在实践中实现它。 有谁知道这个algorithm是否在系统中被实现和使用? 有没有C#或Java的实现?

带有Tesseract接口的OCR

你如何使用Tesseract在c#中的接口OCR一个tiff文件? 目前我只知道如何使用可执行文件。

Android中最好的OCR(光学字符识别)例子

我想要一个运行在Android的OCR的例子,我已经做了一些研究,并find一个在Android中实现OCR的例子。 https://github.com/rmtheis/tess-two和它有三个项目文件… 眼睛二 苔丝二 苔丝个testing 我通过导入三个项目文件来执行“tess-two-test”项目,但是“tess-two-test”不包含任何活动,所以它不会运行。 有人可以提出一个更好的例子吗?

字符重build和OCR填充

我正在轮胎上进行文字识别。 为了使用OCR,我必须先得到一个清晰的二进制地图。 我已经处理了图像,文本出现了断开和停止的边缘。 我已经在MATLAB中尝试过使用圆形光盘和线条元素进行标准侵蚀/扩大,但这并没有真正的帮助。 Pr1-关于如何重build这些angular色,填补angular色间的差距? Pr2-上面的图像是更高的分辨率和良好的照明。 但是,如果照度较差,分辨率相对较低,那么处理的可行select是什么? 解决scheme尝试 S1:这是将中值滤波应用于Spektre共享的处理图像的结果。 为了消除噪声,我应用了一个中值滤波器(5×5),然后用线元素(5,11)进行图像膨胀。 即使现在OCR(Matlab 2014b)只能识别一些字符 无论如何,非常感谢迄今为止的build议。 我仍然会等待,看看是否有人可以build议不同的东西,也许想出了盒子:)。 Matlab实现下面Spektre代码步骤的结果(没有中风扩张(按照1,2,3,4: 并且具有阈值tr0 = 400和tr1 = 180以及用于归一化的angular点顺序1,3,2,4 最好的祝福 Wajahat

如何在Windows下的光标下获取单词?

我想创build一个应用程序,它获取光标下的单词(不仅用于文本字段),但我找不到如何做到这一点。 使用OCR非常困难。 我见过的唯一工作是Deskperience组件。 他们支持“本地”的方式,但我花费了很多。 现在我试图找出这种“本地”方式(也许某种程度上是钩)。 任何帮助将不胜感激。 编辑:我find了一种方式,但它只获取控件的整个文本。 任何想法如何从整个文本只获得光标下的单词?

在Android的onPreviewFrame期间转换YUV-> RGB(image processing) – > YUV?

我使用SurfaceView捕获图像并获取Yuv Raw预览数据public void onPreviewFrame4(byte [] data,Camera camera) 我必须在onPreviewFrame中执行一些图像预处理,因此我需要将Yuv预览数据转换为RGB数据,而不是图像预处理,然后返回到Yuv数据。 我已经使用这两个函数来编码和解码Yuv数据到RGB如下: public void onPreviewFrame(byte[] data, Camera camera) { Point cameraResolution = configManager.getCameraResolution(); if (data != null) { Log.i("DEBUG", "data Not Null"); // Preprocessing Log.i("DEBUG", "Try For Image Processing"); Camera.Parameters mParameters = camera.getParameters(); Size mSize = mParameters.getPreviewSize(); int mWidth = mSize.width; int mHeight = mSize.height; int[] mIntArray = […]

image processing,以提高tesseract OCR的准确性

我一直在使用tesseract将文档转换为文本。 文档的质量范围很广,我正在寻找什么样的image processing可以改善结果的提示。 我注意到,高度像素化的文本(例如由传真机生成的文本)对于处理来说特别困难 – 大概所有那些锯齿状的边缘与字符混淆了形状识别algorithm。 什么样的image processing技术可以提高准确度? 我一直在使用高斯模糊平滑像素化的图像,并看到一些小的改进,但我希望有一个更具体的技术,会产生更好的结果。 说一个filter,调整为黑白图像,这将平滑不规则的边缘,其次是一个filter,这将增加对比度,使字符更清晰。 对于在image processing方面是新手的人来说,任何一般的提示?