Tag: ocr

如何在使用PHP的网站上实现OCR？: 在Linux服务器上是否有任何免费的OCR库与PHP或Python协同工作？这个想法是能够上传图像并从中提取字符，或允许用户“绘制字符”，并将其从所述图像中parsing出来。

如何selectTesseract和OpenCV？: 我最近遇到了Tesseract和OpenCV 。它看起来像Tesseract是一个成熟的OCR引擎，OpenCV可以用作创buildOCR应用程序/服务的框架。我尝试在我的一些图像上使用Tesseract，其准确性似乎不错。后来，我遇到了一个非常简单的使用OpenCV来使用Python进行OCR的教程，给我留下了深刻的印象。几分钟后，我完成了系统的训练，其准确性很好。但是，当然，采取这种方法意味着我需要使用大型训练集广泛地训练我的系统。我的具体问题如下：如何selectTesseract和使用OpenCVbuild立一个自定义的OCR应用程序？有针对不同语言的Tesseract可用的培训数据集。 OpenCV是否有类似的东西，所以我不必为了实现OCR而着手开展工作？哪一个更适合想要成为商业应用？有什么build议么？注：我在计算机视觉领域有24个小时的工作经验，但愿意花时间和精力学习先决条件。

reCaptcha是否被破解/黑客入侵/ OCR已被破解？: 有没有使用任何编程方法来击败reCAPTCHA？我感兴趣的是看到证据和潜在的certificate，特别是reCAPTCHA已经被完全自动化，无人的方法所淘汰。澄清，不要以任何方式寻找涉及人类的reCAPTCHA作弊解决scheme，无论是负责填写CAPCHA，色情search者或Mechanical Turk的团队。我也没有寻找替代reCAPTCHA，如select动物的types，或背景字段或JavaScript欺骗。

笔画宽度转换（SWT）实现（Java，C＃…）: 最近我发现了笔画宽度变换，正如下面的研究论文所logging的那样：用行程宽度变换在自然场景中检测文本。鲍里斯Epshtein，Yonathan Wexler和Eyal Ofek。 IEEE计算机视觉和模式识别国际会议，2010年。该algorithm旨在从自然场景中检测和提取文本。但是，我找不到任何实现，从文件中我发现很难确定有关algorithm的所有细节，所以我可以在实践中实现它。有谁知道这个algorithm是否在系统中被实现和使用？有没有C＃或Java的实现？

Android中最好的OCR（光学字符识别）例子: 我想要一个运行在Android的OCR的例子，我已经做了一些研究，并find一个在Android中实现OCR的例子。 https://github.com/rmtheis/tess-two和它有三个项目文件… 眼睛二苔丝二苔丝个testing 我通过导入三个项目文件来执行“tess-two-test”项目，但是“tess-two-test”不包含任何活动，所以它不会运行。有人可以提出一个更好的例子吗？

字符重build和OCR填充: 我正在轮胎上进行文字识别。为了使用OCR，我必须先得到一个清晰的二进制地图。我已经处理了图像，文本出现了断开和停止的边缘。我已经在MATLAB中尝试过使用圆形光盘和线条元素进行标准侵蚀/扩大，但这并没有真正的帮助。 Pr1-关于如何重build这些angular色，填补angular色间的差距？ Pr2-上面的图像是更高的分辨率和良好的照明。但是，如果照度较差，分辨率相对较低，那么处理的可行select是什么？解决scheme尝试 S1：这是将中值滤波应用于Spektre共享的处理图像的结果。为了消除噪声，我应用了一个中值滤波器（5×5），然后用线元素（5,11）进行图像膨胀。即使现在OCR（Matlab 2014b）只能识别一些字符无论如何，非常感谢迄今为止的build议。我仍然会等待，看看是否有人可以build议不同的东西，也许想出了盒子:)。 Matlab实现下面Spektre代码步骤的结果（没有中风扩张（按照1,2,3,4：并且具有阈值tr0 = 400和tr1 = 180以及用于归一化的angular点顺序1,3,2,4 最好的祝福 Wajahat

如何在Windows下的光标下获取单词？: 我想创build一个应用程序，它获取光标下的单词（不仅用于文本字段），但我找不到如何做到这一点。使用OCR非常困难。我见过的唯一工作是Deskperience组件。他们支持“本地”的方式，但我花费了很多。现在我试图找出这种“本地”方式（也许某种程度上是钩）。任何帮助将不胜感激。编辑：我find了一种方式，但它只获取控件的整个文本。任何想法如何从整个文本只获得光标下的单词？

在Android的onPreviewFrame期间转换YUV-> RGB（image processing） – > YUV？: 我使用SurfaceView捕获图像并获取Yuv Raw预览数据public void onPreviewFrame4（byte [] data，Camera camera）我必须在onPreviewFrame中执行一些图像预处理，因此我需要将Yuv预览数据转换为RGB数据，而不是图像预处理，然后返回到Yuv数据。我已经使用这两个函数来编码和解码Yuv数据到RGB如下： public void onPreviewFrame(byte[] data, Camera camera) { Point cameraResolution = configManager.getCameraResolution(); if (data != null) { Log.i("DEBUG", "data Not Null"); // Preprocessing Log.i("DEBUG", "Try For Image Processing"); Camera.Parameters mParameters = camera.getParameters(); Size mSize = mParameters.getPreviewSize(); int mWidth = mSize.width; int mHeight = mSize.height; int[] mIntArray = […]

image processing，以提高tesseract OCR的准确性: 我一直在使用tesseract将文档转换为文本。文档的质量范围很广，我正在寻找什么样的image processing可以改善结果的提示。我注意到，高度像素化的文本（例如由传真机生成的文本）对于处理来说特别困难 – 大概所有那些锯齿状的边缘与字符混淆了形状识别algorithm。什么样的image processing技术可以提高准确度？我一直在使用高斯模糊平滑像素化的图像，并看到一些小的改进，但我希望有一个更具体的技术，会产生更好的结果。说一个filter，调整为黑白图像，这将平滑不规则的边缘，其次是一个filter，这将增加对比度，使字符更清晰。对于在image processing方面是新手的人来说，任何一般的提示？