限制字符tesseract正在寻找

是否可以限制tesseract正在寻找的字符集（例如只search字母az）？这将大大改善我的结果。

在tessdata / configs目录中创build一个configuration文件（例如“letters”） – 通常是/usr/share/tesseract/tessdata/configs
要么
/usr/share/tesseract-ocr/tessdata/configs

并将此行添加到configuration文件中：

 tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz

…或者[az]工作..不知道:-)
然后调用类似于这样的tesseract：

 tesseract input.tif output nobatch letters

这将限制tesseract只识别想要的字符

除了configuration文件外，还有-c标志：

 tesseract stdin stdout -c tessedit_char_whitelist=abcdefghijklmnopqrstuvwxyz -psm 6

只需在Android上使用tesseract添加此项即可。在您设置语言的readOCR函数中，添加以下行;

 tesseract.setVariable("tessedit_char_whitelist","ABCDEFGHIJKLMNOPQRSTUVWXYZ");

你也可以做blackList来排除字符。

如何在使用PHP的网站上实现OCR？
笔画宽度转换（SWT）实现（Java，C＃…）
在Android的onPreviewFrame期间转换YUV-> RGB（image processing） – > YUV？
简单的数字识别OpenCV-Python中的OCR
如何在Windows下的光标下获取单词？
reCaptcha是否被破解/黑客入侵/ OCR已被破解？
如何使tesseract只识别数字，当他们混合字母？
如何使黑板文本显得更清晰使用MATLAB？
字符重build和OCR填充

限制字符tesseract正在寻找

Java OCR实现

带有Tesseract接口的OCR

如何selectTesseract和OpenCV？

image processing，以提高tesseract OCR的准确性

OCR和字符相似

我应该在Android中使用什么样的OCR Java库？

通过OCR从T恤照片中提取代码

Android中最好的OCR（光学字符识别）例子

如何从图像中识别车牌/车牌号码（ANPR）？

math公式的OCR库