检测照片中发票/收据/纸张的angular落的最佳方法是什么? 在OCR之前,这将被用于随后的透视校正。 我目前的做法是: RGB>灰度> Canny边缘检测与阈值> Dilate(1)>移除小物件(6)>清除边界物件>根据凸面区域挑选大型博客。 > [angular落检测 – 未实施] 我不禁想到,必须有一个更强大的“智能”/统计方法来处理这种types的分割。 我没有很多训练的例子,但是我可能一起得到100张图片。 更广泛的上下文: 我正在使用matlab来build立原型,并计划在OpenCV和Tesserect-OCR中实现这个系统。 这是我需要为这个特定应用程序解决的许多image processing问题中的第一个。 所以我期待推出自己的解决scheme,并重新熟悉image processingalgorithm。 下面是一些我希望algorithm处理的示例图片:如果您想要接受挑战,那么大图片位于http://madteckhead.com/tmp 案例1 http://madteckhead.com/tmp/IMG_0773_sml.jpg 案例2 http://madteckhead.com/tmp/IMG_0774_sml.jpg 案例3 http://madteckhead.com/tmp/IMG_0775_sml.jpg 案例4 http:/ /madteckhead.com/tmp/IMG_0776_sml.jpg 最好的情况是: 案例1 – canny http://madteckhead.com/tmp/IMG_0773_canny.jpg 案例1 – post canny http://madteckhead.com/tmp/IMG_0773_postcanny.jpg 案例1 – 最大的博客http://madteckhead.com/tmp/ IMG_0773_blob.jpg 但是在其他情况下很容易失败: 案例2 – canny http://madteckhead.com/tmp/IMG_0774_canny.jpg 案例2 – post canny http://madteckhead.com/tmp/IMG_0774_postcanny.jpg 案例2 – 最大的博客http://madteckhead.com/tmp/ […]
我可以自己写一些东西,通过find一阶导数的零交叉或某些东西,但它似乎是一个普通的function,被包含在标准库中。 任何人都知道吗? 我的具体应用是2D数组,但通常用于查找FFT中的峰值等。 具体而言,在这些问题中,有多个强峰,而且有很多较小的“峰”是由噪声引起的,应该忽略。 这些只是例子。 不是我的实际数据: 1维峰值: 二维峰值: 峰值searchalgorithm将find这些峰值的位置(不仅仅是它们的值),理想情况下可以find真正的样本间峰值,而不仅仅是具有最大值的指数,可能使用二次插值或其他。 通常你只关心几个强的峰值,所以他们要么select,因为他们高于一定的阈值,或者因为他们是一个有序列表的前n个峰值,按幅度sorting。 正如我所说,我知道如何自己写这样的东西。 我只是问是否有一个预先存在的function或包已知可以正常工作。 更新: 我翻译了一个MATLAB脚本 ,它适用于一维情况,但可能会更好。 更新更新: sixtenbe为1-D案例创build了一个更好的版本 。