图像中的标识识别
有没有人知道最近在图像中进行标识识别的学术工作? 请仅在您熟悉此特定主题的情况下回答(我可以自己searchGoogle“标识识别”,非常感谢)。 任何熟悉计算机视觉,并且已经完成目标识别工作的人都可以发表评论。
更新 :请参考algorithm方面(您认为合适的方法,现场的论文,是否应该对真实世界的数据进行工作(并经过testing),效率的考虑),而不是技术方面(使用的编程语言或无论是在OpenCV中…)在图像索引和基于内容的图像检索方面的工作也可以提供帮助。
你可以尝试使用像SIFT这样的本地特性: http : //en.wikipedia.org/wiki/Scale-invariant_feature_transform
它应该工作,因为徽标形状通常是恒定的,所以提取的特征应该匹配得很好。
工作stream程将如下所示:
-
检测angular落(如哈里斯angular落探测器) – 耐克标志,他们是两个尖锐的结束。
-
计算描述符(如SIFT – 128D整数向量)
-
在训练阶段记住他们; 在匹配阶段find训练期间获得的数据库中的每个特征的最近邻居。 最后,你有一组匹配(其中一些可能是错误的)。
-
使用RANSAC挑出错误的匹配。 因此,您将获得描述从理想的徽标图像转换为您find徽标的图像的matrix。 根据设置,您可以允许不同types的转换(只是平移;平移和旋转;仿射变换)。
Szeliski的书有关于地方特征的一章(4.1)。 http://research.microsoft.com/en-us/um/people/szeliski/Book/
PS
-
我假设你想在照片中find标识,例如find所有的百事可乐广告牌,所以他们可能会被扭曲。 如果您需要在屏幕上find电video道徽标(以免旋转和缩放),则可以更容易(模式匹配或其他)。
-
传统的SIFT不考虑颜色信息。 由于徽标通常具有不变的颜色(尽pipe确切的颜色取决于闪电和相机),您可能想要以某种方式考虑颜色信息。
我们致力于在真实世界的图像中进行标志检测/识别。 我们还创build了一个FlickrLogos-32数据集并公开发布,包括数据,基本事实和评估脚本。
在我们的工作中,我们将标识识别作为检索问题来简化多类识别,并允许这样的系统可以很容易地扩展到许多(例如数千个)标识类。
最近,我们开发了一种捆绑技术,称为Bundle min-Hashing ,将多个局部特征的空间configuration聚合成高度独特的特征包。 包表示可用于检索和识别。 有关徽标检测,请参阅以下示例热度图:
你会发现更多关于内部操作的细节,这个方法的潜在应用,对它的性能的实验,当然还有很多参考文献中的相关工作[1] [2] 。
在此工作:体育video数据库中的商标匹配和检索获得论文的PDF: http ://scholar.google.it/scholar?cluster=9926471658203167449&hl=zh-CN&as_sdt =2000
我们使用SIFT作为商标和图像描述符,以及归一化的阈值匹配来计算模型和图像之间的距离。 在我们最新的工作中,我们已经能够使用元模型大大减less计算量,创build评估同一商标不同版本中存在的SIFT点的相关性。
我想说的是,由于目前使用的电视标准的视觉质量很差,一般来说,使用video工作比处理照片更困难。
马尔科
我曾经在一个项目上做过类似的事情。 起初我尝试使用这个软件的哈尔训练技巧
OpenCV的
它工作,但不是我们需要的最佳解决scheme。 我们的源图像(我们在寻找标志的地方)是一个固定的大小,只包含标志。 正因为如此,我们可以使用已知匹配的cvMatchShapes,并比较返回的值来认为匹配良好。