Tag: 特征提取

使用OpenCV提取HoG特性

我正在尝试使用OpenCV的HoG API提取function,但是我似乎无法find允许我这样做的API。 我想要做的是从我的所有数据集(一组正面和负面的图像)使用HoG提取function,然后训练我自己的SVM。 我在OpenCV下偷看到HoG.cpp,并没有帮助。 所有的代码都被埋在复杂性之中,并且需要满足不同的硬件(例如英特尔的IPP) 我的问题是: 是否有任何OpenCV API可用于提取所有要提交给SVM的特征/描述符? 如果有什么可以用它来训练我自己的SVM? 如果没有,那里有没有现成的图书馆可以完成同样的事情? 到目前为止,我实际上是从Processing(Java)向C ++移植一个现有的库(http://hogprocessing.altervista.org/),但是它仍然非常慢,检测至less需要16秒 有没有其他人成功提取HoGfunction,你是如何绕过它? 你有没有可以使用的开源代码? 提前致谢

文本分类的特征select与缩减

我目前正在做一个项目,一个简单的情绪分析器 ,以便在不同的情况下会有2和3个class 。 我使用的是一个语料相当丰富的语料库 (大约200.000)。 为了特征select ,我使用袋字法,为了减less独特特征的数量,由于出现频率的 阈值而消除。 最后一组特征包括大约20,000个特征,实际上减less了90% ,但是对于testing预测的预期准确性 还不够 。 我依次使用LibSVM和SVM-light进行训练和预测(包括线性和RBF内核 )以及Python和Bash 。 到目前为止观察到的最高精度 是75%左右 ,我至less需要90% 。 二进制分类就是这种情况。 对于多class培训 ,准确率降至〜60% 。 在这两种情况下,我至less需要90% ,并且不能如何增加它:通过优化训练参数或通过优化特征select ? 我已经阅读了关于文本分类中的特征select的文章,并且我发现使用了三种不同的方法,实际上它们之间有明确的相关性。 这些方法如下: 书包的频率方法(BOW) 信息增益 (IG) X ^ 2统计 (CHI) 第一种方法已经是我使用的方法,但是我使用它非常简单,需要指导以更好地使用它以获得足够高的准确性。 我也缺乏关于IG和CHI实际实施的知识,并且希望有任何帮助来指导我。 非常感谢,如果您需要任何其他信息的帮助,请让我知道。 @larsmans: Frequency Threshold(频率阈值) :我正在寻找例子中唯一词的出现次数,例如,如果一个词在不同的例子中频繁出现,它被包含在特征集中作为一个独特的特征。 @TheManWithNoName:首先感谢您解释文档分类的一般问题。 我审查和试验了你提出的所有方法和其他方法。 我发现比例差异 (PD)方法是最好的特征select,其中function单一和术语存在 (TP)的权重(我不明白你为什么标签术语频率逆文档频率 (TF- IDF)作为索引方法,我宁愿把它看作一个特征加权方法)。 正如你所提到的, 预处理也是这个任务的一个重要方面。 我使用某些types的string消除来细化数据以及形态分析和词干 。 另外请注意,我正在使用土耳其语 ,与英语相比,它有不同的特点 […]

特征检测与描述符提取的区别

有谁知道OpenCV 2.3中FeatureDetection和DescriptorExtraction的区别吗? 我知道后者是使用DescriptorMatcher进行匹配所必需的。 如果是这样,什么是FeatureDetection使用? 谢谢。