指点一些很好的SVM教程
我一直在努力掌握支持向量机的基础知识,并下载并阅读了许多在线文章。 但是还是无法把握。
我想知道,如果有一些
- 很好的教程
- 可以用于理解的示例代码
或者你可以想到的东西,这将使我能够轻松学习SVM基础知识。
PS:我不知何故设法学习PCA(主成分分析)。 顺便说一句,你们会猜到我正在从事机器学习。
支持向量机教程的标准build议是由Christopher Burges 提供的模式识别支持向量机教程 。 另外一个学习SVM的好地方是斯坦福大学的机器学习课程 (支持向量机涵盖在6-8讲座中)。 这些都是相当理论和沉重的math。
至于源代码; SVMLight , libsvm和TinySVM都是开源的,但代码不是很容易遵循。 我没有仔细看过他们每一个,但TinySVM的来源可能是最容易理解的。 本文还有一个SMOalgorithm的伪代码实现。
这是一个很好的初学者关于SVM的教程:
http://www.tristanfletcher.co.uk/SVM%20Explained.pdf
我一直以为StompChicken推荐的教程有点混乱,他们直接谈论界限和VC统计,并试图find最佳的机器等等。 不过,如果你已经理解了基础知识,那就太好了。
SVM上的很多video讲座:
http://videolectures.net/Top/Computer_Science/Machine_Learning/Kernel_Methods/Support_Vector_Machines/
我发现科林·坎贝尔的那个非常有用。
对libsvm 进行SVM分类的实用指南
PyML的PyML教程我认为1是实用的, 3是明白的理解。
假设你知道基本知识(例如,最大边缘分类器,构造一个核心),解决斯坦福机器学习课程的习题集2(讲义#5) 。 有答案钥匙,他握着你的手在整个过程中。 使用讲义3和video#7-8作为参考。
如果您不了解基本知识,请观看较早的video。
我会拿一个R的副本,安装好的 libsvm的e1071包,并尝试在你最喜欢的数据集上获得好的结果。
如果您刚刚计算出了PCA,那么使用比病例更多的预测因子(例如,微arrays基因expression谱,时间序列,来自分析化学的光谱等)来查看数据可能是有益的,并比较PCA预测因子的线性回归与SVM的原始预测。
在其他答案中有很多很棒的参考,但是我认为在阅读内容之前,玩这个黑盒子是有价值的。