有没有一个推荐的软件包在Python机器学习?
有没有一个推荐的软件包在Python机器学习?
我有以前在C ++和MATLAB中实现各种机器学习和统计algorithm的经验,但是在Python中做了一些工作,我对Python的可用包感到好奇。
AFAIK, Orange可能是目前最好的select。
PyML也不错。
PyMC用于贝叶斯估计。
还有一本书“机器学习:一个algorithm的视angular”, 书中有很多Python代码的例子 ,可能值得一读。
还有一篇博客文章: Python的语用分类 。
只是我的两分钱。
还有scikit学习 (BSD,只依赖于numpy和scipy)。 它包括各种监督学习algorithm,如:
- 基于libsvm的SVM和线性scipy.sparse绑定广泛的function数据集
- 贝叶斯方法
- HMM模型
- L1和L1 + L2正则化回归方法,即用LARS和坐标下降algorithm实现的Lasso和Elastic Net模型
它还具有无监督的聚类algorithm,如:
- k均值++
- 均值漂移
- 亲和力传播
- 谱聚类
还有其他工具,如:
- 用于文本内容的特征提取器(标记和字符+散列vector化器)
- 单variables特征select
- 一个简单的pipe道工具
- 交叉validation策略的许多实现
- 绩效指标评估和绘图(ROC曲线,AUC,混淆matrix,…)
- 网格search实用程序使用并行交叉validation来执行超参数调整
- 与joblib集成,以便在交互式环境中工作时caching部分结果(例如,使用ipython)
每个algorithm实现都附带示例程序,演示其在玩具数据或实际生活数据集上的使用情况。
此外,官方的源代码仓库托pipe在github上,所以请随时用交互式代码审查的常规拉取请求function来贡献错误修正和改进。
一个普通的用户友好的软件包是橙色 – 如Weka或RapidMiner,如果你熟悉这些。
除此之外,还有各种各样的包和工具包用于各种任务。 您应该参考mloss上列出的Python包作为起点。
你可能想看看:
http://www.shogun-toolbox.org/ ,它有多种语言的接口,包括python。 也有http://www.pybrain.org/ ,这是(我相信)MLalgorithm的本地实现。 希望有所帮助。
对于支持向量机,看看其中包含Python接口的LibSVM 。
深度学习教程描述如何开发和训练深度neural network。 使用的库甚至使用Nvidia GPU(如果可用)。
在堆栈溢出可能相关的问题:
python中的人工智能库 。
什么是最好的Python人工智能库?
我给了Orange一个尝试。
它很强大,但是如果你仔细阅读文档,你会发现作者有他自己疯狂的Python编写风格。 如果你对Python比较陌生,那么他的代码就会变得非常神秘,所以除非你熟悉Python,否则我不会推荐Orange。
我不确定你是否确切地称这个机器学习,但nltk包做贝叶斯风格的文本分类。 您可以使用学习数据和testing数据来查看它是推断有关数据的规则。
这是SciPy完成的一个很好的清单,包括许多着名的Python软件包,其中包括机器学习相关的内容: 人工智能和机器学习
看看用于数据处理(MDP)的模块化工具包 。 它从机器学习和统计实现了几个algorithm,它是成熟的和有据可查的。
如果你正在寻找neural network,python绑定fann是很容易使用,并与工具来训练你的networking
SVMlight有时是LibSVM的替代scheme! 不过,LibSVM也是太棒了。