有人可以说数据挖掘中的分类和聚类有什么区别吗? 如果可以的话,请举两个例子来理解主要思想。
余弦相似性文章在维基百科 你可以在这里(列表或其他)显示载体,然后做math,让我们看看它是如何工作的? 我是初学者。
我有一个很大的多维数据集(132维)。 我是一名初学者,执行数据挖掘,我想通过使用Matlab来应用主成分分析。 不过,我看到网上有很多function解释,但我不明白应该如何应用。 基本上,我想应用PCA并从我的数据中获得特征向量及其相应的特征值。 在这一步之后,我希望能够根据所获得的特征向量的select对我的数据进行重构。 我可以手动做到这一点,但我想知道是否有任何预定义的function可以做到这一点,因为他们应该已经被优化。 我的初始数据是这样的: size(x) = [33800 132] 。 所以基本上我有132function(尺寸)和33800数据点。 我想在这个数据集上执行PCA。 任何帮助或暗示都可以。
可能重复: 一维数据最佳聚类? 所以我们说我有一个这样的数组: [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法来将数组分成这样的东西? [[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题,但大多数人build议使用k-means来聚类点,比如scipy ,这对于像我这样的初学者来说是相当混乱的。 另外我觉得k-means更适合两维或更多维的聚类吗? 有没有办法根据数字将N个数字分成多个分区/集群? 有些人也提出了严格的范围划分,但并不总是如预期的那样提供结果