Tag: 聚类分析

Python的k-meansalgorithm

我正在寻找Python实现k-meansalgorithm与例子来聚类和caching我的坐标数据库。

具有未知数量的簇的无监督聚类

我有一个三维vector大集。 我需要根据欧几里德距离对它们进行聚类,使得任何特定聚类中的所有向量之间的欧氏距离小于阈值“T”。 我不知道有多less个集群存在。 最后,可能存在不属于任何聚类的单个vector,因为其欧几里得距离不小于空间中任何vector的“T”。 现在应该使用哪些现有的algorithm/方法? 谢谢Abhishek S

期望最大化技术的直观解释是什么?

期望最大化如果一种概率的方法来分类数据。 如果不是分类,请纠正我的错误。 什么是这种EM技术的直观解释? 这里的期待是什么,什么是最大化?

是否可以使用scikit-learn K-Means Clustering来指定自己的距离函数?

是否可以使用scikit-learn K-Means Clustering来指定自己的距离函数?

数据挖掘中分类和聚类的区别?

有人可以说数据挖掘中的分类和聚类有什么区别吗? 如果可以的话,请举两个例子来理解主要思想。

一维数据最佳聚类?

有没有人有一篇文章解释Ckmeans.1d.dpalgorithm的工作原理? 或者:在一维中进行k-means聚类的最优方法是什么?

1D数组数组聚类

可能重复: 一维数据最佳聚类? 所以我们说我有一个这样的数组: [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法来将数组分成这样的东西? [[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题,但大多数人build议使用k-means来聚类点,比如scipy ,这对于像我这样的初学者来说是相当混乱的。 另外我觉得k-means更适合两维或更多维的聚类吗? 有没有办法根据数字将N个数字分成多个分区/集群? 有些人也提出了严格的范围划分,但并不总是如预期的那样提供结果

使用k-means聚类时如何确定k?

我一直在研究k-means聚类 ,有一点不清楚的是你如何selectk的值。 这只是一个反复试验的问题,还是还有更多呢?

R中的聚类分析:确定聚类的最佳数量

作为R的新手,我不太确定如何select最佳数量的聚类来进行k均值分析。 在绘制以下数据的子集之后,将有多less个集群适合? 我怎样才能进行聚类dendro分析? n = 1000 kk = 10 x1 = runif(kk) y1 = runif(kk) z1 = runif(kk) x4 = sample(x1,length(x1)) y4 = sample(y1,length(y1)) randObs <- function() { ix = sample( 1:length(x4), 1 ) iy = sample( 1:length(y4), 1 ) rx = rnorm( 1, x4[ix], runif(1)/8 ) ry = rnorm( 1, y4[ix], runif(1)/8 ) return( […]