可能重复: 一维数据最佳聚类? 所以我们说我有一个这样的数组: [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法来将数组分成这样的东西? [[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题,但大多数人build议使用k-means来聚类点,比如scipy ,这对于像我这样的初学者来说是相当混乱的。 另外我觉得k-means更适合两维或更多维的聚类吗? 有没有办法根据数字将N个数字分成多个分区/集群? 有些人也提出了严格的范围划分,但并不总是如预期的那样提供结果
我有一个庞大的N维点(数千万,N接近100)。 我需要将这些点映射到一个维度,同时保留空间局部性。 我想用希尔伯特空间填充曲线来做到这一点。 对于每个点,我想select曲线上最近的点。 该点的Hilbert值(从曲线起点到拾取点的曲线长度)是I seek的单维值。 计算不一定是即时的,但我期望在不错的现代家庭PC硬件上不超过几个小时。 任何关于实施的build议? 有没有任何图书馆可以帮助我? (语言不重要。)