Python:将列表切成n个几乎等长的分区
我正在寻找一种快速,干净,pythonic的方式来将列表分割成几乎相等的分区。
partition([1,2,3,4,5],5)->[[1],[2],[3],[4],[5]] partition([1,2,3,4,5],2)->[[1,2],[3,4,5]] (or [[1,2,3],[4,5]]) partition([1,2,3,4,5],3)->[[1,2],[3,4],[5]] (there are other ways to slice this one too)
有几个答案在这里迭代列表切片运行非常接近我想要的,除了他们的重点是列表的大小 ,我关心列表的数量 (其中一些还填充无)。 显然,这些都是微不足道的,但我正在寻找一个最佳实践。
同样,人们在这里指出了很好的解决scheme。 如何将一个列表分成大小均匀的块? 对于一个非常类似的问题,但我更感兴趣的分区数量比特定的大小,只要在1以内。再次,这是微不足道的可转换,但我正在寻找一个最佳实践。
def partition(lst, n): division = len(lst) / float(n) return [ lst[int(round(division * i)): int(round(division * (i + 1)))] for i in xrange(n) ] >>> partition([1,2,3,4,5],5) [[1], [2], [3], [4], [5]] >>> partition([1,2,3,4,5],2) [[1, 2, 3], [4, 5]] >>> partition([1,2,3,4,5],3) [[1, 2], [3, 4], [5]] >>> partition(range(105), 10) [[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17, 18, 19, 20], [21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31], [32, 33, 34, 35, 36, 37, 38, 39, 40, 41], [42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52], [53, 54, 55, 56, 57, 58, 59, 60, 61, 62], [63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73], [74, 75, 76, 77, 78, 79, 80, 81, 82, 83], [84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94], [95, 96, 97, 98, 99, 100, 101, 102, 103, 104]]
Python 3版本:
def partition(lst, n): division = len(lst) / n return [lst[round(division * i):round(division * (i + 1))] for i in range(n)]
这是一个类似于Daniel的版本:它尽可能均匀地分开,但将所有较大的分区放在开头:
def partition(lst, n): q, r = divmod(len(lst), n) indices = [q*i + min(i, r) for i in xrange(n+1)] return [lst[indices[i]:indices[i+1]] for i in xrange(n)]
它也避免了使用浮点运算,因为这总是让我感到不舒服。 🙂
编辑:一个例子,只是为了显示丹尼尔Stutzbach的解决scheme的对比
>>> print [len(x) for x in partition(range(105), 10)] [11, 11, 11, 11, 11, 10, 10, 10, 10, 10]
在你的例子中,只有当[[1,3,5],[2,4]]
是一个可接受的分区时才有效。
def partition ( lst, n ): return [ lst[i::n] for i in xrange(n) ]
这符合丹尼尔·施图茨巴赫的例子中提到的例子:
partition(range(105),10) # [[0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100], # [1, 11, 21, 31, 41, 51, 61, 71, 81, 91, 101], # [2, 12, 22, 32, 42, 52, 62, 72, 82, 92, 102], # [3, 13, 23, 33, 43, 53, 63, 73, 83, 93, 103], # [4, 14, 24, 34, 44, 54, 64, 74, 84, 94, 104], # [5, 15, 25, 35, 45, 55, 65, 75, 85, 95], # [6, 16, 26, 36, 46, 56, 66, 76, 86, 96], # [7, 17, 27, 37, 47, 57, 67, 77, 87, 97], # [8, 18, 28, 38, 48, 58, 68, 78, 88, 98], # [9, 19, 29, 39, 49, 59, 69, 79, 89, 99]]
以下是一种方法。
def partition(lst, n): increment = len(lst) / float(n) last = 0 i = 1 results = [] while last < len(lst): idx = int(round(increment * i)) results.append(lst[last:idx]) last = idx i += 1 return results
如果len(lst)不能被n等分,那么这个版本将以大致相等的时间间隔分配额外的项目。 例如:
>>> print [len(x) for x in partition(range(105), 10)] [11, 10, 11, 10, 11, 10, 11, 10, 11, 10]
代码可能会更简单,如果你不介意所有的11开始或结束。
这个答案提供了一个函数split(list_, n, max_ratio)
,用于那些想要以最大max_ratio
比率将它们的列表分割成n
段的人。 它允许更多的变化比提问者'最多1个片段长度差异'。
它通过在所需的比率范围[1,max_ratio]内采样n段长度,将它们放在彼此后面,形成“断点”之间的正确距离,但错误的总长度。 将破碎的棒状物缩放到所需的长度,可以获得我们想要的断点的大概位置。 要获得整数中断点需要后续舍入。
不幸的是,舍入可能会使得片断太短,让你超过max_ratio。 查看这个答案的底部的例子。
import random def splitting_points(length, n, max_ratio): """n+1 slice points [0, ..., length] for n random-sized slices. max_ratio is the largest allowable ratio between the largest and the smallest part. """ ratios = [random.uniform(1, max_ratio) for _ in range(n)] normalized_ratios = [r / sum(ratios) for r in ratios] cumulative_ratios = [ sum(normalized_ratios[0:i]) for i in range(n+1) ] scaled_distances = [ int(round(r * length)) for r in cumulative_ratios ] return scaled_distances def split(list_, n, max_ratio): """Slice a list into n randomly-sized parts. max_ratio is the largest allowable ratio between the largest and the smallest part. """ points = splitting_points(len(list_), n, ratio) return [ list_[ points[i] : points[i+1] ] for i in range(n) ]
你可以这样试试:
for _ in range(10): parts = split('abcdefghijklmnopqrstuvwxyz', 4, 2) print([(len(part), part) for part in parts])
一个坏结果的例子:
parts = split('abcdefghijklmnopqrstuvwxyz', 10, 2) # lengths range from 1 to 4, not 2 to 4 [(3, 'abc'), (3, 'def'), (1, 'g'), (4, 'hijk'), (3, 'lmn'), (2, 'op'), (2, 'qr'), (3, 'stu'), (2, 'vw'), (3, 'xyz')]