natsort函数的Python模拟(使用“自然顺序”algorithm对列表进行sorting)
我想知道在Python中是否有类似于PHP的natsort函数?
l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] l.sort()
得到:
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
但我想得到:
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
UPDATE
解决scheme基于此链接
def try_int(s): "Convert to integer if possible." try: return int(s) except: return s def natsort_key(s): "Used internally to get a tuple by which s is sorted." import re return map(try_int, re.findall(r'(\d+|\D+)', s)) def natcmp(a, b): "Natural string comparison, case sensitive." return cmp(natsort_key(a), natsort_key(b)) def natcasecmp(a, b): "Natural string comparison, ignores case." return natcmp(a.lower(), b.lower()) l.sort(natcasecmp);
从我的答案 自然sortingalgorithm :
import re def natural_key(string_): """See http://www.codinghorror.com/blog/archives/001018.html""" return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_)]
例:
>>> L = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] >>> sorted(L) ['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg'] >>> sorted(L, key=natural_key) ['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
为了支持Unicodestring,应该使用.isdigit()
而不是.isdigit()
。 请参阅@ phihag的评论中的示例。 相关: 如何显示Unicodes数值属性 。
.isdigit()
在某些语言环境(例如Windows上的cp1252语言环境中的“\ xb2”('2'))中也可能失败( int()
返回的值为Python 2上的字节串 。
您可以在PyPI上查看第三方的natsort库:
>>> import natsort >>> l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] >>> natsort.natsorted(l) ['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
充分披露,我是作者。
这个函数可以用作在Python 2.x和3.x中sorted
的key=
参数:
def sortkey_natural(s): return tuple(int(part) if re.match(r'[0-9]+$', part) else part for part in re.split(r'([0-9]+)', s))