检查一个string是否与python中的IP地址模式相匹配?
检查string是否与特定模式匹配的最快方法是什么? 是正则expression式的最佳方式?
例如,我有一堆string,并希望检查每一个,看看他们是否是一个有效的IP地址(在这种情况下有效的意思是正确的格式),是使用正则expression式做到这一点的最快方法? 或者有像string格式化或更快的东西。
像这样的事情到目前为止我一直在做:
for st in strs: if re.match('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', st) != None: print 'IP!'
看起来你正在尝试validationIP地址 。 正则expression式可能不是最好的工具。
如果你想接受所有有效的IP地址(包括你可能甚至不知道有效的地址),那么你可以使用IPy (Source) :
from IPy import IP IP('127.0.0.1')
如果IP地址无效,则会抛出exception。
或者你可以使用socket
(来源) :
import socket try: socket.inet_aton(addr) # legal except socket.error: # Not legal
如果你真的只想匹配4个小数部分的IPv4,那么你可以分割点testing,每个部分是一个0到255之间的整数。
def validate_ip(s): a = s.split('.') if len(a) != 4: return False for x in a: if not x.isdigit(): return False i = int(x) if i < 0 or i > 255: return False return True
请注意,您的正则expression式不会执行此额外检查。 它将接受999.999.999.999
作为有效地址。
我通常是极less数坚持维护正则expression式的Python专家之一(他们在Python社区中的声誉相当不好),但是这不是其中之一 – 接受(比如说) '333.444.555.666'
为一个“IP地址” 真的很糟糕,如果在匹配RE之后需要做更多的检查,那么使用RE的很多地方都会丢失。 所以,我马上推荐@ Mark的build议: IPy的普遍性和优雅性(包括对IPv6的支持,如果你愿意的话),string操作和int检查,如果你只需要IPv4(但是考虑一下这个限制, – IPv6的时代已经来临! – ):
def isgoodipv4(s): pieces = s.split('.') if len(pieces) != 4: return False try: return all(0<=int(p)<256 for p in pieces) except ValueError: return False
我宁愿这样做,而不是一个令人费解的RE只匹配0到256之间的数字!)
如果你使用Python3 ,你可以使用ipaddress
模块http://docs.python.org/py3k/library/ipaddress.html 。 例:
>>> import ipaddress >>> ipv6 = "2001:0db8:0a0b:12f0:0000:0000:0000:0001" >>> ipv4 = "192.168.2.10" >>> ipv4invalid = "266.255.9.10" >>> str = "Tay Tay" >>> ipaddress.ip_address(ipv6) IPv6Address('2001:db8:a0b:12f0::1') >>> ipaddress.ip_address(ipv4) IPv4Address('192.168.2.10') >>> ipaddress.ip_address(ipv4invalid) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: '266.255.9.10' does not appear to be an IPv4 or IPv6 address >>> ipaddress.ip_address(str) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: 'Tay Tay' does not appear to be an IPv4 or IPv6 address
再次validation没有重新:
def validip(ip): return ip.count('.') == 3 and all(0<=int(num)<256 for num in ip.rstrip().split('.')) for i in ('123.233.42.12','3234.23.453.353','-2.23.24.234','1.2.3.4'): print i,validip(i)
你的正则expression式不检查string的结尾,所以它会匹配:
123.45.67.89abc123boogabooga
要解决这个问题,请使用:
'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'
(注意$
最后)。
最后,在Python中,通常的风格是使用is not None
而不是!= None
。
你应该预编译正则expression式,如果你反复使用它
re_ip = re.compile('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$') # note the terminating $ to really match only the IPs
然后使用
if re_ip.match(st): print '!IP'
但是..例如'111.222.333.444'真的是IP吗?
我会看看netaddr
或ipaddr
库是否可以用来匹配IP
如果你正在validationIP地址,我会build议如下:
import socket try: socket.inet_aton(addr) return True except socket.error: return False
如果你只是想检查它是否在正确的格式,那么你会想要做的所有法律基础 (不只是基数10编号)。
另外,只有IP地址IPv4(而且都不是IPv6),那么你可以查找什么有效的地址,并使用split()
(获取IP的单个组件 )和int()
(为了比较而input种类) 。 有效的IPv4规则的快速参考在这里 。
我们不需要任何import来做到这一点。 这也工作得更快
def is_valid_ip(str_ip_addr): """ :return: returns true if IP is valid, else returns False """ ip_blocks = str(str_ip_addr).split(".") if len(ip_blocks) == 4: for block in ip_blocks: # Check if number is digit, if not checked before calling this function if not block.isdigit(): return False tmp = int(block) if 0 > tmp > 255: return False return True return False
您可以使用正则expression式: http : //www.regular-expressions.info/python.html
编译它可以让它更快一点:
expression = re.compile('^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$') for st in strs: if expression.match(st): print 'IP!'
我欺骗和使用了由他人提交的多个答案的组合。 我认为这是相当清晰和直接的一段代码。 ip_validation
应该返回True
或False
。 此答案也适用于IPv4地址
import re ip_match = re.match('^' + '[\.]'.join(['(\d{1,3})']*4) + '$', ip_input) ip_validate = bool(ip_match) if ip_validate: ip_validate &= all(map(lambda n: 0 <= int(n) <= 255, ip_match.groups())
安装netaddr软件包
sudo pip install netaddr
然后你可以做到这一点
>>> from netaddr import valid_ipv4 >>> valid_ipv4('11.1.1.2') True >>> valid_ipv4('11.1.1.a') False
你也创build一个IPAddress对象从这个string和更多的IP相关的操作
>>> from netaddr import IPAddress >>> ip = IPAddress('11.1.1.1') >>> [f for f in dir(ip) if '__' not in f] ['_module', '_set_value', '_value', 'bin', 'bits', 'format', 'info', 'ipv4', 'ipv6', 'is_hostmask', 'is_ipv4_compat', 'is_ipv4_mapped', 'is_link_local', 'is_loopback', 'is_multicast', 'is_netmask', 'is_private', 'is_reserved', 'is_unicast', 'key', 'netmask_bits', 'packed', 'reverse_dns', 'sort_key', 'value', 'version', 'words']
非常简单,检查给定的IP是否有效使用内置的库ipaddress 。 您也可以使用掩码值进行validation 。
ip = '30.0.0.1' #valid #ip = '300.0.0.0/8' #invalid #ip = '30.0.0.0/8' #valid #ip = '30.0.0.1/8' #invalid #ip = 'fc00:da00::3402:69b1' #valid #ip = 'fc00:da00::3402:69b1/128' #valid #ip = 'fc00:da00::3402:69b1:33333' #invalid if ip.find('/') > 0: try: temp2 = ipaddress.ip_network(ip) print('Valid IP network') except ValueError: print('Invalid IP network, value error') else: try: temp2 = ipaddress.ip_address(ip) print('Valid IP') except ValueError: print('Invalid IP')
注意:在Python 3.4.3中testing
这也适用于ipv6地址。
不幸的是,它只适用于python3
import ipaddress def valid_ip(address): try: print ipaddress.ip_address(address) return True except: return False print valid_ip('10.10.20.30') print valid_ip('2001:DB8::1') print valid_ip('gibberish')