我正在寻找一种方法(或function)去掉所有URL的domain.ext部分,这些部分都被送入函数。 域名的扩展名可以是任何东西(.com,.co.uk,.nl,.whatever),并且可以从http://www.domain.com到www.domain.com/path /script.php?=whatever 什么是最好的方式去做这个?
需要一种方法来提取一个没有使用Python urlparse的url中的子域名的域名。 例如,我想从诸如"http://www.google.com"的完整url中提取"google.com" "http://www.google.com" 。 最接近的,我似乎来与urlparse是netloc属性,但包括子域名,在这个例子中是www.google.com 。 我知道可以编写一些自定义string操作来将www.google.com变成google.com,但是我想避免在这个任务中进行string转换或正则expression式。 (原因是我对URL形成规则不够熟悉,以至于我可以考虑编写自定义parsing函数时所需的每个边界案例。) 或者,如果urlparse不能做我所需要的,有没有人知道任何其他的Pythonurlparsing库呢?