Tag: 美丽

如果对象有其他类,美丽的汤也找不到CSS类

如果一个页面有<div class="class1">和<p class="class1"> ,那么soup.findAll(True, 'class1')会find它们。 如果它有<p class="class1 class2"> ,但它不会被find。 我如何find具有某个类的所有对象,而不pipe它们是否还有其他类?

美丽的汤4 find_all找不到美丽的汤3find的链接

我注意到一个非常恼人的bug:BeautifulSoup4(package: bs4 )经常比以前的版本(package: BeautifulSoup )find更less的标签。 以下是该问题的可复制实例: import requests import bs4 import BeautifulSoup r = requests.get('http://wordpress.org/download/release-archive/') s4 = bs4.BeautifulSoup(r.text) s3 = BeautifulSoup.BeautifulSoup(r.text) print 'With BeautifulSoup 4 : {}'.format(len(s4.findAll('a'))) print 'With BeautifulSoup 3 : {}'.format(len(s3.findAll('a'))) 输出: With BeautifulSoup 4 : 557 With BeautifulSoup 3 : 1701 如你所见,差异不是很小。 以下是模块的确切版本,以防有人想知道: In [20]: bs4.__version__ Out[20]: '4.2.1' In [21]: BeautifulSoup.__version__ Out[21]: […]

使用python和BeautifulSoup从网页检索链接

我如何检索网页的链接,并复制使用Python的链接的URL地址?