截至本文发布之日,“Microsoft Edge”这个名称已经正式宣布为新的Windows 10的默认浏览器。 现在可能为时过早,但我想知道是否有一个新的Selenium WebDriver可用,如果没有,告诉我们等待多久,直到我们看到一个开发? (Windows 10的技术预览已经出来,所以这似乎不是一个愚蠢的问题给我。)
我试图从网页上刮取产品信息,使用scrapy。 我的被刮的网页看起来像这样: 从10个产品的product_list页面开始 点击“下一步”button加载下面的10个产品(url在两页之间不会改变) 我使用LinkExtractor来跟踪每个产品链接到产品页面,并获得所有我需要的信息 我试图复制next-button-ajax-call,但无法正常工作,所以我给selenium一个尝试。 我可以在一个单独的脚本中运行selenium的webdriver,但我不知道如何与scrapy集成。 我应该在哪里把selenium元素放入我的蜘蛛蛛? 我的蜘蛛是相当标准的,如下所示: class ProductSpider(CrawlSpider): name = "product_spider" allowed_domains = ['example.com'] start_urls = ['http://example.com/shanghai'] rules = [ Rule(SgmlLinkExtractor(restrict_xpaths='//div[@id="productList"]//dl[@class="t2"]//dt'), callback='parse_product'), ] def parse_product(self, response): self.log("parsing product %s" %response.url, level=INFO) hxs = HtmlXPathSelector(response) # actual data follows 任何想法是赞赏。 谢谢!
目前我在看Selenium Server,而且我似乎没有注意到支持无头浏览器testing的驱动程序。 除非我错了,否则不支持。 如果你在X上,你可以创build一个虚拟的framebuffer来隐藏浏览器窗口,但这不是一个真正的无头浏览器。 任何人都可以启发我吗? Selenium支持无头浏览器testing吗?
我有情况,点击button打开新的浏览器窗口与search结果。 有没有什么办法连接和重点新的打开的浏览器窗口? 并使用它,然后返回到原来的(第一个)窗口。
我如何validation我的XPath? 我正在使用Chrome开发人员工具来检查元素并形成我的XPath。 我使用Chrome插件XPath Checker对其进行了validation,但是并不总能给出结果。 有什么更好的方法来validation我的XPath。 我也尝试使用Firebug来检查错误,并使用FirePath进行validation。 但Firepath是否也validationXPath。 我最后的select是使用Selenium WebDriver来确认我的XPath。
这些有什么区别 Webdriver.Close() Webdriver.Quit() Webdriver.Dispose() 哪一个被使用,什么时候?
如何使用Selenium Webdriver处理loginpopup窗口? 我在这里附上了示例屏幕。 如何input/input用户名和密码到这个loginpopup/警告窗口? 感谢和问候,
我正在使用Selenium来启动浏览器。 如何处理要求浏览器接受证书的网页(URL)? 在Firefox中,我可能会有这样一个网站要求我接受这样的证书: 在Internet Explorer浏览器上,我可能会得到如下所示的内容: 在Google Chrome上: 我重复我的问题: 当我用Selenium(Python编程语言)启动浏览器(Internet Explorer,Firefox和Google Chrome)时,如何自动接受网站证书 ?
我试图点击此页面上的一个元素: url = 'https://finance.yahoo.com/quote/GOOG?ltr=1' driver = webdriver.Firefox() driver.get(url) driver.find_element_by_link_text('Financials') 在这一点上,我想点击“现金stream量”,“资产负债表”或“季度”。 我知道这些button已经加载,因为我可以从页面源使用BeautifulSoup提取它们。 但是当我尝试使用Selenium时: driver.find_element_by_link_text('Cash Flow') driver.find_element_by_link_text('Balance Sheet') driver.find_element_by_link_text('Quarterly') 所有返回“无法定位元素”,除了“季度”,它返回的是一个元素,但是它坐在graphics上方,而不是我感兴趣的表格之上。 我认为这是由于在错误的iframe,我已经find所有iframe: driver.find_elements_by_tag_name('iframe') 它返回9个元素。 但是我很难确定哪个iframe是我想要点击的元素所属的。 我也依次通过iframe,仍然找不到我感兴趣的元素。
我正在使用Selenium2进行一些我的网站的自动化testing,我希望能够得到一些Javascript代码的返回值。 如果我在我的网页中有一个foobar() Javascript函数,并且想要调用它并获取返回值到我的Python代码中,我可以调用什么来实现呢?