Tag: HTMLparsing

在IE浏览器中的HTML分析器问题

我试图创build一个对话框,只有当浏览器selectIE浏览器(任何版本)才会出现,但我得到这个错误: 消息:HTML分析错误:无法在子元素closures之前修改父容器元素(KB927917) 这一切都在“行/字符/代码”0,所以我不知道错误在哪里。 我使用的代码是这样的: <script type="text/javascript"> <!– if(BrowserDetect.browser.contains("Explorer")) { var Nachricht = 'Hemos detectado que está utilizando ' + BrowserDetect.browser + ' ' + BrowserDetect.version + '. Puede que algunas funciones no estén habilitadas. <p></p> Si desea experimentar todo el potencial del portal, por favor intente desde otro navegador (browser). <p></p>Gracias showDialog('¡Aviso Importante!',Nachricht,'warning',10); } </script> […]

什么是parsing?

parsing是我在开发过程中遇到的很多问题,但是作为一个初级的解决scheme,我认为在需要的时候,我会在某个时间点解决问题。 在我目前的项目中,我被告知要为某个函数find并使用一个HTMLparsing器,在网上我find了一对,但是HTMLparsing器实际上做了什么? parsing一个对象意味着什么?

在PHP中使用preg_replace时如何获得匹配结果?

我试图抓住几个字的大写字母,并将其包裹在span标签中。 我正在使用preg_replace进行提取和打包,但不输出任何内容。 preg_replace("/[AZ]/", "<span class=\"initial\">$1</span>", $str)

如何在GREP,REGEX或PERL模式下提取string

我有一个这样的文件: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> 我需要提取“name =”后面的引号,即content_analyzer,content_analyzer2和content_analyzer_items。 我在一个Linux机器上这样做,所以使用sed,perl,grep或bash的解决scheme是好的。

你能提供parsingHTML的例子吗?

如何用各种语言和parsing库parsingHTML? 当回答: 个别评论将被链接到关于如何使用正则expression式parsingHTML的问题的答案作为显示正确的方式来做事情的一种方式。 为了保持一致性,我要求示例parsing一个HTML文件,用于锚标记中的href 。 为了方便search这个问题,我要求你遵循这个格式 语言:[语言名称] 图书馆:[图书馆名称] [example code] 请使图书馆链接到图书馆的文件。 如果您想提供除提取链接以外的示例,还包括: 目的:[parsing是什么]

JavaScript:如何从string中去除HTML标签?

可能重复: 从文本JavaScript中去除HTML 我怎样才能脱离JavaScript中的string的HTML?

用JSparsing一个HTMLstring

我search了一个解决scheme,但没有什么是相关的,所以这里是我的问题: 我想parsing一个包含HTML文本的string。 我想用JavaScript语言来做。 我试过这个库: http : //ejohn.org/blog/pure-javascript-html-parser/但它似乎parsing我的当前页面的HTML,而不是从string。 因为当我尝试下面的代码时,它会改变我的页面的标题: var parser = new HTMLtoDOM("<html><head><title>titleTest</title></head><body><a href='test0'>test01</a><a href='test1'>test02</a><a href='test2'>test03</a></body></html>", document); 我的目标是从我读取的HTML外部页面中提取链接,就像string。 你知道一个API来做到这一点吗?

哪个HTMLparsing器是最好的?

我编码了很多parsing器。 到目前为止,我正在使用HtmlUnit无头浏览器进行parsing和浏览器自动化。 现在,我想分开这两个任务。 由于80%的工作只涉及parsing,我想使用一个浅的HTMLparsing器,因为它需要很多时间在HtmlUnit中首先加载一个页面,然后获取源代码,然后parsing它。 我想知道哪个HTMLparsing器是最好的。 如果接近HtmlUnitparsing器,parsing器会更好。 编辑: 最好的,我想至less有以下function: 速度 通过其“标识”或“名称”或“标签types”轻松定位任何HtmlElement。 如果它不清除脏HTML代码,这将是好的。 我不需要清理任何HTML源代码。 我只需要一个最简单的方法来移动HtmlElements并从中收集数据。

如何使用DOMparsing器

我是新来的DOMparsing在PHP中: 我有一个HTML文件,我试图parsing。 它有一堆这样的DIV: <div id="interestingbox"> <div id="interestingdetails" class="txtnormal"> <div>Content1</div> <div>Content2</div> </div> </div> <div id="interestingbox"> …… 我正在尝试使用PHP获取多个div框的内容。 我怎样才能使用DOMparsing器来做到这一点? 谢谢!

正则expression式select标签之间的所有文本

select2个标签之间的所有文本的最好方法是什么 – 例如:页面上所有'pre'标签之间的文本。