使用PHP从XML中删除空标签
题
如何在PHP中删除空的XML标记?
例:
$value1 = "2"; $value2 = "4"; $value3 = ""; xml = '<parentnode> <tag1> ' .$value1. '</tag1> <tag2> ' .$value2. '</tag2> <tag3> ' .$value3. '</tag3> </parentnode>';
XML结果:
<parentnode> <tag1>2</tag1> <tag2>4</tag2> <tag3></tag3> // <- Empty tag </parentnode>
我想要的是!
<parentnode> <tag1>2</tag1> <tag2>4</tag2> </parentnode>
没有像“tag3”这样的空标签的XML
谢谢!
您可以使用谓词 not(node())
XPath来select所有没有子节点的元素。
<?php $doc = new DOMDocument; $doc->preserveWhiteSpace = false; $doc->loadxml('<parentnode> <tag1>2</tag1> <tag2>4</tag2> <tag3></tag3> <tag2>4</tag2> <tag3></tag3> <tag2>4</tag2> <tag3></tag3> </parentnode>'); $xpath = new DOMXPath($doc); foreach( $xpath->query('//*[not(node())]') as $node ) { $node->parentNode->removeChild($node); } $doc->formatOutput = true; echo $doc->savexml();
版画
<?xml version="1.0"?> <parentnode> <tag1>2</tag1> <tag2>4</tag2> <tag2>4</tag2> <tag2>4</tag2> </parentnode>
$dom = new DOMDocument; $dom->loadXML($xml); $elements = $dom->getElementsByTagName('*'); foreach($elements as $element) { if ( ! $element->hasChildNodes() OR $element->nodeValue == '') { $element->parentNode->removeChild($element); } } echo $dom->saveXML();
CodePad 。
这是recursion的工作,并删除节点:
- 只包含空格
- 没有属性
- 没有孩子的笔记
// not(*) does not have children elements // not(@*) does not have attributes // text()[normalize-space()] nodes that include whitespace text while (($node_list = $xpath->query('//*[not(*) and not(@*) and not(text()[normalize-space()])]')) && $node_list->length) { foreach ($node_list as $node) { $node->parentNode->removeChild($node); } }
如果你要做的很多,只需要做一些事情:
$value[] = "2"; $value[] = "4"; $value[] = ""; $xml = '<parentnode>'; for($i=1,$m=count($value); $i<$m+1; $i++) $xml .= !empty($value[$i-1]) ? "<tag{$i}>{$value[$i-1]}</tag{$i}>" : null; $xml .= '</parentnode>'; echo $xml;
理想情况下,你应该使用domdocument 。
通过使用Xpath,使用我的生产PHP SimpleXMLElement对象代码的解决scheme是:
/* * Remove empty (no children) and blank (no text) XML element nodes, but not an empty root element (/child::*). * This does not work recursively; meaning after empty child elements are removed, parents are not reexamined. */ foreach( $this->xml->xpath('/child::*//*[not(*) and not(text()[normalize-space()])]') as $emptyElement ) { unset( $emptyElement[0] ); }
请注意,不需要使用PHP DOM,DOMDocument,DOMXPath或dom_import_simplexml()。