Tag: xml

在C#中使用XmlReader读取Xml

我试图尽可能快地读取下面的XML文档,并让其他类pipe理每个子块的读取。 <ApplicationPool> <Accounts> <Account> <NameOfKin></NameOfKin> <StatementsAvailable> <Statement></Statement> </StatementsAvailable> </Account> </Accounts> </ApplicationPool> 但是,我试图使用XmlReader对象来读取每个帐户,随后“StatementsAvailable”。 你build议使用XmlReader.Read并检查每个元素,并处理它? 我想过分开我的类来正确处理每个节点。 因此,这是一个AccountBase类,它接受一个读取NameOfKin的XmlReader实例以及有关该帐户的其他几个属性。 然后,我想要通过陈述进行交stream,让另一个class级充分了解陈述(并随后将其添加到IList中)。 到目前为止,我已经通过XmlReader.ReadElementString()完成了“每类”部分,但我无法弄清楚如何告诉指针移动到StatementsAvailable元素,让我遍历它们,并让其他类读取每个这些proeprties 。 听起来很简单!

XPath如何处理XML名称空间?

XPath如何处理XML名称空间? 如果我使用 /IntuitResponse/QueryResponse/Bill/Id parsing下面的XML文档,我得到0个节点。 <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <IntuitResponse xmlns="http://schema.intuit.com/finance/v3" time="2016-10-14T10:48:39.109-07:00"> <QueryResponse startPosition="1" maxResults="79" totalCount="79"> <Bill domain="QBO" sparse="false"> <Id>=1</Id> </Bill> </QueryResponse> </IntuitResponse> 但是,我没有在XPath中指定名称空间(即http://schema.intuit.com/finance/v3不是path中每个标记的前缀)。 如果我没有明确地告诉XPath XPath如何知道我想要的Id ? 我想在这种情况下(因为只有一个名称空间),XPath可以完全忽略xmlns 。 但是,如果有多个命名空间,事情可能会变得丑陋。

正确的方法来实现IXmlSerializable?

一旦程序员决定实现IXmlSerializable ,实现它的规则和最佳实践是什么? 我听说GetSchema()应该返回null并且ReadXml应该在返回之前移动到下一个元素。 这是真的? 那么WriteXml怎么样 – 它应该为对象写一个根元素,还是假定根已经被写入了? 应如何处理和写入子对象? 这里是我现在拥有的一个样本。 我会更新它,因为我得到很好的回应。 public class MyCalendar : IXmlSerializable { private string _name; private bool _enabled; private Color _color; private List<MyEvent> _events = new List<MyEvent>(); public XmlSchema GetSchema() { return null; } public void ReadXml(XmlReader reader) { if (reader.MoveToContent() == XmlNodeType.Element && reader.LocalName == "MyCalendar") { _name = reader["Name"]; […]

很好用Python打印XML

什么是最好的方式(甚至是各种方式)漂亮的Python打印XML?

在C#中使用带默认命名空间的Xpath

我有一个默认名称空间的XML文档。 我正在使用XPathNavigator来使用Xpathselect一组节点,如下所示: XmlElement myXML = …; XPathNavigator navigator = myXML.CreateNavigator(); XPathNodeIterator result = navigator.Select("/outerelement/innerelement"); 我没有得到任何结果:我假设这是因为我没有指定命名空间。 我如何在我的select中包含命名空间?

XML中的无效字符

目前我正在使用一些XML。 我有像下面这样的string的节点: <node>This is a string</node> 我传递给节点的一些string将包含&,#,$等字符 <node>This is a string & so is this</node> 这是无效的, 我不能在CDATA中包装这些string,因为它们需要保持原样。 我已经尝试在线查找不能放入XML节点而不在CDATA中的字符列表。 任何人都可以向我指出一个方向,还是给我提供一个非法字符列表?

如何在Bash中parsingXML?

理想情况下,我希望能够做的是: cat xhtmlfile.xhtml | getElementViaXPath –path='/html/head/title' | sed -e 's%(^<title>|</title>$)%%g' > titleOfXHTMLPage.txt

使用XML包将html表格刮到R数据框中

如何使用XML包来刮取html表格? 以巴西足球队的维基百科页面为例。 我想在R中读取它,并将“巴西队与国际足联认可的球队对阵的所有比赛名单”作为一个data.frame。 我该怎么做?

用于Web服务的SOAP还是REST?

REST是做Web服务还是SOAP的更好方法? 或者他们是不同的工具来解决不同的问题 或者这是一个细微的问题 – 也就是说,在某些领域比另一个领域略胜一筹? 赏金编辑: 现在,差不多三年后,我想再次提出这个问题 – 提供一个奖励,鼓励一个深入的答案。 我特别感谢有关这些概念及其与PHP世界以及现代高端Web应用程序的关系的信息。

如何parsing无效的(坏的/不正确的)XML?

目前,我正在研究一个涉及parsing从其他产品收到的XML的function。 我决定对一些实际的客户数据进行一些testing,看起来另一种产品允许来自用户的input被认为是无效的。 无论如何,我仍然需要尝试找出一种parsing方法。 我们正在使用javax.xml.parsers.DocumentBuilder而且input错误如下所示。 <xml> … <description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description> … </xml> 正如你所看到的,描述里面有一个无效的标签( <THIS-IS-PART-OF-DESCRIPTION> )。 现在,这个描述标签被认为是一个叶子标签,它不应该有任何嵌套的标签。 无论如何,这仍然是一个问题,并产生DocumentBuilder.parse(…) 我知道这是无效的XML,但它是可以预见的无效。 任何想法的方式来parsing这样的input?