Python中的RSS提要parsing器库

我正在寻找一个好的Python库,这将帮助我parsingRSS提要。 有没有人使用feedparser? 任何反馈?

使用feedparser比使用minidom或BeautifulSoup来滚动你自己更好。

  • 它规范了所有版本的RSS和Atom之间的差异,所以你不必为每种types有不同的代码。
  • 在提要中检测不同的date格式和其他变体是很好的。
  • 它会自动跟踪HTTPredirect。
  • 它消毒HTML内容。
  • 它支持ETag和Last-Modified头文件,所以你可以通过下载HTTP头文件而不是整个提要来查看提要是否已经改变。
  • 它支持authentication的饲料。
  • 它支持HTTP代理。

像其他人所说的那样,试试吧。 这就像2行代码来parsing一个饲料。 我唯一的抱怨是,它只是使用字典作为其数据模型,如果字典中没有属性,字典中可能会丢失一些属性,所以您必须在代码中检查这些属性。 但是文档非常清楚哪些属性总是在字典中,哪些可能会丢失。

最后,我可以保证,因为我已经写了一个使用它的应用程序。 看到这里: http : //www.feednotifier.com/

Feedparserfunction非常强大,可configuration,易于使用。 一个非常友好的学习曲线,如果有的话。

以编程方式确定您的问题有多less个答案:

easy_install feedparser python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])' 

在回答你的后续。 你可以使用BeautifulSoup – 但feedparser更适合RSS处理。

不要嗤之以鼻 – 但是您是否阅读了feedparsers 文档 ? 我不知道如何更简单的使用。

我知道这是一个非常古老的话题,但是为了什么价值,我使用了feedparser(Universal feed parser)版本5.1.3,为了提高性能,我最近把它换成了speedparser(0.1.8)。 它有几乎相同的接口,但运行速度更快。

我将它用于一个业余的Python for Android应用程序,speedparser在我的提要上运行速度提高了5倍。

如果你想要一个替代品,请尝试xml.dom.minidom。 像“Django是Python”,“RSS是XML”。

我强烈build议feedparser。

    Interesting Posts