转换PDF,DOC,PPT到HTML5

我已经search了(没有任何运气)的open source software that can convert doc, ppt, and pdf to HTML5. ( Scribd究竟是干什么的) Scribd的转换types是否有等价的开源代码?

如果有人知道付费服务,那也可以。 Scribd有一个API ,但是用于Flash查看器。 此外,我想主持我自己的内容,因为我需要进一步控制转换的HTML文件

你不可能find一个能够完成这一切的产品,特别是在开源世界。 更可能的是,你最终会依赖于混杂的东西,甚至可能需要链接一些转换器才能获得HTML。 (例如PDF – > ps – > HTML)

OpenOffice支持转换为HTML,可以从命令行调用。

http://pdftohtml.sourceforge.net/看起来相当不错,在PDF转换为HTML。;

对于Word ML或OpenXML格式的Doc,由于input和输出格式都是XML,所以可以使用XSLT转换。 我已经看到一些样式表在网上浮动,但是YMMV。

顺便说一句,为什么有一个开源的具体要求? 例如,MS Powerpoint已经支持“另存为HTML”格式。

Open Office将把PDF转换为html,但是你会受到打击来devise质量。

我build议: Crocodoc作为付费服务(它提供了不同的平台,如Python,Ruby,Java,PHP开发人员可以在他们的API上工作)或等待官方的Adobe工具(这是在工作中)的不同口味。

对于PDF到HTML的转换,pdf2htmlEX似乎是一个非常好的工具(查看所有示例/示例):

https://github.com/coolwanglu/pdf2htmlEX

对于pdf有一个由mozilla启动的开源项目,非常好: https : //github.com/mozilla/pdf.js/

你可以看到一个hello世界的例子: https : //github.com/mozilla/pdf.js/tree/master/examples/helloworld

对于其他文档types,我认为LibreOffice表示正在计划在html5中构build一些东西,但到目前为止,还没有做任何事情。

http://wvware.sourceforge.net/

wvHtml:将您的Word文档转换为HTML4.0。

可能: http : //www.abisource.com/但在这种情况下,它看起来像“打开文档”>“导出html”手动,也许插件帮助。 不知道,你是什么意思:“可以转换的源代码软件”。

或者这个: http : //www.zope.org/Members/sf/NuxDocument

另外pdftohtml会给你一个html页面输出。但是你将不得不在它的graphics界面上工作。因为它似乎不是非常互动的。

我知道这个问题是有点老,但是我发现新的开源工具称为flaxpaper http://flexpaper.devaldi.com/

Interesting Posts