用Python读/写MS Word文件
是否有可能在不使用COM对象的情况下使用Python读写Word(2003和2007)文件?
我知道我可以:
f = open('c:\file.doc', "w") f.write(text) f.close()
但Word会将其作为HTML文件而不是本机.doc文件进行读取。
我会研究IronPython ,它本质上可以访问Windows / Office API,因为它运行在.NET运行时。
看到python-docx ,它的官方文档可以在这里find 。
这对我来说工作得非常好。
如果你只读什么,使用linux soffice命令将其转换为文本是最简单的 ,然后将文本加载到python中:
doc(这里是Word 2003)和docx(Word 2007)是不同的格式,后者通常只是xml和图像文件的存档。 我想可以通过操作这些XML文件的内容来写入docx文件。 但是,我不明白如何在没有某种types的COM组件接口的情况下读写文档文件。