天天看点

如何利用python将.doc文件转换为.docx文件

前面写了很多利用python-docx批量处理word文件的教程,但是python-docx不支持doc格式,因此如何将doc文件转为docx文件就是一个需要解决的问题,如果文件少可以另存为,如何文件多呢,因此需要一个doc批量转docx的方法。

该方法需要用到另外一个python库win32com,安装方法:

安装win32com

转换方法如下 :

from win32com import client as wc
w = wc.Dispatch('Word.Application')
# 或者使用下面的方法,使用启动独立的进程:
# w = wc.DispatchEx('Word.Application')
doc=w.Documents.Open("E:\\Jupyter\\s.doc")
doc.SaveAs("E:\\Jupyter\\sa.docx",16)#必须有参数16,否则会出错.
           

此外,如果利用python-docx将.docx文件存储为.doc,这个 doc文件是可以利用python-docx打开的,如何是用office创建的则不行。