python编程 python-docx为什么不支持doc格式?

python-docx为什么不支持doc格式?Docx是一种开放格式。它本质上是一个zip文件,可以用解压软件把它解压到一个目录中,包括几个目录,内置图片,所有的东西都在相应的目录中。文本的内容存储在

python-docx为什么不支持doc格式?

Docx是一种开放格式。它本质上是一个zip文件,可以用解压软件把它解压到一个目录中,包括几个目录,内置图片,所有的东西都在相应的目录中。文本的内容存储在XML中,因此用Python解析它相对容易。

Doc是早期生成的文件,已关闭。一般来说,类似的软件如OpenOffice或WPS会对格式进行解码和支持,但不能保证完全支持。这比docx困难得多。

对于该库的开发人员,我认为他没有心思或需要做这样的事情。

如果需要读取doc文件,可以使用win32com模块将doc转换为docx,然后使用python_uux读取内容。

如何用Python实现doc文件批量转换为docx?

安装Python后首先要设置环境变量

然后直接安装vs代码,这样Python就可以在扩展中正常使用了。

在用vs代码调试python时,如果您想使用交互,请参阅其他答案中的问题“集成终端/控制台”。

但那正是我被困的地方。因为我不能运行调试。