python編程 python-docx為什么不支持doc格式?
python-docx為什么不支持doc格式?Docx是一種開放格式。它本質(zhì)上是一個zip文件,可以用解壓軟件把它解壓到一個目錄中,包括幾個目錄,內(nèi)置圖片,所有的東西都在相應的目錄中。文本的內(nèi)容存儲在
python-docx為什么不支持doc格式?
Docx是一種開放格式。它本質(zhì)上是一個zip文件,可以用解壓軟件把它解壓到一個目錄中,包括幾個目錄,內(nèi)置圖片,所有的東西都在相應的目錄中。文本的內(nèi)容存儲在XML中,因此用Python解析它相對容易。
Doc是早期生成的文件,已關閉。一般來說,類似的軟件如OpenOffice或WPS會對格式進行解碼和支持,但不能保證完全支持。這比docx困難得多。
對于該庫的開發(fā)人員,我認為他沒有心思或需要做這樣的事情。
如果需要讀取doc文件,可以使用win32com模塊將doc轉(zhuǎn)換為docx,然后使用python_uux讀取內(nèi)容。
如何用Python實現(xiàn)doc文件批量轉(zhuǎn)換為docx?
安裝Python后首先要設置環(huán)境變量
然后直接安裝vs代碼,這樣Python就可以在擴展中正常使用了。
在用vs代碼調(diào)試python時,如果您想使用交互,請參閱其他答案中的問題“集成終端/控制臺”。
但那正是我被困的地方。因為我不能運行調(diào)試。