python实现起来可能没有现成解决方案。因为py库可能没有全面的office套件解析器。
mac想批量转,很容易。
安装openoffice。
终端执行 soffice --headless --convert-to txt my_file.doc/.docx
如果批量将当前目录下所有doc转为txt,则写过简单shell:
for i in `ls *doc`; do soffice --headless --convert-to txt $i ; done; 即可。
以上同时适用linux。