如何在mac上用python批量将word文件转成txt文件 / 网络技术编程

如题所述

python实现起来可能没有现成解决方案。因为py库可能没有全面的office套件解析器。

mac想批量转,很容易。

    安装openoffice。

    终端执行 soffice --headless --convert-to txt  my_file.doc/.docx  

    如果批量将当前目录下所有doc转为txt,则写过简单shell:

    for i in `ls *doc`; do soffice --headless --convert-to txt  $i ; done; 即可。

    以上同时适用linux。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-08-26
python批量将word转txt文件比较麻烦,建议使用java的tika包,用python os.Popen执行一个命令直接将获取内容即可;
java -jar tika.jar -m a.doc 获取结果就是word文件内容
相似回答