在linux下如何将doc转成docx格式,openoffice\libreoffice读取除外。
或者能奖doc转xml等其他标准格式也行。
命令行还是写代码?
最好是命令行,代码不是非常复杂也可以
@大妖小白: 建议写个专门进行转换的web api,通过在linux上用curl命令将文件发送给这个web api进行转换
@dudu: 主要就是转换过程要用什么库或者软件来处理,没有找到比较合适的
@大妖小白: 或许可以试试 Apache Tika ,详见 Getting Text Out Of Anything (docs, PDFs, Images) Using Apache Tika