如题:
Luence 调用Parser.parse("Word2003文件.doc")取出的内容不完整
但是Word2007.docx的文件却可以完整取出
机子装的是Word2007 是不是Parser.parse对旧版兼容不好
各位老鸟路过帮忙看下
doc的文件结构应该是二进制编码后的,docx其实是一个zip格式,里面是xml
这个问题建议现在只有Office2003的环境下进行测试下,如果在纯2003的环境下读取还是不能完全的话,那这个确实就有问题了,如果能在Office2003的环境下读取,那这里可能就是版本兼容性问题了。