首页 新闻 会员 周边

关于Luence 调用Parser.parse("Word2003文件") 取出的内容有部分缺少

0
悬赏园豆:100 [已关闭问题]

如题:

Luence 调用Parser.parse("Word2003文件.doc")取出的内容不完整

但是Word2007.docx的文件却可以完整取出

机子装的是Word2007 是不是Parser.parse对旧版兼容不好

各位老鸟路过帮忙看下

LuckyMN的主页 LuckyMN | 初学一级 | 园豆:10
提问于:2010-03-15 12:22
< >
分享
其他回答(1)
0

doc的文件结构应该是二进制编码后的,docx其实是一个zip格式,里面是xml

查尔斯 | 园豆:3832 (老鸟四级) | 2010-03-15 16:14
当把docx文件另存doc文件后 再次读取发现数据又对了
支持(0) 反对(0) LuckyMN | 园豆:10 (初学一级) | 2010-03-15 17:22
0

这个问题建议现在只有Office2003的环境下进行测试下,如果在纯2003的环境下读取还是不能完全的话,那这个确实就有问题了,如果能在Office2003的环境下读取,那这里可能就是版本兼容性问题了。

西越泽 | 园豆:10775 (专家六级) | 2010-03-15 16:33
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册