现在我需要用到ASPOSE将word文档拆分,就是说将原word的每一页独立转换成pdf或图片或HTML。现在每一页独立转换时没有问题,但是格式总有那么一些问题,即每一页没有严格按照原来word的内容进行转换,有部分内容到了下一个文档。
比如说现在目录原本是在第七页的,但是转换后又有几行跑到了第八页.
哪位对这个组件比较熟悉的,可以指点下?或者其他组件能实现将word的每一页拆分成独立的文件也可以
先谢过啦
转换前:
转换后:
你用微软自己出的那个吧。
你是说OPEN XML SDK还是要装微软office的那个组件?这支持将每一页独立拆分出来另存为图片、pdf、HTML之类的吗。
不知是否提供一个简单的demo
@说实话的秀才: OPEN XML SDK有个工具可以把你的word文档生成后台代码,应该你下载的时候就有吧。你上网查一下。再有一个就是aspose 他的保存方法并没有根据word的页面去分页,它是根据内容去分页的,只要内容超过他规定的一页存储内容会自动分页,并且也不会对文档进行有效的压缩。比如如果在一个页面之间存在空白,也不会有效的。不仅word包括excel也是,最操蛋的就是excel和visio 格式的文件。
@Mr.Brian: aspose很强大的同时也有些蛋疼的地方,严格按照word的分页处理文档问题有老外在2012年就提出了,但是aspose官方至今没有处理这个问题。
至于OPEN XML SDK我还没有深入研究,粗略看了下文档和网友分享的信息,基本都是满足生成一个什么样的文档,往文档中穿插内容等,好像没有看到说按照word的每一分页进行拆分转换。
OPEN XML SDK能实现我想要的功能更吗?
@说实话的秀才: 如果你买的aspose官方的类库,你可以向他们研发部门提bug。open xml sdk可以满足你的需求,但是你得熟悉openxml才行啊。他里面到处控件代码。不过我觉得代码逻辑还是比较清楚。你可以把你想要转化后的word文档通过open xml sdk生成代码。然后你再根据代码修改一下!这是一些例子,你看看:
@Mr.Brian: 不过你通过open xml sdk获取word文档的话,你的什么内容都可以自定制。比较灵活!
@Mr.Brian: 如果你想通过open xml sdk实现pdf转换word的话,貌似不可以吧!open xml是操纵你知道word内容的或者已经生成后的word。这种方式不可取!我以为你要操纵word修改内容呢!
@Mr.Brian: 我刚才通过OPEN XML SDK TOOL查看一个word结构,它只有word2007建立的docx文件 或者经过word 2007另存为的docx文件才能打开,wps的另存为的不行。因为我是针对外网用户,所以这个限制就太死啦。如果是针对固定的企业用户还可以。
OPEN XML SDK 实现的是底层操作,更多的上层封装还得自己封装?
@说实话的秀才: 那样的话那就不好处理了啊。你再试试再他转化为word时,能不能用个算法把该页的文件内容压缩一下。如果还是不行的话,我也没有好的解决办法。
@Mr.Brian: 好像Microsoft Word 11.0 Object Library也不支持将word一页一页拆分,以前只用过将简单的保存到新的word文件。
@说实话的秀才: 这样的话我没办法了啊,你自己再想想,如果想到了别忘了告诉一声!
@Mr.Brian: 好的,谢谢你,给了我不少建议
@说实话的秀才: 客气了啊,互相学习!
你可以通过ASPOSE得到一页,创建一页的图片啊,转换的话,它是根据内容分页的。你可以得到word的每一页,然后根据word的分页去创建图片。
是可以得到每一页,他的save方法好强大,可以一次性把整个文档都保存了,也可以一页一页保存,但是问题是格式会有点问题。即当前页的内容有可能别划分到了下一页去,这样就没有严格按照word的每一页内容进行转换。不知有何解决办法?