首页 新闻 搜索 专区 学院

求关于批量读取文件内容的方法

0
悬赏园豆:50 [已解决问题] 解决于 2014-07-29 09:35

当前环境

1:由于近来在做邮件分析系统,需要在软件中导入outlook客户端生成的文件,软件会自动将这个文件分成若干封电子邮件,邮件中几乎都有附件(doc,docx,pdf)

 

问题描述

1:实现搜索功能

就是在一个文本框中输入一些关键字,需要在所有邮件附件中找出含有此关键字的附件;

简答来说就类似与 我在e:\\file这个目录放置了1000个文件(doc,docx,pdf),现在输入关键字,要在这1000个文件中快速找出含有此关键字的所有文件,求帮忙提供思路,谢谢...

 

公子迪的主页 公子迪 | 初学一级 | 园豆:104
提问于:2014-07-28 09:39
< >
分享
最佳答案
0

luncene.net

收获园豆:50
Launcher | 高人七级 |园豆:45045 | 2014-07-28 10:11

感谢大神,准备好好研究下,谢谢 :)

公子迪 | 园豆:104 (初学一级) | 2014-07-29 09:34
其他回答(3)
0

提取附件内容,做一次缓存(可以存数据库),然后采用数据库的like查询,或者全文检索,就能实现这样的功能了。

幻天芒 | 园豆:36790 (高人七级) | 2014-07-28 10:19
0

多开几个线程,并行搜索,汇总结果集。

空明流光 | 园豆:20 (初学一级) | 2014-07-28 10:29
0

楼主问的问题是一个微软至今没有很好解决的问题,如果有人很好地解决了,麻烦告诉我一声。

很好地解决的意思是,一不能占用很多的硬盘空间。(比如把所有WORD、PDF、EXCEL文件内容全部读到数据库里面)

二要快。

据我所知,微软也没有办法很快地完成这件事,我在硬盘上这样找的话,半个小时不一定能完成啥事。

爱编程的大叔 | 园豆:30768 (高人七级) | 2014-07-28 16:31

1楼说的luncene.net 应该可以实现,貌似效率还不错。

我简单看了下,准备好好研究一下 :)

支持(0) 反对(0) 公子迪 | 园豆:104 (初学一级) | 2014-07-29 09:33
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册