正则表达式好了。
效率太低
是分词还是什么东东.?分词的我知道有ictclas,好像不错.
不是分词,其实就是将所有敏感词建一棵树,然后将文本内容去对比查找就可以了。想找一个这方面做的不错的案例来看一下
@阿正-WEB: 开源的我不知道有什么.不过你说的这个东西好像和我们公司的一个系统很相似,
http://newvoc.onlinevoc.cn/
我知道,是******************************************************************。