想做一个c++语言的分词器,可以用自己的词典,分析一些微博数据。现在没有什么思路,希望有人能提供一下思路或者讲解一下类似软件的使用方法。希望有一个完整的思路,是基于什么平台,算法怎么导入,词典怎么导入等等。求求帮忙
说一下思路就行了,拜托了
之前做lucene的时候,试了很多分词器,发现盘古中文分词器还可以,C#的,文档很详细
你看下有没有C++版本的吧