网上找了半天 说 Simhash算法 可以解决 但是没有找到Simhash算法的代码 基础差了也不知道怎么写
求大神给段代码 10W条数据 放进去 一两秒内能出来就行
跪谢!!!
http://www.cnblogs.com/zengxiangzhan/p/3311114.html
https://github.com/AllenDang/simhash
再做伸手党就把你手给砍了。。。
我的意思是 10W条代码 怎么得出最小的距离 是循环还是怎么?用 http://www.cnblogs.com/zengxiangzhan/p/3311114.html
这上面的代码用10W次循环做了测试要25120.4378毫秒 这就太吓人了
https://github.com/AllenDang/simhash