首页 新闻 会员 周边 捐助

Mahout中协同过滤源码当中为什么要引入ItemIDIndexMapper

0
悬赏园豆:10 [已关闭问题] 关闭于 2015-12-02 14:07

在Mahout 协同过滤算法中 ItemIDIndexMapper和ItemIDIndexReducer是将items转化为新的索引"index",我非常有疑问这部到底有什么用,为什么不用原始数据的中的"itemid"。而且当多个“itemid”影射到了同一个“index”时ItemIDIndexReducer会取最小的itemid,为什么取最小的itemid,全要不是更好吗,取了最小的itemid,大的itemid怎么办,直接不要了吗?那么数据不就丢了吗。比如hash函数是hash(id)=id%10;那这样岂不是只能存入10条数据,因为<index,itemid>只会取最小的itemid,为什么要这么作,我感觉就是多此一举

TomStudio的主页 TomStudio | 初学一级 | 园豆:58
提问于:2015-09-10 17:20
< >
分享
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册