在Mahout 协同过滤算法中 ItemIDIndexMapper和ItemIDIndexReducer是将items转化为新的索引"index",我非常有疑问这部到底有什么用,为什么不用原始数据的中的"itemid"。而且当多个“itemid”影射到了同一个“index”时ItemIDIndexReducer会取最小的itemid,为什么取最小的itemid,全要不是更好吗,取了最小的itemid,大的itemid怎么办,直接不要了吗?那么数据不就丢了吗。比如hash函数是hash(id)=id%10;那这样岂不是只能存入10条数据,因为<index,itemid>只会取最小的itemid,为什么要这么作,我感觉就是多此一举