对于k-means算法的mapreduce化得疑问

悬赏园豆：5 [已关闭问题] 关闭于 2015-02-09 12:05

本人刚刚接触hadoop不久，现在想自己写一个k-means算法，但是在随机选择聚类中心那里遇到了问题。

如果数据量少的话，可以通过先遍历一下全部数据，然后随机选择，但是面对海量数据的话，还是要这样做么？或者有哪些快捷的方法或者想法？

本人所理解：生成初始的聚类中心是在map之前的。

另外再问一下，有什么不在本机安装某一些软件的情况下，远程局域网内的ubuntu（例如我在上机课的时候远程我学校宿舍的ubuntu电脑），谢谢

k-means MapReduce 聚类

Vincent.zZ | 初学一级 | 园豆：88
提问于：2013-07-10 18:03

< >

所有回答(1)

现在这东西相当之热门啊，有前途。飘过.....

kylin.chen | 园豆：983 (小虾三级) | 2013-07-10 18:26

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。