首页 新闻 会员 周边

关于数据挖掘

0
悬赏园豆:20 [已解决问题] 解决于 2016-05-02 00:08

“通过对社交网络内医疗健康知识的搜集、加工处理、分析,完成城构建互联网医疗健康知识库”

这是问题,没接触过数据挖掘,所以也没个概念,这该如何着手,是将一定量的网址前提下,将有用的内容筛选出来?貌似python爬虫在这方面有一定的优势。

  望能人指点。

大兄弟竹子的主页 大兄弟竹子 | 初学一级 | 园豆:55
提问于:2016-04-23 22:09
< >
分享
最佳答案
0

python做爬虫和分析都很有优势的

收获园豆:20
刘宏玺 | 专家六级 |园豆:14020 | 2016-04-23 23:58
其他回答(2)
0

数据挖掘就是按照不同的维度放数据

小眼睛老鼠 | 园豆:2731 (老鸟四级) | 2016-04-23 22:22

一句话...能具体点吗,我要的是解决上面那个问题

支持(0) 反对(0) 大兄弟竹子 | 园豆:55 (初学一级) | 2016-04-23 22:23

@玛丽的竹子: 最典型的就是 总计 和明细 这就是典型的2个维度 

总计 就是一条数据

而明细要做多条 

而维度就是为了满足不同的需求 按照不同的维度存放数据 

达到满足特定需求的效果 

细节点就是 如果你只想知道 总计的话存一条就好了

但是这样有弊端就是 不知道这个记录的来源经过

而记录明细的弊端 就是想查到所有的数据 会很慢

支持(0) 反对(0) 小眼睛老鼠 | 园豆:2731 (老鸟四级) | 2016-04-23 22:24
0

还是得自己多看书,慢慢摸索吧

大兄弟竹子 | 园豆:55 (初学一级) | 2016-05-02 00:07
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册