关于数据挖掘

悬赏园豆：20 [已解决问题] 解决于 2016-05-02 00:08

“通过对社交网络内医疗健康知识的搜集、加工处理、分析，完成城构建互联网医疗健康知识库”

这是问题，没接触过数据挖掘，所以也没个概念，这该如何着手，是将一定量的网址前提下，将有用的内容筛选出来？貌似python爬虫在这方面有一定的优势。

　　望能人指点。

大兄弟竹子 | 初学一级 | 园豆：55
提问于：2016-04-23 22:09

< >

最佳答案

python做爬虫和分析都很有优势的

收获园豆：20

刘宏玺 | 专家六级 |园豆：14020 | 2016-04-23 23:58

其他回答(2)

数据挖掘就是按照不同的维度放数据

小眼睛老鼠 | 园豆：2731 (老鸟四级) | 2016-04-23 22:22

一句话...能具体点吗，我要的是解决上面那个问题

支持(0) 反对(0) 大兄弟竹子 | 园豆：55 (初学一级) | 2016-04-23 22:23

@玛丽的竹子: 最典型的就是总计和明细这就是典型的2个维度

总计就是一条数据

而明细要做多条

而维度就是为了满足不同的需求按照不同的维度存放数据

达到满足特定需求的效果

细节点就是如果你只想知道总计的话存一条就好了

但是这样有弊端就是不知道这个记录的来源经过

而记录明细的弊端就是想查到所有的数据会很慢

支持(0) 反对(0) 小眼睛老鼠 | 园豆：2731 (老鸟四级) | 2016-04-23 22:24

还是得自己多看书，慢慢摸索吧

大兄弟竹子 | 园豆：55 (初学一级) | 2016-05-02 00:07

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。