“通过对社交网络内医疗健康知识的搜集、加工处理、分析,完成城构建互联网医疗健康知识库”
这是问题,没接触过数据挖掘,所以也没个概念,这该如何着手,是将一定量的网址前提下,将有用的内容筛选出来?貌似python爬虫在这方面有一定的优势。
望能人指点。
python做爬虫和分析都很有优势的
数据挖掘就是按照不同的维度放数据
一句话...能具体点吗,我要的是解决上面那个问题
@玛丽的竹子: 最典型的就是 总计 和明细 这就是典型的2个维度
总计 就是一条数据
而明细要做多条
而维度就是为了满足不同的需求 按照不同的维度存放数据
达到满足特定需求的效果
细节点就是 如果你只想知道 总计的话存一条就好了
但是这样有弊端就是 不知道这个记录的来源经过
而记录明细的弊端 就是想查到所有的数据 会很慢
还是得自己多看书,慢慢摸索吧