首页新闻找找看学习计划
当前位置: 博问标签 /数据挖掘/未解决/ 已解决
0
回答数

中文分词的语料库中的词是如何的生成的?

我有多篇关于汽车类的文章,文章中多次提到"本田雅阁"关键词,再语料库中没有该词语的情况下分词,会被切分成"本田" / "雅阁",怎么在不使用人工添加情况下,把"本田雅阁"提取出来,存入语料库,为以后的
0
回答数

问卷调查的数据,该如何处理清洗

手头一份问卷调查报告,需要对其清洗数据并建模,以便日后预测。 数据中含有不少字符串格式的字段,需要将其转换成数值格式。但是由于是问卷调查,答案五花八门,即使将手头数据的字符转换成了数值,也无法保证将来
0
回答数

折腾半天出来的模型过拟合了,但是精度还是挺高的。。可以采纳这种模型么?

这个分类模型,是搞了好久,最终用过采样的方法,训练出来了。准确度相对已经是最高的情况了。。 但是仍旧存在过拟合问题。。想请问下,这样的情况下,模型还能否采纳?
0
回答数

如何判断模型数据中有无隐变量

李航老师的统计学习方法中的EM算法提到了隐变量的概念,我看得有些迷糊: 如何判断数据中有无隐变量? 现实生活中,比如要研究空气污染的模型,那数据采集下来,怎么能做到不包含隐变量?如果无法保证的话,那不
1
回答数

关于神经网络模型的疑问

神经网络模型,因为其随机性,每次训练出来的结果中准确度不太一样。想请问下: 每次训练的准确度会相差很多么? 我自己试过几次,貌似不会很大。但是个人经验不足,不敢确认; 假使准确度相差较大,而当前的模型
2
回答数

如何理解核函数?

看了半天核函数的解释,一直还是没法理解核函数的意义。 从李航老师的统计学习方法书中的描述: 核技巧的想法是,在学习与预测中只定义核函数K(x, z),而不显式地定义映射函数Φ。通常,直接计算K(x,
3
回答数

80 基于web的数据挖掘系统

正在准备毕设,题目就是 基于web的数据库挖掘系统,谁能简单分析一下系统的需求么。。简单的就好。本人菜鸟。。。求指导
0
回答数

grapglab和pandas的异同

graphlab和pandas有什么异同?请赐教~
2
回答数

求推荐数据挖掘的书籍

想学习数据挖掘,求大神推荐一本书啊,中文的最好
6
回答数

10 如何获取网页搜索框下拉提示关键词?

各大网站,都有这样的搜索功能,比如搜索 机器人 ,在还没有回车或点击搜索按钮之前, 搜索框下面,会显示相关联的搜索词语,供用户参考, 我知道这个功能是怎么做的,我想问的是: 怎么样获取别人网站这样的数
8
回答数

200 数据挖掘如何去学习?

本人2年开发经验,想往数据挖掘方面发展。有谁可以推荐的书籍和视频啊。必有重赏!
1
回答数

50 求教C4.5算法如何实现?

想在自己的程序里运用C4.5算法,看了一下算法的原理,但还是有些地方不明了,另外看了下weka里关于C4.5的源码好像很长的样子,太难懂了,求教高手们是如何实现的?希望能有代码能学习下,拜谢~
0
回答数

5 数据分析算法

求大神介绍一些数据分析中的一些算法 想对数据进行一下分析,不知从哪开始,请大神出来指点一下,不胜感激。
2
回答数

5 数据挖掘 数据可视化

内容详情请点击问题查看!
1
回答数

5 sql server 2008 数据挖掘

内容详情请点击问题查看!
1
回答数

15 电商类似商品推荐功能如何实现

类似的还有歌曲推荐、书籍推荐、新闻推荐等。我现在想到的做法是:给每种产品添加若干关键字,如果用户感兴趣的A书关联的关键字和B书关联的关键字有大量交集,那么系统就把B书也推荐给用户。 其次,关键字手动维
1
回答数

【求教】数据规范化中,使用最小-最大规范化和z分数规范化的区别

请问各位前辈,在数据预处理中,可以使用1 最小-最大规范化(vi-min)/(max-min)来进行规范,或者采用:2 Z分数进行规范(vi-mean)/v的标准差请问这两种数据规范化各自的优缺点是什
1
回答数

10 求一个apriori算法mapreduce

内容详情请点击问题查看!
2
回答数

20 程序员转数据挖掘相关的工作的问题

开发过网络,windows phone,iphone。用过的编程语言为C#,object - c,最近有个数据挖掘的工作机会。要不要转,有相关经验的吗?主要从工资上说,还有以后的发展。
3
回答数

10 对数据挖掘,研究生的困惑

内容详情请点击问题查看!
1
回答数

10 关于SSIS的问题

问题是这样的: 从ERP 取出供应商信息,每日把更新的供应商的信息导出到CSV 文件内。 我的思路是这样的,定义一个供应商导出表,每次取出ERP 的全部供应商的信息。 定义一个导出历史表B,记录导出的
5
回答数

100 数据库相关问题100分

假设有十个数据源,分布在十台不同物理位置的主机上,有的是sqlserver 有的是oracle 可能还有mssql 每个数据库的表数目和表里的字段更是大不同,如果需要把这十个数据源 用光纤连到一个路由
4
回答数

100 关于 数据匹配的问题 真心求教

内容详情请点击问题查看!
0
回答数

10 提取数据库中的相关数据是不是和数据挖掘有关?

现在数据库有大量数据 需要在显示某条记录时连带显示与此记录相关的记录,这个是用tag的方式还是有什么算法可用?