首页新闻找找看学习计划
当前位置: 博问标签 /机器学习/未解决/ 已解决
0
回答数

如何正确地对模型进行调参

机器学习的模型,要涉及到不少参数的调参。。那其正确的步骤应该是怎样的呢? 第一种做法是,对一个个或一组组参数去调,其他参数使用默认值。。调出一个或一组参数后,记录下来。下一次继续调另外一个或一组参数。
1
回答数

数据建模中的空值问题

数据建模,存在空值。。。而且这个空值还不能随便填充。。因为的确可能存在空值的情况。。。貌似sklearn的库中,都无法接受数据存在空值的情况,那要如何进行建模呢。。
2
回答数

从零学python和机器学习 请大佬们指条路

今年考上的研究生,导师要求在开学前搞懂cnn学习,感觉一脸懵逼请大佬们指条路 注:大学没学过python,有一年.NET开发经验
1
回答数

100 python +=与=+

import numpy as np import pandas as pd import requests def getdata(url): content=requests.get(url).c
2
回答数

20 【python】机器学习,如何尽量合理创建学习数据?

我现在有一组数据,但是数据的量太少了,想尽量合理地增加一些数据。 数据内容 结果 NUM1 A B C A A B D E F label1 上面的数据中有重复的内容(比如3个A),我想是否可以把其中
0
回答数

中文分词的语料库中的词是如何的生成的?

我有多篇关于汽车类的文章,文章中多次提到"本田雅阁"关键词,再语料库中没有该词语的情况下分词,会被切分成"本田" / "雅阁",怎么在不使用人工添加情况下,把"本田雅阁"提取出来,存入语料库,为以后的
0
回答数

问卷调查的数据,该如何处理清洗

手头一份问卷调查报告,需要对其清洗数据并建模,以便日后预测。 数据中含有不少字符串格式的字段,需要将其转换成数值格式。但是由于是问卷调查,答案五花八门,即使将手头数据的字符转换成了数值,也无法保证将来
0
回答数

折腾半天出来的模型过拟合了,但是精度还是挺高的。。可以采纳这种模型么?

这个分类模型,是搞了好久,最终用过采样的方法,训练出来了。准确度相对已经是最高的情况了。。 但是仍旧存在过拟合问题。。想请问下,这样的情况下,模型还能否采纳?
1
回答数

80 关于Sklearn中的数据标准化处理疑问

我用sklearn中的preprocessing.StandardScaler, 及自己编写计算公式,同时对数据进行标准处理,发现两种方法出来的结果有些不太一样。。 请问下,这个是为什么?
0
回答数

网格搜索,得出最优参数后的训练模型,是采用训练数据集,还是直接用的数据全集?

关于网格搜索,还是有些不太明白的地方: 网格搜索GridSearchCV中,其实已经包含了交叉验证了(cv默认值是10)。那通过网格搜索得到最优参数后,正式训练模型时,是使用训练数据集(用原始数据集切
0
回答数

分类模型预测的类别如何进行识别

我的模型数据中,原始目标变量设置了类别,分别是3,4,5(原来的标准是1-6,但是数据实际分类出来只符合了3,4,5三种类别,其他类别没有数据匹配到); 而模型预测出来的类别却自动命名为0,1,2。
0
回答数

网格搜索时,模型是否需要先fit下?

有点迷糊了。。网格搜索前,模型是否需要fit下呢? 也就是下面代码对不对? params_1 = {'max_features':range(3,11,2)} rf1 = RandomForestCl
2
回答数

李航老师的统计学习方法中的凸优化问题

统计学习方法第215页最后一句话: 支持向量机学习、逻辑斯蒂回归与最大熵模型学习、条件随机场学习是凸优化问题,全局最优解保证存在。而其他学习问题则不是凸优化问题。 这句话有些不理解。。意思是其他学习问
0
回答数

模型训练时,如何纳入时间变量?

手头有一批数据,其中大部分是连续型数值变量,部分是分类型变量,还有一个时间记录。 模型的目的是分析一种水质污染情况,用于监控污染物的排放,并提出针对性的方案。(主要是多家企业的排放,气象数据,水温等数
1
回答数

100 关于模型训练的几个疑问

模型训练前,需要确定损失函数,及是否需要正则化。这个一般情况下,是根据经验或是根据数据的实际情况来确定么? 又或者是根据所选择的模型来选择? 确定好策略后,模型训练结束的标准就是经验风险或结构风险是否
0
回答数

如何判断模型数据中有无隐变量

李航老师的统计学习方法中的EM算法提到了隐变量的概念,我看得有些迷糊: 如何判断数据中有无隐变量? 现实生活中,比如要研究空气污染的模型,那数据采集下来,怎么能做到不包含隐变量?如果无法保证的话,那不
1
回答数

关于神经网络模型的疑问

神经网络模型,因为其随机性,每次训练出来的结果中准确度不太一样。想请问下: 每次训练的准确度会相差很多么? 我自己试过几次,貌似不会很大。但是个人经验不足,不敢确认; 假使准确度相差较大,而当前的模型
2
回答数

如何理解核函数?

看了半天核函数的解释,一直还是没法理解核函数的意义。 从李航老师的统计学习方法书中的描述: 核技巧的想法是,在学习与预测中只定义核函数K(x, z),而不显式地定义映射函数Φ。通常,直接计算K(x,
1
回答数

50 不用梯度下降法如何计算逻辑回归模型的参数?谢谢

如题,线性回归有正规方程。逻辑回归我查了很多中文网站,只介绍了梯度下降,有没有不用梯度下降法的算法呢?谢谢。
0
回答数

100 用hyperopt自动调参出现错误,求大神帮忙解决

#! _*_coding: utf-8 _*_import pandas as pdfrom xgboost.sklearn import XGBClassifier as xgbfrom hyper
1
回答数

100 用hyperopt自动调参出现错误,求大神帮忙解决

#! _*_coding: utf-8 _*_import pandas as pdfrom xgboost.sklearn import XGBClassifier as xgbfrom hyper
0
回答数

50 西瓜书中AUC的计算公式是如何得到的,谢谢(高人误入,以免不快)

如图西瓜书:http://images.cnblogs.com/cnblogs_com/zzy0471/509085/o_%e5%ae%b9%e6%98%93%e7%9c%8b%e5%87%ba.jp
1
回答数

30 行为识别,iDT算法Fishervector编码(DTFV)的后续工作遇到了疑问

刚接触行为识别,遇到疑问,请教各位大神,我参考这两个链接做实验复现:https://lear.inrialpes.fr/people/wang/improved_trajectorieshttps:/
2
回答数

50 如何在WPF中使用python代码

因为numpy的底层使用c写的,所以IronPython引用失败,import numpy时会引发异常网上的解决方法有两种1. 使用enthought编写的c#版的numpy教程如下:[url=htt
0
回答数

30 线性回归 c语言实现

链接:http://pan.baidu.com/s/1gf9VNJt 密码:dfvp