首页 新闻 会员 周边

【机器学习】如何提高正确率?

0
悬赏园豆:50 [已解决问题] 解决于 2020-08-19 12:43

有下面一些数据:
・机器的日志文件:已经经过人工筛选出出现故障时前1小时至后2小时内的日志文件。

步骤如下:
mecab进行分词
统计每个日志中各个词汇出现的次数,大于50次的话取出来
删除一些不重要的词汇(即使出现次数大于50次也删除)
强制取出一些重要词汇(即使出现次数小于50次也取出)
Doc2Vec进行向量化(以日志为单位)并生成模型,然后用SVM进行预测

经过以上步骤之后,用leave-one-out进行交叉验证
发现正确率只有50%~60%。
有什么其他方法可以提高正确率吗?希望大家可以畅所欲言!

芽衣的主页 芽衣 | 菜鸟二级 | 园豆:384
提问于:2019-10-26 09:22
< >
分享
最佳答案
0
  1. 删除少数偏离方差大的数?
  2. 通过正则化防止过拟合?
收获园豆:50
会长 | 专家六级 |园豆:12401 | 2019-10-28 10:13
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册