首页新闻找找看学习计划
当前位置: 博问标签 /大数据/未解决/ 已解决
0
回答数

20 Hive上删除Hdfs表的分区文件,查看表分区时,分区依旧存在问题

下面是我的操作步骤: [root@bigdata-poc-shtz-3 test]# hadoop fs -ls -R hdfs://bigdata:8020/user/hive/warehouse/
0
回答数

MapReduce找不到类

我将主类和mapper、reducer类都放在了一个包中,但是无论我用idea还是myeclipse导出jar包都会找不到类。这是为什么呢? Error: java.lang.RuntimeExcep
2
回答数

2b的系统需要大数据么?

2b的系统需要大数据么?是不是一般都是2c的大用户才需要大数据?
5
回答数

升学了我选大数据还是软件开发好

因为职高的时候自学过JavaEE相关的开发,做过分布式相关应用。对于Web网页方面也比较了解。能用原生的js/css/html和Bootstrap、jquery之类的框架编写网页。现在因为升学了,考了
0
回答数

微信关注"大数据帮帮",回复“视频”,免费领取徐老师50G大数据学习视频(百度网盘),后续大数据前沿视频不断更新中

微信关注"大数据帮帮",回复“视频”,免费领取徐老师50G大数据学习视频(百度网盘),后续大数据前沿视频不断更新中
2
回答数

rocketmq启动mqnamesrv的时候总报忽略输入并把输出追加到"nohup.out"异常

请教大佬们,以上是报错信息,帮忙看看哪里的问题呢? runserver.sh的内存设置参数是:Xms128m Xmx128m -Xmn128m runbroker.sh的内存设置参数是:Xms128m
1
回答数

20 大数据和机器学习算法

请问如何机器学习算法比如说SVM等如何运用到大数据中,是用在计算框架Spark,Mapreduce等中吗?还是运用在什么其他组件里?并且这些算法不是起预测作用吗?即使在大数据的计算框架中能发挥什么样的
0
回答数

30 park 分组后取id最大的记录的字段

dataframe 结构: | Id | UserID | GameLevel | RegisterTime | GameAge | VipLevel| 如题:, 按userid 分组, 取id 最大
1
回答数

80 实际问下各位公司中的spark集群有几台

问下各位所供职的公司中使用的spark集群有多少台?每天的日志量大约有多大,kafka布了有多少
0
回答数

ServiceStage中如何查看应用创建失败的原因?

在ServiceStage中应用创建完成后,状态显示为“未就绪”,表示应用创建失败,怎么回事?如何查找原因呢?
0
回答数

有人使用过华为云CSE的体验馆么?体验怎么样?

最近体验了一下华为云的CSE体验馆,还是基本满意的。有几点小建议: 体验馆这个形式的推出还是比较新颖的,用户体验直观,是不是考虑下普通用户也可以直接体验,不需要认证啥的。 体验馆的初级体验内容还是比较
3
回答数

关于大数据的数据去重问题

我需要对200多万条数据进行一个去重的操作,数据存放在mongodb中,之前存放的时候是通过url地址来判断采集的信息是否存在,但是现在发现有些信息它们内容一样,但是url相同。所以想请问一下,有没有
0
回答数

请问:grok自定义匹配规则,有先后顺序吗?

比如现在有一条apache日志 180.173.65.112 - - [22/Dec/2017:17:28:40 +0800] "GET /index.php/.../search?_dc=1...1
0
回答数

20 搭建的ambari集成开源的hadoop集群,现在连接不上oss

有人连接成功了吗,因为不是ali下的emapreduce连接oss,我在执行hive新建表想建在oss上面的时候,报错:(message:java.io.IOException: No FileSys
1
回答数

20 搭建hadoop正式环境,集群之间用内网ip还是用外网ip?

公司用的是阿里云服务器,用了内网ip互通的话,那公司本地这边好像就访问不了,有搭建经验的大牛吗,求解答,是怎么处理这个问题的?
4
回答数

30 关于项目中资源文件配置项过多的问题,有没有更好的办法,不失灵活性,资源文件又不显得很笨重?

如题,想咨询一下,有没有好的方法,避免配置项过多的问题 项目中主要的一个资源配置文件,配置项多达100+,有mysql配置(包括连接池的配置参数信息),大数据仓库配置,kafka配置(bootstra
2
回答数

5 .net技术如何玩AI和大数据?

如题,请教各位大佬。 一般AI和大数据貌似都和java有关,和.net无关。 求指点。谢谢
0
回答数

50 如何让NameNode忽略已经丢失的数据

当HDFS有数据丢失, NameNode重启后会自动进入安全模式, 使用命令可以强制退出安全模式, NameNode会报有数据丢失, 一直告警。 如何让NameNode忽略已经丢失的数据?
0
回答数

50 在实际的生产环境, Hadoop客户端是否需要从集群里面单独分出来?程序运行是在集群里面运行还是通过集群的客户端运行?

在实际的生产环境, Hadoop客户端是否需要从集群里面单独分出来?程序运行是在集群里面运行还是通过集群的客户端运行?
1
回答数

hadoop 不知道这几个版本有什么区别

hadoop 不知道这几个版本有什么区别?求大神
3
回答数

50 大数据:如何模拟2000万辆车并发发送数据

应该如何实现2000万辆车并发发送数据,数据内容可以包括车辆的经纬度位置,目前的车况数据等等;数据发送频率设置为每辆车每十秒发送一条数据。请问应该如何实现? 考虑使用spark或者storm? 如何实
1
回答数

200 最近看到网上有人用阿里云免费邀请码免费开通了服务器,我去阿里云官网上看了是有这个活动,30多种产品免费使用半年什么的,但是没找到免费码在那领,有知道朋友告诉一下吗,能分享一个给我更好,各位大神多谢多谢!

最近看到网上有人用阿里云免费邀请码免费开通了服务器,我去阿里云官网上看了是有这个活动,30多种产品免费使用半年什么的,但是没找到免费码在那领,有知道朋友告诉一下吗,能分享一个给我更好,各位大神多谢多谢