首页新闻找找看学习计划
当前位置: 博问标签 /大数据/未解决/ 已解决
3
回答数

50 大数据:如何模拟2000万辆车并发发送数据

应该如何实现2000万辆车并发发送数据,数据内容可以包括车辆的经纬度位置,目前的车况数据等等;数据发送频率设置为每辆车每十秒发送一条数据。请问应该如何实现? 考虑使用spark或者storm? 如何实
1
回答数

200 最近看到网上有人用阿里云免费邀请码免费开通了服务器,我去阿里云官网上看了是有这个活动,30多种产品免费使用半年什么的,但是没找到免费码在那领,有知道朋友告诉一下吗,能分享一个给我更好,各位大神多谢多谢!

最近看到网上有人用阿里云免费邀请码免费开通了服务器,我去阿里云官网上看了是有这个活动,30多种产品免费使用半年什么的,但是没找到免费码在那领,有知道朋友告诉一下吗,能分享一个给我更好,各位大神多谢多谢
2
回答数

50 重新构架项目用什么框架好?

公司做的是招聘类的项目,前期是外包公司做的,所以代码比较乱,项目拿回公司之后,我们加了好多功能都是修修改改。 最近公司准备用H5开发移动端,我们商量把项目重新构架,请问一下大家,用什么框架好?(现准备
2
回答数

10 部署Ambari执行到Confirm Host的步骤,一直过不去,大家有遇到的吗?

ubnutu 16.04 http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.0.0/ambari.list 终端
2
回答数

30 Hbase分布式存储系统?

我最近在初识hadoop,有很多文章中把Hbase写为分布式存储系统。我不是很理解,像以往的关系型数据库,RDBMS,叫做数据库管系统,我觉得Habase也应该是一个管理系统,而不是一个存储系统,大家
1
回答数

10 hadoop 2.6.0中配置sqoop 1.99.6-hadoop200时使用show version --all报错

平台配置: 系统:Ubuntu 12.04 LTS hadoop 2.6.0, sqoop1.99.6-hadoop200, hive-1.1.1, mysql 5.5.48, mysql-conne
4
回答数

50 ODP.NET Oracle大数据导入时,30万数据导入正常,60万数据(excel文件15M)导入报内存不够,求指导,谢谢

30万数据导入正常,60万数据(Excel文件是15M)导入就会出现这个问题,不知道是开发机的内存不够,还是Oracle数据库所在的服务器不够内存;求指导,谢谢。
4
回答数

5 想转型去做产品经理或者大数据方向, 来分析下.

已经工作 5 年, ,你要问我精通什么技术? 其实都不精通 …. 上头说 “这个需要用到这个技术, 你去学下”, 过段时间又说 “这个要用到那个技术, 你再去学下”, 几年下来什么都会点, 什么都不精
6
回答数

200 大数据设计求助

目前在公司接手了一个事情,负责我们GUI客户端程序的用户信息采集,其中需要包括客户的硬软件环境,客户在什么时间使用我们的工具做了什么事情,我知道这是一个繁琐的事情,目前处于盲目的阶段,不知道如何下手,
3
回答数

5 我见到的高级软件工程师面试题,敬请各位高人给出更好的详细完整的意见,谢谢!

问一:ASP.NET如何接收海量数据并持久化到数据库中? 我的回答:接收大数据采用队列或分布缓存,大数据批量持久化则用SqlBulkCopy; 问二:如何查看服务器带宽使用情况,且如何判断带宽被占满?
1
回答数

100 关于kettle工具的 mongo output组件中mongo document path设置问题

现在我需要把oracle的数据迁移到mongoDB 假设oracle数据库中有下列三张表: <!-- 各表关系如下: --> Parent: BL_INFO --Child: BL_RTE(是BL_I
2
回答数

50 求单表5亿数据维护方案和建议

目前需求:单表5亿数据OLTP,不会跟其他表有关联,对其进行增删改查,数据备份,检索条件不固定,除了表分区之外,有什么好的建议,大家可以讨论一下。
5
回答数

5 asp.net 最高1亿多数据(单表),多条件混合即时查询,性能优化方案

asp.net 最高1亿多数据(单表),多条件混合查询,有时间和分类需要条件,还有N个非必须条件。表结构已经水平垂直分割了,还有存在单表最高达到了1亿左右数据量。 我目前想到的可能方案: 1.企业级搜
6
回答数

50 使用EF 5 单表数据大于500W,这个时候查询就会变得很慢。想要做分表,但是不知道EF该怎么分。

项目使用的时间长了,数据量就慢慢上来了,就会导致查询越来越慢,这个时候以前用ADO.net的时候,基本都是用的 分表的操作来控制查询效率的。 例如,财务流水账数据,一个月分一张表,或者一年分一张表。
4
回答数

15 关于2000万数据建lucene.net索引的问题

从网上搞了一个2000万的数据库,总算有 这么多的数据可以拿来练手了。 结果使用lucene.net+盘古分词,没过多久IIS就超时了。 我的思路 方法如下。 int page = 1; string
4
回答数

50 c# 如何操作写入巨型xml文件,大概有1GB的样子,写入操作很频繁,一定要使用xml。

c# 如何操作写入巨型xml文件,大概有1GB的样子,写入操作很频繁,一定要使用xml。 如何能不一次性把整个文件加载进去,而是加载一个指针类的东西,部分写入。
3
回答数

50 http请求过来的数据较大怎么高效读取

开发一个第三方充值接口,我请求一个接口,第三方返回全部的商品信息(由于该接口只能30分钟请求一次,我想把所有的数据放到缓存中),商品信息是xml格式的。但由于返回的数据量太大,大概有10000条左右,
1
回答数

10 什么是结构化数据 半结构化数据 非结构化数据

很多时候说到数据库存储都会说结构化数据 半结构化数据 非结构化数据 那么这三种数据有什么区别呢? 哪些数据库支持这些数据类型? 有哪些数据属于上面的三种数据类型?