首页 新闻 会员 周边 捐助

MySql 的统计查询性能问题

0
悬赏园豆:100 [已解决问题] 解决于 2011-12-26 10:54

由于数据量非常大(单表:四五百万条数据),需要对这种类型的表进行统计查询,并插入到对应的Maxstatistics(里面是Id、Value、Time) MinStatistics 等表。
这个表的结构如下:CREATE TABLE `datarecord` (
  `Id` smallint(6) NOT NULL,
  `Time` datetime NOT NULL,
  `Value` int(11) DEFAULT NULL,
  `Quality` int(11) DEFAULT NULL,
  PRIMARY KEY (`Id`,`Time`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 
解释:这个datarecord 表中有1250个Id,每个Id都有将近3600条记录。而现在的工作就是通过
sql语句实现:统计出来每个Id的Value最大值,并且插入到MaxStatistics 。关键在统计Value最大值会耗费非常多的时间,需要将近5分钟的时间。再加上最小值平均值等的统计,就非常缓慢,以至于是不能够接受的。以下是小弟目前的查询插入语句,希望各位能给出些建议。谢谢。。。
insert into Maxstatistics(`Id`,`Value`,`Time` ) SELECT a.`Id`,a.`Value`,a.Time
FROM datarecord  a,(SELECT Id ,max(`Value`) as valueb FROM datarecord GROUP BY Id) b where a.Id=b.Id and a.`Value`=b.valueb    
关于MySql 性能补充:如果没有索引或者改变引擎的前提下,但是从400多万的数据表中查询count(*)或者是查询max(Value) 都是要3-4分钟。非常的慢。添加了索引(索引是datarecord中Id和Value的联合索引,也试过Value的索引)在查询count(*) 与max(value)就很快了。都是1-2s解决的。不过对于刚才的语句好像没有什么显著的变化(好像说道GROUP BY 和索引有冲突,但是我也不知道怎样才能做到查询每个Id最大值)。希望大家能给出合理的建议,如果语句需要改善也请给些建议或者观点,非常感谢!!!十分渴望!!!
想问问大家遇到这种问题是如何对待的。还是说MySql单表到了几百万的级别就速度非常慢了吗?谢谢大家。

泪花朵朵开的主页 泪花朵朵开 | 初学一级 | 园豆:110
提问于:2011-12-07 11:09
< >
分享
最佳答案
1

ENGINE 改成 myisam 试试看,我记得innordb的count语句很慢。

收获园豆:100
暮夏 | 菜鸟二级 |园豆:391 | 2011-12-07 12:34
其他回答(1)
0

你试一下这条语句,不用group by查询最大值,是不是会快一点。我是在sqlserver下写的sql语句,你用mysql的时候如果语法不对你修改修改。

SELECT * FROM datarecord
WHERE
(SELECT COUNT(1) FROM datarecord a WHERE datarecord.Id = a.Id and datarecord.Value<a.Value) < 1
LCM | 园豆:6876 (大侠五级) | 2011-12-07 12:17

这个是执行的时间。还是挺长的。而且我这个还仅仅是250万条数据左右。看来MySql真不适合一个表这么多的数据,还是很感谢热心解答。。。

支持(0) 反对(0) 泪花朵朵开 | 园豆:110 (初学一级) | 2011-12-07 13:36
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册