MySql 的统计查询性能问题

悬赏园豆：100 [已解决问题] 解决于 2011-12-26 10:54

由于数据量非常大（单表：四五百万条数据），需要对这种类型的表进行统计查询，并插入到对应的Maxstatistics（里面是Id、Value、Time） MinStatistics 等表。
这个表的结构如下：CREATE TABLE `datarecord` (
`Id` smallint(6) NOT NULL,
`Time` datetime NOT NULL,
`Value` int(11) DEFAULT NULL,
`Quality` int(11) DEFAULT NULL,
PRIMARY KEY (`Id`,`Time`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
解释：这个datarecord 表中有1250个Id，每个Id都有将近3600条记录。而现在的工作就是通过
sql语句实现：统计出来每个Id的Value最大值，并且插入到MaxStatistics 。关键在统计Value最大值会耗费非常多的时间，需要将近5分钟的时间。再加上最小值平均值等的统计，就非常缓慢，以至于是不能够接受的。以下是小弟目前的查询插入语句，希望各位能给出些建议。谢谢。。。
insert into Maxstatistics(`Id`,`Value`,`Time` ) SELECT a.`Id`,a.`Value`,a.Time
FROM datarecord a,(SELECT Id ,max(`Value`) as valueb FROM datarecord GROUP BY Id) b where a.Id=b.Id and a.`Value`=b.valueb
关于MySql 性能补充：如果没有索引或者改变引擎的前提下，但是从400多万的数据表中查询count(*)或者是查询max(Value) 都是要3-4分钟。非常的慢。添加了索引（索引是datarecord中Id和Value的联合索引，也试过Value的索引）在查询count（*）与max（value）就很快了。都是1-2s解决的。不过对于刚才的语句好像没有什么显著的变化（好像说道GROUP BY 和索引有冲突，但是我也不知道怎样才能做到查询每个Id最大值）。希望大家能给出合理的建议，如果语句需要改善也请给些建议或者观点，非常感谢！！！十分渴望！！！
想问问大家遇到这种问题是如何对待的。还是说MySql单表到了几百万的级别就速度非常慢了吗？谢谢大家。

mysql 查询统计性能优化海量数据

泪花朵朵开 | 初学一级 | 园豆：110
提问于：2011-12-07 11:09

< >

最佳答案

ENGINE 改成 myisam 试试看，我记得innordb的count语句很慢。

收获园豆：100

暮夏 | 菜鸟二级 |园豆：391 | 2011-12-07 12:34

其他回答(1)

你试一下这条语句，不用group by查询最大值，是不是会快一点。我是在sqlserver下写的sql语句，你用mysql的时候如果语法不对你修改修改。

SELECT * FROM datarecord
WHERE
(SELECT COUNT(1) FROM  datarecord a  WHERE datarecord.Id  = a.Id   and datarecord.Value<a.Value) < 1

LCM | 园豆：6876 (大侠五级) | 2011-12-07 12:17

这个是执行的时间。还是挺长的。而且我这个还仅仅是250万条数据左右。看来MySql真不适合一个表这么多的数据，还是很感谢热心解答。。。

支持(0) 反对(0) 泪花朵朵开 | 园豆：110 (初学一级) | 2011-12-07 13:36

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。

MySql 的统计查询性能问题

欢迎，请先登录或者注册。