表递增ID做数据迁移，查询效率问题。

悬赏园豆：10 [待解决问题]

数据表描述：一张生产表，数据量在 150W条数据，但是ID 递增已经到了 3000W了，因为中间一致被人DELETE 数据，但是ID一致在递增。现在就形成了 ID 1-50000是没有的， 50000-100000是在表里面的，后面也是这种断断续续的存在和不存在，但是数据递增还是3000W往后。
问题描述：查询效率特别低下，做数据迁移，已经将150W条数据压缩到 10W条数据，但是效率还是低下，CPU使用率特别高。多个子系统使用 SELECT * FROM TABLE 语句。
结果猜测：SELECT *FROM 这种查询默认表里面还是 3000W+ 数据并不是实际 10W条数据，有没有什么好的方案对这种生产库的表做数据迁移？

数据库

KainJC | 初学一级 | 园豆：60
提问于：2021-02-22 12:26

< >

所有回答(5)

解决现有数据方法：把表数据全盘导出本地，移除ID列。重新insert生成一遍（要保证该ID号没有被其他表所关联。否则这么整就乱套了）；

解决后续新插入数据：改逻辑。弃用自增，新建列、使用自定义生成序列号。记得加索引

同期待他人更好的方案

Ctrl` | 园豆：3317 (老鸟四级) | 2021-02-22 14:28

整个库都是这种方式，ID都是其他表的外键

支持(0) 反对(0) KainJC | 园豆：60 (初学一级) | 2021-05-11 16:07

不要select * from
建索引啥的
把这个表数据备份的其他表中，然后做个映射以保存老数据？
表分区啥的
id不要数字
我不是干数据库的，但是我见大佬这么做过

echo_lovely | 园豆：1695 (小虾三级) | 2021-02-22 15:48

老项目我已经没办法重新了

支持(0) 反对(0) KainJC | 园豆：60 (初学一级) | 2021-05-11 16:08

如果你的ID是主键，就算中间缺了是不会影响查询效率的，最多影响的是插入的时候，需要重建B树，有点影响，
稳定以后，根本不会对查询效率有影响

不知道风往哪儿吹 | 园豆：2039 (老鸟四级) | 2021-02-23 10:34

顶，主键是默认自增ID，从B+树考虑不会影响查询效率。数据压缩到了10W，数据量已经很小了。可以考虑一楼做法，导入导出重建索引。也可以考虑是否因为数据的删除和插入过多导致数据页碎片过多，采用optimize table的方式优化下。
其他优化：索引做太多，并且写操作也不少，导致二级索引来回重建也会影响读取速度。
代码层面：除了select * 是否查询过程中有用limit offset做分页。可以子查询主键再做分页等

支持(0) 反对(0) gege4105 | 园豆：200 (初学一级) | 2021-04-05 09:44

@khal_Cgg: 长知识了

支持(0) 反对(0) 吾言！ | 园豆：208 (菜鸟二级) | 2021-04-20 18:40

'不知道风往哪儿吹' post looks correct. You may need to build index against to the table.
What database are you having issues?

blogger2020 | 园豆：257 (菜鸟二级) | 2021-03-03 11:46

重建id序列的话不需要导入导出，先把所有所有id 都减50000 ，update set id = id-50000;
然后重新设置自增起始 alert 表明 set auto_increment=1

自足孤独者 | 园豆：208 (菜鸟二级) | 2021-04-29 16:39

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。