首页 新闻 会员 周边 捐助

大数据下的查询sql优化问题

0
悬赏园豆:100 [待解决问题]

sql语句如下:
SELECT
title,
sum(pv) pv,
count(distinct user_id) uv
FROM
table_name
WHERE
day_id >= '20211101'
and day_id <= '20211127'
group by
title
limit 1000

目前使用clickhouse数据库,库中数据已经最大可能的去重预处理后,日增1.5亿多条;每次查询40s多,该如何优化?

super_龙的主页 super_龙 | 初学一级 | 园豆:102
提问于:2021-11-27 16:21
< >
分享
所有回答(2)
0

试试 day_id 字段加索引,索引包含titlepvuser_id 字段

dudu | 园豆:29732 (高人七级) | 2021-11-27 16:27
0

流处理 是否可以解决?
add(前端 后端 kafka spark)

快乐的欧阳天美1114 | 园豆:4008 (老鸟四级) | 2021-11-27 17:04

架构导致的问题 要通过 改进架构来解决

支持(0) 反对(0) 快乐的欧阳天美1114 | 园豆:4008 (老鸟四级) | 2021-11-27 17:46
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册