大数据下的查询sql优化问题

悬赏园豆：100 [待解决问题]

sql语句如下：
SELECT
title,
sum(pv) pv,
count(distinct user_id) uv
FROM
table_name
WHERE
day_id >= '20211101'
and day_id <= '20211127'
group by
title
limit 1000

目前使用clickhouse数据库，库中数据已经最大可能的去重预处理后，日增1.5亿多条；每次查询40s多，该如何优化？

sql优化

super_龙 | 初学一级 | 园豆：102
提问于：2021-11-27 16:21

< >

所有回答(2)

试试 day_id 字段加索引，索引包含title、pv、user_id 字段

dudu | 园豆：23787 (高人七级) | 2021-11-27 16:27

流处理是否可以解决？
add（前端后端 kafka spark）

快乐的欧阳天美1114 | 园豆：4100 (老鸟四级) | 2021-11-27 17:04

架构导致的问题要通过改进架构来解决

支持(0) 反对(0) 快乐的欧阳天美1114 | 园豆：4100 (老鸟四级) | 2021-11-27 17:46

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。

大数据下的查询sql优化问题

欢迎，请先登录或者注册。