sql语句如下:
SELECT
title,
sum(pv) pv,
count(distinct user_id) uv
FROM
table_name
WHERE
day_id >= '20211101'
and day_id <= '20211127'
group by
title
limit 1000
目前使用clickhouse数据库,库中数据已经最大可能的去重预处理后,日增1.5亿多条;每次查询40s多,该如何优化?
试试 day_id
字段加索引,索引包含title
、pv
、user_id
字段
流处理 是否可以解决?
add(前端 后端 kafka spark)
架构导致的问题 要通过 改进架构来解决