如何通过分组和自连接统计每月新增用户数?
- 内容介绍
- 相关推荐
本文共计935个文字,预计阅读时间需要4分钟。
新增用户数本质是每个用户在全库中最早出现的月份,而不是简单按注册时间分组。如果直接使用以下代码:
正确做法是先算出每个用户的首次行为时间(比如第一次登录、第一次下单、第一次注册),再按该时间归月统计。假设用户表为 users,注册时间为 created_at:
SELECT DATE_FORMAT(MIN(created_at), '%Y-%m') AS month, COUNT(*) AS new_users FROM users GROUP BY user_id
但这只是中间结果,还需再套一层统计每月人数。更直接的写法是:
SELECT DATE_FORMAT(first_seen, '%Y-%m') AS month, COUNT(*) AS new_users FROM ( SELECT user_id, MIN(created_at) AS first_seen FROM users GROUP BY user_id ) t GROUP BY DATE_FORMAT(first_seen, '%Y-%m') ORDER BY month;
为什么不能用自连接来算新增用户
自连接(比如 users u1 LEFT JOIN users u2 ON u1.user_id = u2.user_id AND u1.created_at > u2.created_at)理论上能找出“不存在更早记录”的用户,但实际极不推荐——它会产生大量冗余笛卡尔积,数据量稍大(比如 10 万用户)就会卡死或 OOM。
常见错误现象:Query execution was interrupted, max_execution_time exceeded 或 MySQL 直接拒绝执行。
本文共计935个文字,预计阅读时间需要4分钟。
新增用户数本质是每个用户在全库中最早出现的月份,而不是简单按注册时间分组。如果直接使用以下代码:
正确做法是先算出每个用户的首次行为时间(比如第一次登录、第一次下单、第一次注册),再按该时间归月统计。假设用户表为 users,注册时间为 created_at:
SELECT DATE_FORMAT(MIN(created_at), '%Y-%m') AS month, COUNT(*) AS new_users FROM users GROUP BY user_id
但这只是中间结果,还需再套一层统计每月人数。更直接的写法是:
SELECT DATE_FORMAT(first_seen, '%Y-%m') AS month, COUNT(*) AS new_users FROM ( SELECT user_id, MIN(created_at) AS first_seen FROM users GROUP BY user_id ) t GROUP BY DATE_FORMAT(first_seen, '%Y-%m') ORDER BY month;
为什么不能用自连接来算新增用户
自连接(比如 users u1 LEFT JOIN users u2 ON u1.user_id = u2.user_id AND u1.created_at > u2.created_at)理论上能找出“不存在更早记录”的用户,但实际极不推荐——它会产生大量冗余笛卡尔积,数据量稍大(比如 10 万用户)就会卡死或 OOM。
常见错误现象:Query execution was interrupted, max_execution_time exceeded 或 MySQL 直接拒绝执行。

