如何通过分组和自连接统计每月新增用户数?

2026-04-27 17:511阅读0评论SEO问题
  • 内容介绍
  • 相关推荐

本文共计935个文字,预计阅读时间需要4分钟。

如何通过分组和自连接统计每月新增用户数?

新增用户数本质是每个用户在全库中最早出现的月份,而不是简单按注册时间分组。如果直接使用以下代码:

正确做法是先算出每个用户的首次行为时间(比如第一次登录、第一次下单、第一次注册),再按该时间归月统计。假设用户表为 users,注册时间为 created_at

SELECT DATE_FORMAT(MIN(created_at), '%Y-%m') AS month, COUNT(*) AS new_users FROM users GROUP BY user_id

但这只是中间结果,还需再套一层统计每月人数。更直接的写法是:

SELECT DATE_FORMAT(first_seen, '%Y-%m') AS month, COUNT(*) AS new_users FROM ( SELECT user_id, MIN(created_at) AS first_seen FROM users GROUP BY user_id ) t GROUP BY DATE_FORMAT(first_seen, '%Y-%m') ORDER BY month;

为什么不能用自连接来算新增用户

自连接(比如 users u1 LEFT JOIN users u2 ON u1.user_id = u2.user_id AND u1.created_at > u2.created_at)理论上能找出“不存在更早记录”的用户,但实际极不推荐——它会产生大量冗余笛卡尔积,数据量稍大(比如 10 万用户)就会卡死或 OOM。

常见错误现象:Query execution was interrupted, max_execution_time exceeded 或 MySQL 直接拒绝执行。

阅读全文

本文共计935个文字,预计阅读时间需要4分钟。

如何通过分组和自连接统计每月新增用户数?

新增用户数本质是每个用户在全库中最早出现的月份,而不是简单按注册时间分组。如果直接使用以下代码:

正确做法是先算出每个用户的首次行为时间(比如第一次登录、第一次下单、第一次注册),再按该时间归月统计。假设用户表为 users,注册时间为 created_at

SELECT DATE_FORMAT(MIN(created_at), '%Y-%m') AS month, COUNT(*) AS new_users FROM users GROUP BY user_id

但这只是中间结果,还需再套一层统计每月人数。更直接的写法是:

SELECT DATE_FORMAT(first_seen, '%Y-%m') AS month, COUNT(*) AS new_users FROM ( SELECT user_id, MIN(created_at) AS first_seen FROM users GROUP BY user_id ) t GROUP BY DATE_FORMAT(first_seen, '%Y-%m') ORDER BY month;

为什么不能用自连接来算新增用户

自连接(比如 users u1 LEFT JOIN users u2 ON u1.user_id = u2.user_id AND u1.created_at > u2.created_at)理论上能找出“不存在更早记录”的用户,但实际极不推荐——它会产生大量冗余笛卡尔积,数据量稍大(比如 10 万用户)就会卡死或 OOM。

常见错误现象:Query execution was interrupted, max_execution_time exceeded 或 MySQL 直接拒绝执行。

阅读全文