如何给数据框中每个组内的行赋予独特编号,形成长尾关键词?
- 内容介绍
- 文章标签
- 相关推荐
本文共计144个文字,预计阅读时间需要1分钟。
使用ave函数或ddply/data.table或plyr的ddply方法,或dplyr的group_by和row_number函数,可以对数据进行分组并添加一个唯一标识符(id)。例如,使用dplyr可以这样写:
Rlibrary(dplyr)df %>% group_by(cat) %>% mutate(id=row_number())
使用ave,或: ddply_dplyr``data.table
df$num <- ave(df$val, df$cat, FUN = seq_along)
或者:
library(plyr)ddply(df, .(cat), mutate, id = seq_along(val))
或者:
library(dplyr)df %>% group_by(cat) %>% mutate(id = row_number())
或(最有效的内存,因为它通过引用分配DT):
library(data.table)DT <- data.table(df)DT[, id := seq_len(.N), by = cat]DT[, id := rowid(cat)]
本文共计144个文字,预计阅读时间需要1分钟。
使用ave函数或ddply/data.table或plyr的ddply方法,或dplyr的group_by和row_number函数,可以对数据进行分组并添加一个唯一标识符(id)。例如,使用dplyr可以这样写:
Rlibrary(dplyr)df %>% group_by(cat) %>% mutate(id=row_number())
使用ave,或: ddply_dplyr``data.table
df$num <- ave(df$val, df$cat, FUN = seq_along)
或者:
library(plyr)ddply(df, .(cat), mutate, id = seq_along(val))
或者:
library(dplyr)df %>% group_by(cat) %>% mutate(id = row_number())
或(最有效的内存,因为它通过引用分配DT):
library(data.table)DT <- data.table(df)DT[, id := seq_len(.N), by = cat]DT[, id := rowid(cat)]

