我正在处理一款应用程序,其中有一个数据框架长这样:
Database 用户ID 小时数 日期 01 18 2016年1月1日 01 18 2016年1月1日 01 14 2016年2月1日 01 14 2016年2月1日 02 21 2016年2月1日 02 08 2016年5月1日 02 08 2016年5月1日 03 23 2016年5月1日
每行表示一个会话。
我需要确定用户的第一个会话的时间是否对该用户的会话数量产生影响。
我已经尝试使用summaryBy
命令:
library(doBy)
first_hour <- summaryBy(UserId + Hour + Date ~ UserId,
FUN=c(head, length, unique), database)
但它没有给我正确的结果。
我的目标是确定用户进行第一次会话的小时数
,并确定用户有多少个会话和多少不同的会话日期。
library(data.table); setDT(df1)[, .N ,names(df1)]
来实现。 - akrun