假设您有一个非常大的“csv”格式输入文件。您想知道每个列中出现的不同值。您该怎么做?
例如:
例如:
column1 column2 column3 column4
----------------------------------------
value11 value12 value13 value14
value21 value22 value23 value24
...
valueN1 valueN2 valueN3 valueN4
因此,我的输出应该类似于:
列1具有以下这些值: 值11, 值21, ...值N1
。但我不需要看到相同值的重复出现。我只需要对我的数据有一个大致的了解。
dplyr
,即dat %>% summarise_each(funs(n_distinct))
。 - akrun