我正在通过复制一些R小贴士的输出来学习Pandas包。现在我以R中的dplyr包为例:
http://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html
R脚本
planes <- group_by(hflights_df, TailNum)
delay <- summarise(planes,
count = n(),
dist = mean(Distance, na.rm = TRUE))
delay <- filter(delay, count > 20, dist < 2000)
Python脚本
planes = hflights.groupby('TailNum')
planes['Distance'].agg({'count' : 'count',
'dist' : 'mean'})
我如何在Python中明确表示需要跳过NA
?
pandas
包含NaN
? - Dr_ZaszuśNaN
的选项。您可以像其他答案建议的那样在此基础上构建。 - FooBar