我有一个大的时间序列数据框(称为df),前5条记录如下:
df
stn years_of_data total_minutes avg_daily TOA_daily K_daily
date
1900-01-14 AlberniElementary 4 5745 34.100 114.600 0.298
1900-01-14 AlberniWeather 6 7129 29.500 114.600 0.257
1900-01-14 Arbutus 8 11174 30.500 114.600 0.266
1900-01-14 Arrowview 7 10080 27.600 114.600 0.241
1900-01-14 Bayside 7 9745 33.800 114.600 0.295
目标:
我试图删除在'stn'列中存在以下列表中任何一个字符串的行。因此,我基本上是尝试过滤该数据集,以不包括包含以下任何字符串的行。
尝试:
remove_list = ['Arbutus','Bayside']
cleaned = df[df['stn'].str.contains('remove_list')]
返回值:
Out[78]:
stn years_of_data total_minutes avg_daily TOA_daily K_daily
date
没有任何东西!
我尝试了几种引号、括号,甚至使用了一个 lambda 函数;虽然我还很新,很可能没有正确使用语法。
lambda x: ...
设置一些函数怎么样?我尝试的方法怎么样?我接近或者达到了我的目标吗?教我如何钓鱼,而不是只给我一条鲷鱼! :) - geokrowding