我有一个pandas数据框,其中包含用户ID列表'subscriber_id'和其他一些信息。
我想只选择不在给定列表A中的用户。
因此,如果我们的数据框包含订阅者[1,2,3,4,5]的信息,而我的排除列表是[2,4,5],那么现在我应该得到包含[1,3]的数据帧。
我尝试使用以下掩码:
temp = df.mask(lambda x: x['subscriber_id'] not in subscribers)
但并没有成功!
我确定not in
是有效的Python语法,因为我已经在列表上进行了测试:
c = [1,2,3,4,5]
if 5 not in c:
print 'YAY'
>> YAY
有什么建议或其他方法可以筛选数据框?