我正在尝试使用用户ID列表和掩码进行过滤。这是包含两个用户ID的输入:
data = np.array([['user_id','comment','label'],
[100,'First comment',0],
[101,'Buy viagra',1],
[100,'Buy viagra two',1],
[101,'Third comment',0],
[100,'Third comment two',0],
[101,'Buy drugs',1],
[100,'Buy drugs two',1],
[101,'Buy icecream',1],
[100,'Buy icecream two',1],
[101,'Buy something',1],
[100,'Buy something two',1]])
所需输出为:
0 100 First comment 0
1 101 Buy viagra 1
2 100 Buy viagra two 1
3 101 Third comment 0
4 100 Third comment two 0
5 101 Buy drugs 1
6 100 Buy drugs two 1
7 101 Buy icecream 1
8 100 Buy icecream two 1
通过传递用户ID列表,我得到了一个错误的输出。
m = df.user_id.isin([100,101]) & df.label.eq('1')
i = df[m].head(3)
j = df[~m]
df = pd.concat([i, j]).sort_index()
print (df)
然而,如果我只传递一个 user_id 如下所示,就会得到正确的输出。你能告诉我哪里出了问题吗?谢谢。
m = df.user_id.eq('101') & df.label.eq('1')