如何用`or`条件查询 Pandas 数据框？

Question

如何用`or`条件查询 Pandas 数据框？

5

我有一个简单的Pandas数据框。

import pandas as pd    
x = [5, 10, 20, 30, 5, 10, 20, 30, 5, 10, 20, 30]
y = [100, 100, 200, 200, 300, 300, 400, 400, 500, 500, 600, 600]
users =['mark', 'mark', 'mark', 'rachel', 'rachel', 'rachel', 'jeff', 'jeff', 'jeff', 'lauren', 'lauren', 'lauren']

df = pd.DataFrame(dict(x=x, y=y, users=users)

我想保留数据框的某些行。比方说所有“rachels”和“jeffs”。我尝试了df.query：

df=df.query('users=="rachel"' or 'users=="jeff"')

结果是一个仅包含 users=="rachel" 的数据框。有没有一种方式可以合并查询？

- Rachel

df.query('(users=="rachel") or (users=="jeff")') 或者 df.query('users=="rachel" or users=="jeff"') 都可以解决问题。已测试过，使用的是 pandas==1.2.4。 - banderlog013

2个回答

-1

另一种方法是：

df=df.query('users=="rachel"').append(df.query('users=="jeff"'))

- Mahesh

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nick Becker · Accepted Answer

标准方式是使用位或运算符|。要了解为什么，请查看此答案中的清晰解释。由于Python的评估顺序，您还需要在每个条件周围使用括号。

df[(df.users == 'rachel') | (df.users == 'jeff')]
    users   x    y
3  rachel  30  200
4  rachel   5  300
5  rachel  10  300
6    jeff  20  400
7    jeff  30  400
8    jeff   5  500

使用查询语句，您仍然可以只使用or运算符：

df.query("users=='rachel' | users=='jeff'")
    users   x    y
3  rachel  30  200
4  rachel   5  300
5  rachel  10  300
6    jeff  20  400
7    jeff  30  400
8    jeff   5  500