Pandas分组、包含和求和

Question

Pandas分组、包含和求和

3

                             BUILDING                 UNITS
0                      01 ONE FAMILY DWELLINGS        168.0
1                      02 TWO FAMILY DWELLINGS        269.0
2                    03 THREE FAMILY DWELLINGS        234.0
3                        04 TAX CLASS 1 CONDOS          0.0
4                       06 TAX CLASS 1 - OTHER          0.0
5               07 RENTALS - WALKUP APARTMENTS      10232.0
6             08 RENTALS - ELEVATOR APARTMENTS      15136.0
7                 09 COOPS - WALKUP APARTMENTS          0.0
8               10 COOPS - ELEVATOR APARTMENTS          0.0
9                            11A CONDO-RENTALS          0.0
10               12 CONDOS - WALKUP APARTMENTS          0.0
11             13 CONDOS - ELEVATOR APARTMENTS          0.0
12                      14 RENTALS - 4-10 UNIT        534.0
13           15 CONDOS - 2-10 UNIT RESIDENTIAL          0.0

我希望能够对包含某个字符串的物品进行分组。例如，在这里，我想将所有的公寓示例分为一个类别，并具有单位数的总和，同样地，租赁将被分为租赁。其余不属于任何相关类别的内容将被归为其他。

我知道这会选择那些包含公寓的人，但如何将它们分组并将它们的单元总和作为一个类别呢？

df[df['BUILDING'].str.contains("CONDO")]

我正在寻找类似如下的东西：

Building Units
Other      #
Condos     #sum condos
Rentals    #sum rentals

- user47467

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- help-ukraine-now · Accepted Answer

使用 numpy.select 创建建筑单位的标记，并将其用于 groupby 操作。

df["BUILDING UNITS"] = np.select(
    condlist=[
        df["BUILDING"].str.contains("CONDO"),
        df["BUILDING"].str.contains("DWELLINGS"),
    ],
    choicelist=[
        "Condos", "Rentals"
    ],
    default="Other"
)

df.groupby("BUILDING UNITS").sum()

                  UNITS
BUILDING UNITS
Condos              0.0
Other           25902.0
Rentals           671.0