我有一个Pandas DataFrame,其中包含客户退款原因。它包含以下示例数据行:
我想将客户的原因与某种标记的原因进行比较。这没有问题,但我还想看到特定组(客户原因)中的记录总数。
这是我的输出,例如:
我还想得到每种案例类型的输出总和。就像这样:
这并不一定非要使用最后的输出格式,每个案例类型的(汇总)总数的列也可以。
**case_type** **claim_type**
1 service service
2 service service
3 chargeback service
4 chargeback local_charges
5 service supplier_service
6 chargeback service
7 chargeback service
8 chargeback service
9 chargeback service
10 chargeback service
11 service service_not_used
12 service service_not_used
我想将客户的原因与某种标记的原因进行比较。这没有问题,但我还想看到特定组(客户原因)中的记录总数。
case_claim_type = df[["case_type", "claim_type"]]
case_claim_type.groupby(by=("case_type", "claim_type"))["case_type"].count()
这是我的输出,例如:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
chargeback service 6
local_charges 1
我还想得到每种案例类型的输出总和。就像这样:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
total: 5
chargeback service 6
local_charges 1
total: 7
这并不一定非要使用最后的输出格式,每个案例类型的(汇总)总数的列也可以。