我正在尝试过滤包含产品列表的数据框。然而,每当我运行该代码时,都会出现错误。
以下是代码行:
include_clique = log_df.loc[log_df['Product'].str.contains("Product A")]
产品是一种对象数据类型。
import pandas as pd
import numpy as np
data = pd.read_csv("FILE.csv", header = None)
headerName = ["DRID", "Product", "M24", "M23", "M22", "M21"]
data.columns = [headerName]
log_df = np.log(1 + data[["M24", "M23", "M22", "M21"]])
copy = data[["DRID", "Product"]].copy()
log_df = copy.join(log_df)
include_clique = log_df.loc[log_df['Product'].str.contains("Product A")]
这是标题:
ID PRODUCT M24 M23 M22 M21
0 123421 A 0.000000 0.000000 1.098612 0.0
1 141840 A 0.693147 1.098612 0.000000 0.0
2 212006 A 0.693147 0.000000 0.000000 0.0
3 216097 A 1.098612 0.000000 0.000000 0.0
4 219517 A 1.098612 0.693147 1.098612 0.0
log_df.str
(而不是log_df['Product'].str
)吗?或者可能存在具有这个名称Product
的重复索引(例如,具有相同名称的两个列)吗? - rafaelcdf
的前五行并将任何机密信息更改为foo
,bar
,blablabla
等。 我只是想了解您的df
的结构。 - rafaelc