我有一个类似于df的东西
pd.DataFrame([["A1" "B1", "C1", "P"],
["A2" "B2", "C2", "P"],
["A3" "B3", "C3", "P"]], columns=["col_a" "col_b", "col_c", "col_d"])
col_a col_b col_c col_d
A1 B1 C1 P
A2 B2 C2 P
A3 B3 C3 P
...
我需要的结果基本上是重复并确保每个唯一行出现在col_d中具有PQR扩展的列。
col_a col_b col_c col_d
A1 B1 C1 P
A1 B1 C1 Q
A1 B1 C1 R
A2 B2 C2 P
A2 B2 C2 Q
A2 B2 C2 R
A3 B3 C3 P
A3 B3 C3 Q
A3 B3 C3 R
...
目前我所拥有的只有:
new_df = pd.DataFrame(np.repeat(df.values, 3, axis=0), columns=df.columns)
这将导致这些值的重复,但 col_d 没有改变。
编辑:
现在我又遇到了另一个需求,即对于每个唯一的 col_a 和 col_b,我需要向 col_d 添加 "S"。
例如,会导致以下结果:
col_a col_b col_c col_d
A1 B1 C1 P
A1 B1 C1 Q
A1 B1 C1 R
A1 B1 T S
A2 B2 C2 P
A2 B2 C2 Q
A2 B2 C2 R
A2 B2 T S
非常感谢您的帮助!
col_a col_b col_c col_d A1 B1 C1 P A1 B1 C1 Q A1 B1 C1 R A1 B1 T S A2 B2 C2 P A2 B2 C2 Q A2 B2 C2 R A2 B2 T S
- DisplayedName