我有以下数据框:
数据框 1:
|---------------------|------------------|
| property_id | beds |
|---------------------|------------------|
| 1 | 1 |
|---------------------|------------------|
| 2 | 2 |
|---------------------|------------------|
数据框 2:
|---------------------|
| property_id |
|---------------------|
| 3 |
|---------------------|
| 4 |
|---------------------|
我想要生成以下Dataframe:
|---------------------|------------------|
| property_id | beds |
|---------------------|------------------|
| 1 | 1 |
|---------------------|------------------|
| 2 | 2 |
|---------------------|------------------|
| 3 | 0 |
|---------------------|------------------|
| 4 | 0 |
|---------------------|------------------|
我想要的是将两个数据框连接起来,前一个比后一个有更多的列,但是后一个数据框中的所有列都在前一个数据框中。当后一个数据框中不存在某一列时,我希望将其默认值设为0。如何实现这一点?df1 = pd.DataFrame({'property_id': [1, 2], 'beds': [1, 2]})
df2 = pd.DataFrame({'property_id': [3, 4]})
我几乎没有pandas的经验,我该怎么办?
pd.concat
具有优势,因为它可以在一个命令中完成,如pd.concat(list_of_dataframes)
,而append
则不能。但严格来说,我对这两种方法的时间比较并不了解。我更经常使用pd.concat
。 - Psidompd.append
已被弃用。 - Philipp