DataFrame, apply, lambda, list comprehension

Question

DataFrame, apply, lambda, list comprehension

3

我正在尝试对一些数据集进行清理，我可以使用一些for循环完成任务，但我希望有一种更符合Pythonic/Pandorable方式的方法来做这件事。

这是我想到的代码，数据不是真实的，但应该能工作。

import pandas as pd

# This is a dataframe containing the correct values
correct = pd.DataFrame([{"letters":"abc","data":1},{"letters":"ast","data":2},{"letters":"bkgf","data":3}])

# This is the dataframe containing source data
source = pd.DataFrame([{"c":"ab"},{"c":"kh"},{"c":"bkg"}])

for i,word in source["c"].iteritems():
    for j,row in correct.iterrows():       
        if word in row["letters"]:           
            source.at[i,"c"] = row["data"]    
            break

这是我尝试使用一种更加简洁的方式，但由于列表推导式返回了一个生成器，所以失败了：

source["c"] = source["c"].apply(
lambda x: row["data"] if x in row["letters"] else x for row in 
correct.iterrows() 
)

- csjr

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jpp · Answer 1

这里有一个使用 pd.Series.apply 和 next 以及生成器表达式的解决方案：

def update_value(x):
    return next((k for k, v in correct.set_index('data')['letters'].items() if x in v), x)

source['c'] = source['c'].apply(update_value)

print(source)

    c
0   1
1  kh
2   3