我有一些相对简单的代码,但是我仍然在努力组合它们。我已经将一个CSV读入到数据框中。这个CSV是面板数据(即每行都有唯一的公司和年份观察值)。我有两列想要执行函数,然后根据函数的输出创建新变量。
以下是我的代码:
#Loop through rows in a CSV file
for index, rows in df.iterrows():
#Start at column 6 and go to the end of the file
for row in rows[6:]:
data = perform_function1( row )
output = perform_function2(data)
df.ix[index, 'new_variable'] = output
print output
我希望这段代码从第6列开始迭代,然后到文件的结尾(例如,我有两列要对其执行函数Column6和Column7),然后根据执行的函数创建新列(例如,Output6和Output7)。上面的代码返回Column7的输出,但我无法创建一个变量,使我能够捕获来自两列的输出(即,一个新变量,不被循环覆盖)。我在Stackoverflow上搜索,没有看到与我的问题直接相关的内容(也许是因为我太菜了?)。我真的很感激您的帮助。
谢谢,
TT
P.S.我不确定是否提供了足够的细节。如果需要提供更多信息,请告诉我。
for row in rows[6:]
这段代码有些令人困惑,因为rows
是数据集中的一行,而for row in rows[6:]
实际上是在迭代该行的列。 - GeauxEric