我正在尝试对一个 pandas
dataframe
进行一些文本分析,但是在流程上遇到了一些问题。或者说,我可能还没有完全理解... 顺便说一下,我是一个初学者。
数据框示例:
df = pd.DataFrame({'Document' : ['a','1','a', '6','7','N'], 'Type' : ['7', 'E', 'Y', '6', 'C', '9']})
Document Type
0 a 7
1 1 E
2 a Y
3 6 6
4 7 C
5 N 9
我想构建一个流程,如果“文档”或“类型”是数字或不是数字,就会执行某些操作。
这里有一个简单的函数来返回“文档”是否为数字(已编辑以显示如何在该字段上尝试一些if/then流程):
def fn(dfname):
if dfname['Document'].apply(str.isdigit):
dfname['Check'] = 'Y'
else:
dfname['Check'] = 'N'
现在,我将应用它到数据框中:
df.apply(fn(df), axis=0)
我收到了以下错误信息:
TypeError: ("'NoneType' object is not callable", u'occurred at index Document')
根据错误信息,似乎我没有正确处理索引。有人能看出我哪里出了错吗?
最后,这可能与问题有关,但我真的很难理解 pandas
中的 indexes
如何工作。我认为我遇到的问题中,索引引起的问题比任何其他问题都要多。