我将要处理一组相当大的数据。我使用Pandas DataFrame来处理这些数据,目前卡在了一种有效地将数据解析成两个格式化列表的方法上。
以下是我的DataFrame对象:
fet1 fet2 fet3 fet4 fet5
stim1 True True False False False
stim2 True False False False True
stim3 ...................................
stim4 ...................................
stim5 ............................. so on
我将尝试解析每一行并创建两个列表。列表一应包含所有真值的列名,列表二应包含所有假值的列名。
对于刺激1的示例:
list_1=[fet1,fet2]
list_2=[fet3,fet4,fet5]
我知道我可以用暴力方法迭代行。或者我可以转置并将其转换为字典,然后以这种方式进行解析。我还可以创建稀疏系列对象,然后创建集合,但是需要单独引用列名。
唯一的问题是我总是得到二次的O(n^2)运行时间。
是否有更有效的方法作为Pandas内置功能来执行此操作?
谢谢你的帮助。