我有一个数据框,其中包含以下信息:
我想根据索引在数据框中插值,但仅在每个文件组内。
为了进行插值,通常会这样做:
"而且我要分组"
我希望插值后的数据框长这个样子:
在 t = 6 时,NaN 仍然存在,因为它们是文件2组中的第一项。我怀疑我需要使用“apply”,但还没有弄清楚具体如何操作...
任何帮助都将不胜感激。
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv NaN NaN
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
我想根据索引在数据框中插值,但仅在每个文件组内。
为了进行插值,通常会这样做:
df = df.interpolate(method="index")
"而且我要分组"
grouped = df.groupby("filename")
我希望插值后的数据框长这个样子:
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv 10 15
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
在 t = 6 时,NaN 仍然存在,因为它们是文件2组中的第一项。我怀疑我需要使用“apply”,但还没有弄清楚具体如何操作...
grouped.apply(interp1d)
...
TypeError: __init__() takes at least 3 arguments (2 given)
任何帮助都将不胜感激。