我有一个以下格式的数据集:
任何帮助或指导都将不胜感激。
Patient Date colA colB
1 1/3/2015 . 5
1 2/5/2015 3 10
1 3/5/2016 8 .
2 4/5/2014 2 .
2 etc
我正在尝试在PANDAS中定义一个函数,将唯一的患者视为一个项目,并迭代这些唯一的患者项目,以仅保留每列中最近的观察结果(用缺失或空值替换所有其他值)。例如:对于患者1,输出将包括 -
Patient Date colA colB
1 1/3/2015 . .
1 2/5/2015 . 10
1 3/5/2016 8 .
我知道可以使用类似以下代码与 .apply() 一起使用,但这不考虑重复的病人 ID...
def getrecentobs():
for i in df['Patient']:
etc
任何帮助或指导都将不胜感激。