我正在处理跟踪网球比赛中选手的数据。这些数据以json文件的形式提供给我,每100毫秒(即每秒10次),它会了解球场两侧的选手和球的位置,并提供其他比赛数据。使用这些跟踪数据,我创建了许多定制的python类和子类来创建“比赛”对象,并将所有跟踪数据加载到此“比赛对象”中。我能创建一个pandas df来保存自定义类的实例吗?这样做是否有意义?
背景/思路(以防我的问题不太清楚,这很有可能...)
第一次实现时,我基本上创建了一个“比赛”对象,其中使用了python面向对象编程(OOP),并将比赛分成游戏、盘、分、选手等部分。选手部分有点令人困惑,因为由于我这边的计算,我们在每100毫秒内创建了一个选手对象和一个新的选手实例(很难理解,因为一个选手在整个比赛中是相同的,但是可以把它想象成那个精确时刻的选手)。我不确定将这些“玩家”对象改变为pandas dataframe中的行是否更加合理(它们很多,考虑一场3小时的比赛),或者是否可以创建一个pandas df并将玩家设置为一列。选手组成了得分,然后得分组成了盘数,因此,如果我将玩家对象更改为pandas df,则会很困难,因为然后数据框中会有许多行组成一个得分,进而得分又组成了一局等等。
由于有很多跟踪数据,所以效率考虑对我很重要(尽管我倾向于做一些稍微慢一些但不是极端慢的事情,但它可以帮助我确保/检查所有数据)。
背景/思路(以防我的问题不太清楚,这很有可能...)
第一次实现时,我基本上创建了一个“比赛”对象,其中使用了python面向对象编程(OOP),并将比赛分成游戏、盘、分、选手等部分。选手部分有点令人困惑,因为由于我这边的计算,我们在每100毫秒内创建了一个选手对象和一个新的选手实例(很难理解,因为一个选手在整个比赛中是相同的,但是可以把它想象成那个精确时刻的选手)。我不确定将这些“玩家”对象改变为pandas dataframe中的行是否更加合理(它们很多,考虑一场3小时的比赛),或者是否可以创建一个pandas df并将玩家设置为一列。选手组成了得分,然后得分组成了盘数,因此,如果我将玩家对象更改为pandas df,则会很困难,因为然后数据框中会有许多行组成一个得分,进而得分又组成了一局等等。
由于有很多跟踪数据,所以效率考虑对我很重要(尽管我倾向于做一些稍微慢一些但不是极端慢的事情,但它可以帮助我确保/检查所有数据)。