在Python中是否有标准的方法来计算pandas DataFrame变量的条件均值和方差?目的是测试数据的过度或欠度散性,以评估泊松回归模型或负二项式回归模型哪个更合适。
在R生态系统和Cross Validated周围浏览,我认为R具有一些内置参数分散方法的包。但是我找不到pandas,SciPy或StatsModels的Python等效方法。
这是我正在处理的数据的头部。共有25,000个观察值。
在R生态系统和Cross Validated周围浏览,我认为R具有一些内置参数分散方法的包。但是我找不到pandas,SciPy或StatsModels的Python等效方法。
这是我正在处理的数据的头部。共有25,000个观察值。
aspunet c_# c_++ Ruby java
0 0 0 0 6
11 0 0 0 0
0 0 7 0 0
0 0 0 9 0
8 0 0 0 0
0 2 0 0 0
0 0 0 4 0
0 0 0 0 6