11得票2回答
Python:合并低频因子/类别计数

有一个在 R 中的很好的解决方案。 我的 df.column 看起来像:Windows Windows Mac Mac Mac Linux Windows ... 我希望在这个 df.column 向量中用“其他”替换低频类别。例如,我需要我的 df.column 看起来像这样Windows...

9得票1回答
用pandas进行OLS回归:将日期索引作为预测变量

我将使用pandas OLS函数来拟合数据系列的趋势线。有人知道如何在OLS中使用pandas Series的日期索引作为预测变量吗? 例如,假设我有一个简单的时间序列: >>> ts 2001-12-31 19.828763 2002-12-31 20.11...

9得票4回答
使用fillna在Pandas中将空值填充为列表

给定一个 pd.Series,我想用列表替换空值。也就是说,给定: import numpy as np import pandas as pd ser = pd.Series([0,1,np.nan]) 我想要一个能够返回的函数。 0 0 1 1 2 ...

7得票5回答
将pandas数据框中的“no”和“yes”转换为0和1

我想转换包含int和'yes'、'no'值的“edjefe”列的数据。我的问题是,我只想将“yes”和“no”映射为1和0,并保持int值不变。所以我写了这段代码: def foo(x): if x == 'no': return 0 elif x == 'y...

59得票3回答
将列名分配给Pandas系列

我有一个Pandas系列object x Ezh2 2 Hmgb 7 Irf1 1 我希望将其保存为一个数据框,其中列名分别为"Gene"和"Count"。 我尝试过。x_df = pd.DataFrame(x,columns = ['Gene','count']) 但它无法工作。...

7得票2回答
从Pandas DataFrame中获取从索引开始的行,直到满足条件为止。

假设我有一个 Pandas 数据帧: x = pd.DataFrame(data=[5,4,3,2,1,0,1,2,3,4,5],columns=['value']) x Out[9]: value 0 5 1 4 2 3 3 2 4...

14得票3回答
将Pandas系列附加到数据框作为一列

我有一个名为df的pandas dataframe,其中包含 ['key','col1','col2','col3'] 列,还有一个pandas series (sr),其索引与数据框中的'key'列相同。我想将该系列附加到数据框中名为col4且具有相同'key'的新列中。我有以下代码:for...

19得票8回答
统计数据框中某一列True/False的出现次数

有没有一种方法可以在不必遍历数据框的情况下计算列中布尔值出现的次数? 做类似以下操作:df[df["boolean_column"]==False]["boolean_column"].sum() 不起作用,因为False的值为0,因此总和始终返回0。 显然,您可以通过循环列并检查来计算出...

116得票5回答
在Python中,如何获取pandas系列的最小值或最大值?

我有一个pandas系列 series 。如果我想要获得逐元素的floor或ceiling,是否有内置的方法或者我必须编写函数并使用apply?我问这个问题是因为数据很大,所以我非常重视效率。同时,这个问题还没有关于Pandas软件包的解答。

9得票5回答
在一列中计算布尔值从True变为False的次数

我有一个dataframe中的一列,里面填充着布尔值,我想要计算从True到False的变化次数。 当我将布尔值转换为1和0后,我可以这样做:使用df.diff,然后将答案除以2。 import pandas as pd d = {'Col1': [True, True, True, F...