484得票4回答
如何在Python Pandas中按两个或多个列对数据框进行排序?

假设我有一个包含列a,b和c的数据框,我想按列b升序排序,并按列c降序排序,我该怎么做?

401得票40回答
实时时间序列数据中的峰值信号检测

更新:到目前为止,表现最佳的算法是这个。 这个问题探讨了在实时时间序列数据中检测突然峰值的强大算法。 考虑以下示例数据: 这些数据的示例是以Matlab格式呈现的(但这个问题不是关于语言,而是关于算法)。 p = [1 1 1.1 1 0.9 1 1 1.1 1 0.9 1...

183得票13回答
如何合并多个数据框架

我有不同的数据框,需要根据日期列将它们合并在一起。如果只有两个数据框,我可以使用df1.merge(df2, on='date'),对于三个数据框,我可以使用df1.merge(df2.merge(df3, on='date'), on='date'),但是当涉及到多个数据框时,这种方法变得非...

132得票3回答
为什么使用独热编码可以提高机器学习性能?

我注意到,当在一个特定的数据集(矩阵)上使用One Hot编码,并将其作为学习算法的训练数据时,相对于使用原始矩阵本身作为训练数据,它能够显著提高预测准确性。这种性能提升是如何发生的呢?

98得票9回答
我该如何在pandas数据框中更改单个索引值?

energy.loc['Republic of Korea'] 我想将索引值从“Republic of Korea”更改为“South Korea”。但数据框太大了,无法更改每个索引值。我如何仅更改此单个值?

95得票3回答
如何使用pandas按给定条件对列中的值进行求和?

假设我有一个类似这样的数据框:a b 1 5 1 7 2 3 1 3 2 5 我想对 b 中当 a = 1 的值进行求和。例如,这将给我 5 + 7 + 3 = 15。在 Pandas 中如何实现?

93得票5回答
在R中对数据进行多项式拟合模型

我已经阅读了这个问题的答案,它们很有帮助,但我需要帮助。 我在R中有一个示例数据集,如下:x <- c(32,64,96,118,126,144,152.5,158) y <- c(99.5,104.8,108.5,100,86,64,35.3,15) 我希望拟合一份模型使得y...

48得票6回答
如何在使用 Pandas 的透视表后取消多级索引?

我有以下数据框(真实数据框比这个大得多):sale_user_id sale_product_id count 1 1 1 1 8 1 1 ...

42得票3回答
在Pandas中按两列分组,并统计每个组合的出现次数

我有以下数据框:data = pd.DataFrame({'user_id' : ['a1', 'a1', 'a1', 'a2','a2','a2','a3','a3','a3'], 'product_id' : ['p1','p1','p2','p1','p1','p1','p2','p2'...

39得票1回答
使用Pandas GroupBy绘制结果

我正开始学习 Pandas,并且正在尝试找到实现某些任务的最 Pythonic(或“Panda-thonic”)方法。 假设我们有一个包含列 A、B 和 C 的 DataFrame。 列 A 包含布尔值:每行的 A 值都是 true 或 false。 列 B 具有一些重要值,我们想要绘制...