12得票1回答
使用pandas数据框计算加权平均数

我有以下的pandas数据框:data_df = pd.DataFrame({'ind':['la','p','la','la','p','g','g','la'], 'dist':[10.,5.,7.,8.,7.,2.,5.,3.], ...

12得票3回答
在数据框中按组显示加权平均值

关于命令by和weighted.mean的问题已经存在,但是没有一个能够帮助我解决我的问题。我是R语言的新手,更习惯于数据挖掘语言而不是编程。 我有一个数据框,其中每个个体(观察/行)的收入、教育水平和样本权重都有记录。我想计算每个教育水平的收入加权平均值,并且我希望结果与原始数据框中每个个...

11得票5回答
在C#中按权重选择随机元素的最简洁方法是什么?

假设有: List<element>,其中的元素为:public class Element { int Weight { get; set; } } 我想要做到的是,按照权重随机选择一个元素。 例如:Element_1.Weight = 100; Element_2.Wei...

11得票6回答
调整从列表中选择项目的机会

我有一个项目列表。创建列表时,每个项目具有相等的选择机会。但是当一个项目被选择时,它的机会会下降,而其他项目的机会会上升。如果在过程中添加新项目,则应具有最高的选择机会,并且随着其被选择,其机会会减少。我正在寻找一种能够以C#实现这一点的良好算法。 概括的想法是:我有5个项目,随着时间的推移...

10得票2回答
如何使用dplyr计算两个分组变量的加权平均值

我知道这一定很简单,但我找不到正确的dplyr命令来完成这个任务。假设我想按两个变量对数据集进行分组,然后总结每行的计数。我们可以使用以下代码:mtcars %>% group_by(cyl, mpg) %>% summarize(Count = n()) 这将生成一个数据框,包含...

9得票4回答
如何计算分数?

这个问题更多涉及逻辑而不是编程语言。如果这个问题不适合在论坛上提问,请告诉我,我会删除它。 我需要写一个逻辑来计算博客奖项网站上的博客得分。一个博客可能会被提名为多个奖项类别,并由评审委员会进行同行评审或评定,评分在-1到5的范围内(-1表示他们非常不喜欢该博客)。现在,一个博客可以被一个或...

9得票1回答
PyTorch张量的加权平均

我有两个形式为[y11,y12]和[y21,y22]的Pytorch张量。如何得到这两个张量的加权平均值?

9得票1回答
如何在Python中聚合时间序列?

我有两个具有部分重叠时间戳的不同时间序列: import scikits.timeseries as ts from datetime import datetime a = ts.time_series([1,2,3], dates=[datetime(2010,10,20), date...

9得票3回答
Haskell中类似的代码(用于指数加权偏差)比Python慢。

我在Python3和Haskell(编译)中实现了指数加权移动平均(ewma)。它们需要大约相同的时间。但是当该函数应用两次时,Haskell版本的速度会不可预测地变慢(超过1000倍),而Python版本只慢大约2倍。 Python3版本: import numpy as np def ...

8得票1回答
我该如何计算加权测量之间的标准偏差?

我有几个带权值,想要用加权平均数来计算加权标准差。如何修改标准差公式以包含每个测量的权重? 这是我使用的标准差公式。 当我简单地将每个带权值用于“x”,带权平均值用于“x̄”时,结果似乎比实际结果小。