统计估计算法

Question

3

我不确定这个问题是否适合在Stack Overflow上提问，但我还是试着提出来了。我有一些数据如下所示：

alt text

我还有另一组数据，我相信它们遵循类似的分布，但我只知道总百分比（例如30％而不是17％）。有人能建议一个算法来根据新的总百分比和原始分布来估计每个单独层级的百分比吗？

- wethercotes

1

这是一个适合在SO上提问的好问题。不过我会编辑你的测试并删除你的第一句话。问题的前几个句子会显示为工具提示或预览，所以你应该放弃礼节，直接进入正题。 - JoshBerke

可能的总数应该保持不变吗？ - Mikko Rantanen

如果你能详细解释所有的测量意义、数量以及你想要估算的具体内容，我会尽力回答你的问题。但目前我真的不太清楚你想做什么。 - simon

我认为这不是一个SO的问题。实际上，它与编程无关。提出这个问题的更好地方可能是像sci.stat或sci.stat.math这样的新闻组。无论如何，如果我要尝试回答这个问题，我需要更清晰的问题解释。 - user85109

3个回答

1

步骤1：如果您的总百分比为17% → 30%，则实际（总共）105 → ~189。

步骤2：这个数字需要分配到实际列中的所有元素中。

从这里开始，事情变得非线性，我们需要一些公式来从可能的状态到达实际状态。而这需要是一个关于总数的函数。

即，function (possible, total (actual)) = actual。

如果我们能够得出上述结论，则它可能有效；)

- Alphaneo

哎？我想我没有理解某些基本的东西。 - ojblass

0

如果你的新总数是x，则将（22/627）* x作为一级可能值，并将（21/627）* x作为一级实际值，这将为一级给出与之前相同的百分比。然后对于其他等级执行相同的操作（因此二级的可能值为（45/627）* x等）。

- BenH

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ojblass · Accepted Answer

你的问题不太清楚。如果你想通过包含你得到的额外数据来估算一个新的总百分比，你必须有与你的百分比相关联的数量，以便你可以创建一个有意义的加权平均值。

如果你想确定新的数据集是否与历史数据具有不同的分布，那么有几个测试主要是对落在特定值下面的值的累积实际与预期百分比进行晦涩的计算。关于比较两个总体分布的主题有很多文献。

对于成对样本，如果您不能对数据的分布做出任何假设，则Wilcoxon-Rank是一种标准方法。对于非成对数据，非参数统计存在，但需要进行深入研究。