为图表选择代表性样本的算法

Question

4

示例:
我有一定时间段内的100个样本。但是我只能使用10个值来绘制折线图。我可以使用什么算法来计算这10个代表性的值，以使图表看起来与使用所有100个确切样本绘制它相似。

天真的算法计算每个接下来10个样本的平均值不能很好地反映图表中的峰值。

- Petr Felzmann

除非您对输入信号有更多了解，否则您不会比简单平均值更好。 - Sword22

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Darren Engwirda · Accepted Answer

你可以使用Douglas-Peucker算法来获得最优的欠采样表示。

该算法从原始数据集的端点开始构建欠采样集。每一步都会将原始数据集中与欠采样表示“最远”（最大误差）的点添加到欠采样集中。通过这种方式，算法包括原始数据集中的重要峰值，并构造了一个误差最小的欠采样表示。

由于您的欠采样集只允许包含10个点，因此您可以将算法设置为仅将欠采样集扩展到10个点的大小。

如果您的原始数据集包含太多峰值，则无法捕获它们并满足大小约束。

希望这能帮到您。