这应该是非常简单的,但作为SQL的新手,我确实很困难。我被建议使用PERCENTILE_CONT以处理连续(非离散)数据。
所涉及到的数据包括两个列:(1)患者列表的ID和(2)每年平均事件数量。
从我在网上找到的一些代码开始,我现在的进展如下:
SELECT ID,
percentile_cont (0.25) WITHIN GROUP
(ORDER BY PPPY ASC) OVER(PARTITION BY ID) as percentile_25,
percentile_cont (0.50) WITHIN GROUP
(ORDER BY PPPY ASC) OVER(PARTITION BY ID) as percentile_50,
percentile_cont (0.75) WITHIN GROUP
(ORDER BY PPPY ASC) OVER(PARTITION BY ID) as percentile_75
FROM AE_COUNT;
这似乎只是报告了三列,每列的值都相同为 PPPY。
你有什么想法我做错了什么吗?
按ID分区
我猜你想要为其他东西进行分区。如果ID是唯一/主键,则每个组只有一个值。 - Lukasz SzozdaOVER()
。这适用于任何窗口函数。 - Manngo