将数据分桶在SQL Server 2008中

Question

将数据分桶在SQL Server 2008中

sqlsql-serversql-server-2008

3

我要处理的数据长这样：

+----------+------------------+--------+
| specimen |       date       | bucket |
+----------+------------------+--------+
| 31598D   | 3/3/2010 11:38   |     10 |
| A113899  | 2/10/2010 13:50  |     11 |
| A121375  | 12/17/2010 10:06 |      2 |
| A122115  | 6/14/2010 9:33   |     10 |
| A122119  | 5/19/2010 10:08  |      3 |
| A122124  | 6/30/2010 11:43  |      4 |
| DD58834  | 6/17/2010 10:08  |      1 |
| 31598A   | 3/3/2010 11:36   |     10 |
+----------+------------------+--------+

我想知道是否有可能将其转换为类似于下图的频率分布：

enter image description here

我应该在SQL Server中使用pivot函数吗？如果是这样，怎么做呢？

请注意，我可以访问SSRS，并可以将其用作解决此问题的资源。

非常感谢您的指导和时间。

- Alex Gordon

@marc_s，你能帮忙看一下这个问题吗？http://stackoverflow.com/questions/10711220/outputting-full-sequential-range-of-values - Alex Gordon

3个回答

1

select * from t
pivot (
        count (*) for datepart(m, date) 
        in ([01],[02],[03],[04],[05],
            [06],[07],[08],[09],[10],[11],[12])
) as CountSpec

试一下

- vittore

您将会缺少表中不存在的桶编号。 - Taryn

将其更改为count(bucket)。 - vittore

你能帮忙解决这个问题吗？http://stackoverflow.com/questions/10711220/outputting-full-sequential-range-of-values - Alex Gordon

1

这未经测试，因为我没有可用的SQL Server实例，但它应该说明问题；您可以在CASE语句上使用SUM()函数来生成所需的分布。

SELECT
      [bucket]
    , SUM( CASE WHEN DATEPART(MONTH,[date]) = 1 THEN 1 ELSE 0 END ) AS [Jan]
    -- repeat the above for each month
FROM
    [your_table]
GROUP BY
    [bucket]
ORDER BY
    [bucket] DESC

- Rory Hunter

你能帮忙解决这个问题吗？http://stackoverflow.com/questions/10711220/outputting-full-sequential-range-of-values - Alex Gordon

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Quassnoi · Accepted Answer

WITH    bm (maxbucket) AS
        (
        SELECT  MAX(bucket)
        FROM    mydata
        ),
        buckets (bucket) AS
        (
        SELECT  1
        UNION ALL
        SELECT  bucket + 1
        FROM    buckets
        JOIN    bm
        ON      bucket < maxbucket
        )
SELECT  bucket, p.*
FROM    (
        SELECT  b.bucket, DATEPART(month, dt) AS mon
        FROM    buckets b
        LEFT JOIN
                mydata m
        ON      m.bucket = b.bucket
        ) q
PIVOT   (
        COUNT(mon)
        FOR
        mon IN ([1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12])
        ) p