在MySQL中计算投票频率

4
我正在制作一个网站,用户可以投票决定页面属于哪个分类。他们可以投票选择将页面归类为A、B、C或D。
我需要在所有投票中找到MySQL行中最常出现的分类。
每当用户提交投票时,它会提交他们所投票的“分类”和“页面ID”。
到目前为止,我有以下内容:
SELECT    page_id, category
FROM      categories
GROUP BY  page_id

我不能对每个类别都使用COUNT(*) WHERE category = 'a',因为实际项目中有更多的类别。


也许查看实际使用的表结构会有所帮助。 - JYelton
2个回答

1

类似于什么

SELECT category, page_id, count(vote_id)
FROM categories
WHERE category in ('a', 'b', 'c', 'd')
GROUP BY category, page_id
ORDER BY count(vote_id) DESC
LIMIT 1

应该就可以了。我假设这里每个投票都单独存储在一个单独的行中。

它仅查看您感兴趣的类别,按最多票数排序,并仅返回第一个。


1
如果您的表格看起来像这样:
SELECT * from categories;
+---------+----------+
| page_id | category |
+---------+----------+
|       1 | a        |
|       1 | b        |
|       1 | a        |
|       1 | c        |
|       1 | a        |
|       1 | b        |
|       1 | a        |
|       2 | d        |
|       2 | d        |
|       2 | c        |
|       2 | d        |
|       3 | a        |
|       3 | b        |
|       3 | c        |
|       4 | c        |
|       4 | d        |
|       4 | c        |
+---------+----------+
17 rows in set (0.00 sec)

那么您可能想尝试这个查询:

SELECT   c1.page_id, MAX(freq.total),
         (
            SELECT   c2.category
            FROM     categories c2
            WHERE    c2.page_id = c1.page_id
            GROUP BY c2.category
            HAVING   COUNT(*) = MAX(freq.total)
            LIMIT    1
         ) AS category
FROM     categories c1 
JOIN     (
            SELECT   page_id, category, count(*) total 
            FROM     categories 
            GROUP BY page_id, category
         ) freq ON (freq.page_id = c1.page_id) 
GROUP BY c1.page_id;

这将返回:

+---------+-----------------+----------+
| page_id | MAX(freq.total) | category |
+---------+-----------------+----------+
|       1 |               4 | a        |
|       2 |               3 | d        |
|       3 |               1 | a        |
|       4 |               2 | c        |
+---------+-----------------+----------+
4 rows in set (0.00 sec)

将结果与实际频率分布进行比较:

SELECT page_id, category, COUNT(*) FROM categories GROUP BY page_id, category;
+---------+----------+----------+
| page_id | category | COUNT(*) |
+---------+----------+----------+
|       1 | a        |        4 |
|       1 | b        |        2 |
|       1 | c        |        1 |
|       2 | c        |        1 |
|       2 | d        |        3 |
|       3 | a        |        1 |
|       3 | b        |        1 |
|       3 | c        |        1 |
|       4 | c        |        2 |
|       4 | d        |        1 |
+---------+----------+----------+
10 rows in set (0.00 sec)

请注意,对于page_id = 3,没有前导频率,在这种情况下,此查询不能保证选择哪个类别。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接