30得票4回答
在LINQ中最流行的GROUP BY是什么?

假设有一个与stackoverflow问题标签相关的表格: TagID(bigint),QuestionID(bigint),Tag(varchar) 使用LINQ获取最常用的25个标签的最有效方法是什么?在SQL中,简单的GROUP BY即可实现: SELECT Tag, COUN...

30得票6回答
百万级别排名

我正在为一个能够处理数百万玩家的在线游戏设计服务器。现在,这个游戏需要排行榜功能,并希望能够显示一位玩家当前的排名以及可能与该玩家排名相近的其他玩家的位置,以及该玩家好友的位置。 我以前用MySQL做过类似的东西,我知道这在技术上是可行的,但我认为既然这是许多在线游戏常见的实践,必定存在专门...

26得票3回答
标准化编辑距离

我有一个问题,我们能否通过将编辑距离(levenshtein edit distance)的值除以两个字符串的长度来进行归一化呢? 我之所以问这个问题是因为,如果我们比较两个长度不相等的字符串,那么它们长度之间的差异也会被计算在内。 例如: ed('has a', 'has a ball') ...

25得票3回答
基于比较的排名算法比较

我想对一个包含多个元素(可能大于100,000)的集合进行排序或排名,但是集合中的元素没有固有的(可比较的)价值,而是我所拥有的只有用户提供的任意两个元素之间的比较结果,这些结果是主观的。 例如:考虑一个元素为[a, b, c, d]的集合以及用户给出的比较结果b > a, a &gt...

24得票5回答
搜索排名/相关性算法

在开发知识库(例如)文章数据库时,如何按照最佳方式对用户问题的最相关答案进行排序和显示? 您是否会使用其他数据,例如基于先前用户是否发现文章有帮助的关键字加权,还是发现简单的关键字匹配算法就足够了?

24得票11回答
排名数组元素

我需要一种算法来在 Javascript 中对数组元素进行排序。例如:我有一个如下的数组:[79, 5, 18, 5, 32, 1, 16, 1, 82, 13] 我需要按值对条目进行排名。因此,82 应该获得排名 1,79 排名 2,以此类推。 如果两个条目具有相同的值,则它们会获得相同的排...

23得票1回答
如何使用Python和Pandas创建十分位数和五分位数列,根据大小对另一个变量进行排名?

我有一个数据框,其中包含一个列Investment,表示交易员投资的金额。我想在数据框中创建两个新列;一个给出基于Investment大小的十分位数排名,另一个给出五分位数排名。我希望1代表投资最大的十分位数,10代表最小的十分位数;同样,我希望1代表投资最大的五分位数,5代表最小的五分位数。...

22得票5回答
如何平衡评分数量和评分本身?

为了一个学校项目,我们需要实现一个排名系统。然而,我们发现平均等级很愚蠢:只有一个用户评为5星的某物品会比188个用户评为4星的物品均值更高,这很荒谬。 因此,我想知道你们是否有“智能”排名的示例算法。它只需要考虑给定的排名和排名数量。 谢谢!

22得票4回答
如何在Python中使用gensim BM25排名算法

我发现gensim有BM25排名函数,但是我找不到如何使用它的教程。在我的情况下,我有一个查询和从搜索引擎检索到的几篇文档。如何使用gensim BM25排名来比较查询和文档以找到最相似的那个?我是gensim的新手。谢谢。查询:"experimental studies of creep b...

20得票3回答
最佳使用PostgreSQL全文搜索排名的方法

在这个答案的基础上,我想知道如果我想按排名排序,并仅限于匹配查询,使用PostgreSQL内置的全文搜索的最佳方法是什么。 假设有一个非常简单的表。 CREATE TABLE pictures ( id SERIAL PRIMARY KEY, title varchar(300),...