63得票5回答
在一个向量中找到出现次数最多的前n个值

我有一个向量,比如说c(1,1,1,1,1,1,2,3,4,5,7,7,5,7,7,7) 如何计算每个元素的数量,并返回前3个最常见的元素,即1、7、5?

24得票11回答
排名数组元素

我需要一种算法来在 Javascript 中对数组元素进行排序。例如:我有一个如下的数组:[79, 5, 18, 5, 32, 1, 16, 1, 82, 13] 我需要按值对条目进行排名。因此,82 应该获得排名 1,79 排名 2,以此类推。 如果两个条目具有相同的值,则它们会获得相同的排...

20得票3回答
如何在SQL Server 2012中添加行号列

我正在尝试向现有表格添加新列,其中该值为行号/排名。我需要一种方法来生成行号/排名值,并且我还需要限制受影响的行--在这种情况下,是一个字符串中包含子字符串的情况。 目前我的代码:UPDATE table SET row_id=ROW_NUMBER() OVER (ORDER BY col1...

13得票4回答
找出给定排名的固定长度的所有子数组

我有一个数字数组,例如:A = [1, 5, 2, 4, 3] 还有一个用于确定排名的数组,例如:B = [0, 2, 1] 我的目标是找到符合等级B的A的所有子数组。如果一个子数组符合等级,这意味着子数组的第i个最小元素必须将B[i]作为它的(子数组)索引。因此,为了匹配一个子数组,其中最小...

24得票5回答
搜索排名/相关性算法

在开发知识库(例如)文章数据库时,如何按照最佳方式对用户问题的最相关答案进行排序和显示? 您是否会使用其他数据,例如基于先前用户是否发现文章有帮助的关键字加权,还是发现简单的关键字匹配算法就足够了?

8得票1回答
按 TF-IDF 值排序 TfidfVectorizer 输出(从低到高或从高到低)

我正在使用sklearn中的TfidfVectorizer()来处理部分文本数据,以了解每个特征(单词)的词频。我的当前代码如下: from sklearn.feature_extraction.text import TfidfVectorizer tfidf = TfidfVectori...

11得票4回答
在R中绘制两个有序列表之间排名变化的最简单方法是什么?

我想知道是否有一种简单的方法可以在R中以有向二分图的形式绘制两个列表中元素位置的变化。例如,列表1和2是字符字符串向量,不一定包含相同的元素:list.1 <- c("a","b","c","d","e","f","g") list.2 <- c("b","x","e","c",...

16得票2回答
按照类似PageRank的方式排序的Wikidata结果

在Wikidata(Wikidata SPARQL终端)中,是否有一种方式可以使用类似PageRank的方法对SPARQL查询结果进行排序? 在Wikidata(Wikidata SPARQL endpoint)中,是否有一种方式可以使用类似PageRank的方法对SPARQL查询结果进行...

161得票25回答
更好的变长字符串相似度排名算法

我正在寻找一种字符串相似度算法,它在处理变长字符串时可以产生比通常建议的算法(如Levenshtein距离、Soundex等)更好的结果。 例如,对于给定的字符串A:“Robert”, 那么字符串B:“Amy Robertson” 将会是一个比 字符串C:“Richard” 更好的匹...

10得票2回答
递归查询中不允许使用聚合函数。是否有其他方法可以编写此查询?

TL;DR:我无法编写一个在其递归部分中不使用聚合函数的递归Postgres查询。是否有其他方法来编写下面显示的递归查询? 假设我们有一些体育运动:CREATE TABLE sports (id INTEGER, name TEXT); INSERT INTO sports VALUES ...