20得票3回答
如何在SQL Server 2012中添加行号列

我正在尝试向现有表格添加新列,其中该值为行号/排名。我需要一种方法来生成行号/排名值,并且我还需要限制受影响的行--在这种情况下,是一个字符串中包含子字符串的情况。 目前我的代码:UPDATE table SET row_id=ROW_NUMBER() OVER (ORDER BY col1...

18得票4回答
数据框架:如何添加一个列,其值为现有列的分位数编号/排名?

我有一个DataFrame,其中包含一些列。我想添加一个新列,其中每个行的值是现有列的分位数排名。 我可以使用DataFrame.rank对列进行排名,但然后我不知道如何获得该排名值的分位数,并将此分位数作为新列添加。 例如:如果这是我的DataFramedf = pd.DataFrame...

15得票1回答
高效确定列表的“排序程度”,例如Levenshtein距离

我正在研究排名算法,并希望在给定排序列表和该列表的一些排列的情况下,计算两个排列之间的某个距离。对于Levenshtein距离的情况,这相当于计算序列与该序列的排序副本之间的距离。此外,例如,“反转距离”也存在,其线性时间算法在此处详细说明,我正在努力实现它。 是否有人知道反转距离的现有Py...

13得票3回答
SQL over子句 - 将分区细分为编号的子分区

我面临一个难题,多次遇到过,但从未能找到有效的解决方案。想象一下,我有一张大表格,其中包含有关银行账户及其可能的借贷周转情况的数据:AccountId DebitCredit AsOfDate --------- ----------- ---------- aaa d ...

12得票1回答
使用派生表计算SQL Server的ROW_NUMBER() OVER()

在一些其他的数据库中(例如DB2或使用ROWNUM的Oracle),我可以省略排名函数的OVER()子句中的ORDER BY子句。例如: ROW_NUMBER() OVER() 当与有序派生表一起使用时,这尤其有用,例如: SELECT t.*, ROW_NUMBER() OVER()...

8得票2回答
基于以下标准,计算电子商务网站上产品排名的算法/公式:

我一直在研究算法和公式,以便为我电子商务网站上的产品找出一个得分。基本上,我想计算某种得分来排名产品,当用户搜索时。 我将介绍一些关于定义计算排名的标准的背景: - 产品点击率 - 产品浏览量 - 产品转换率 - 产品评分(由用户提供) - 与用户提供的搜索字符串相关性 理想情况下,我希...

7得票4回答
排列数组值,包括潜在的重复值,并跳过某些位置,如果存在平局。

我正在处理与大学生考试成绩相关的数据库数据。基本上,我从MySQL数据库中检索记录,并在任何给定时间只检索一个班级。我想要对成绩最高的学生进行排名,将最高者排在第 1 名。 下面是一张示意图; Marks: 37, 92, 84, 83, 84, 65, 41, 38, 38, 84. ...