108得票7回答
T-SQL中的Levenshtein距离

我对在T-SQL中计算Levenshtein距离的算法很感兴趣。

18得票5回答
Java:两个列表之间的区别

我的公司的猫牧应用程序追踪一队猫。定期地,它需要比较previousOrder和currentOrder(每个都是ArrayList<Cat>),并通知猫管理员任何更改。 每只猫都是独特的,并且在每个列表中只能出现一次(或者根本不出现)。大多数情况下,previousOrder和...

16得票2回答
使用后缀树进行近似子字符串匹配

本文讨论了近似子字符串匹配技术,它们利用后缀树来提高匹配时间。每个答案都涉及不同的算法。 近似子字符串匹配试图在字符串T中找到一个子串(模式)P,最多允许k次不匹配。 要学习如何创建后缀树,请点击这里。然而,一些算法需要额外的预处理。 我邀请大家添加新的算法(即使不完整)并改进答案。

22得票4回答
两个图之间的编辑距离

我在想,对于字符串,我们有字符串的Levenshtein距离(或编辑距离),那么对于图形是否有类似的东西呢? 我的意思是,是否有一种标量度量方法来确定将一个图G1转换为另一个图G2所需的原子操作数(节点和边缘插入/删除)。

7得票2回答
字符串的缩写相似度

在我的项目中,我有一个使用场景,需要将一个key字符串与许多字符串进行相似性比较。如果这个值大于某个阈值,我认为这些字符串与我的key相似,并且基于这个列表,我进行进一步的计算/处理。 我一直在探索模糊匹配字符串相似性的东西,这些东西使用基于编辑距离的算法,例如“levenshtein、ja...

12得票6回答
有没有一种编辑距离算法可以考虑"块置换"?

我在引号中使用了"块置换",因为我不知道该过程的技术术语是否存在或应该是什么。只要知道该过程是否有技术术语将非常有帮助。 维基百科编辑距离文章提供了该概念的一些良好背景知识。 通过考虑"块置换",我意思是Turing, Alan. 应该匹配Alan Turing 更紧密地匹配,而不是完全匹...

7得票1回答
如何在简体中文字符上计算Levenshtein距离?

我有两个查询: query1:你好世界 query2:你好 当我使用Python库Levenshtein运行此代码时: from Levenshtein import distance, hamming, median lev_edit_dist = distance(...

17得票5回答
转换文件树到另一个的最短操作序列

给定两个文件树A和B,是否有可能确定将A转换为B所必需的最短操作序列或短操作序列? 操作可以是: 创建一个新的空文件夹 创建一个带任何内容的新文件 删除文件 删除空文件夹 重命名文件 重命名文件夹 将一个文件移动到另一个现有文件夹中 将一个文件夹移动到另一个现有文件夹中 当A和B拥有...

29得票1回答
基于字符串比较的相似性分数在R语言中(编辑距离)

我正在尝试基于两个字符串之间的比较来分配相似性分数。在R中是否有这样的功能?我知道SAS中有一个名为SPEDIS的函数可以实现此功能。请告诉我在R中是否有类似的函数。

8得票1回答
字符串距离,仅计算置换

可能重复: 重复的问题: 计算将一个排列转换为另一个排列所需的交换次数 我正在寻找一种算法,它可以计算某种字符串距离,其中唯一允许的操作是交换两个相邻字符。例如: 字符串1:“mother” 字符串2:“moterh” 距离:2(首先将“h”与“e”交换并得到“motehr”,然后将“h...