为什么有时候我在django.po语言文件中会得到一个fuzzy的项目。实际上,在我的项目中,fuzzy字符串项目是完全独特的。 #: .\users\views.py:81 .\users\views.py:101 #, fuzzy msgid "username or email" ms...
每次我向Django项目添加一些字符串时,我都会运行“django-admin.py makemessages -all”命令为所有语言环境生成.PO文件。 问题在于,即使我只添加了5个新字符串,makemessages命令也会将50个字符串标记为模糊,在.PO文件中,这给我们的本地化维护者...
我正在使用 Daitch-Mokotoff 算法和 Damerau-Levenshtein 算法来判断用户输入和应用程序中的值是否“相同”。 Levenshtein 距离是否应该被用作绝对值?如果一个单词有 20 个字母,距离为 4 就不算太糟糕。但如果这个单词只有 4 个字母…… 我现在...
我有一组 40,000 行 x 4 列的数据,需要将每一列与自己进行比较,以找到最接近的结果或最小的莱文斯坦距离。目的是为每一行获取一个“几乎相同”的副本。我用“adist”计算了一下,但速度似乎太慢。例如,对于只有一列的情况,将 5,000 行与整个数据集的 40,000 行进行比较,需要近...
我有一个包含x个字符串名称和它们关联ID的文件,基本上是两列数据。我想要的是一个相关表格,格式为x乘以x(对于问题数据,同时将其作为x轴和y轴),但是输出不是相关性,而是使用字符串名称作为输入的fuzzywuzzy库的函数fuzz.ratio(x,y)的输出结果。基本上是针对每个条目运行每个条...
我正在为winforms应用程序使用C#实现一个模糊日期控件。 模糊日期应该能够接受模糊值,例如: 去年六月 2小时前 2个月前 上周 昨天 去年 等等 是否有任何“模糊”日期时间选择器的示例实现? 欢迎提供任何实现此类控件的想法和灵感。 注:我知道这里here和here所讲述的...
我正在使用R语言,尝试在按年份和城市结构的数据集中通过人名进行匹配。由于存在一些拼写错误,因此无法进行精确匹配,所以我尝试使用agrep()函数进行模糊匹配。 数据集的一个样例如下: df <- data.frame(matrix( c("1200013","1200013","12...