10得票3回答
FuzzyWuzzy错误:警告:root:应用处理器将输入查询缩减为空字符串,所有比较得分都为0。 [查询:'/']

试图编写一段代码,它将比较多个文件并返回多个选项中最高模糊比率。 问题是我收到了一个错误消息: 警告:root:应用的处理器将输入查询缩小为空字符串,所有比较得分都将为0。 [查询:'/']警告:root:应用的处理器将输入查询缩小为空字符串,所有比较得分都将为0。 [查询:'.'] 导出的文...

9得票1回答
将数据框中的每一行与所有行进行比较,并将结果保存在列表中,逐行处理。

我会尽力进行翻译,以下是您需要翻译的内容:我尝试使用 fuzzywuzzy.fuzzy.partial_ratio() >= 85 将每一行与 pandas dataframe 中的所有行进行比较,并将结果写入每一行的列表中。 示例: df = pd.DataFrame({'id':...

8得票5回答
找不到名为fuzzywuzzy的模块。

我用pip为Python3安装了fuzzywuzzy。当我执行pip list时,我看到: fuzzywuzzy (0.8.1) 然而,当我尝试导入时,出现了错误。 Python 3.4.0 (default, Jun 19 2015, 14:20:21) [GCC 4.8.2] on...

8得票2回答
比FuzzyWuzzy更好的方法?

我正在使用fuzzywuzzy得到一个结果,但效果不如预期。如果中间多了一个单词,由于Levenshtein距离的影响,分数会降低。 例如: from fuzzywuzzy import fuzz score = fuzz.ratio('DANIEL CARTWRIGHT', 'DANI...

7得票2回答
改进Fuzzywuzzy-在两个列表中匹配名称

我的要求是找到两个列表中匹配的名称。其中一个列表有400个名称,第二个列表有90000个名称。我得到了想要的结果,但处理时间超过了35分钟。显然,这里有两个循环,所以它需要O(N*N)的操作次数,这是瓶颈所在。我已经从两个列表中删除了重复项。您能帮忙改进吗?我查看了许多其他问题,但不知何故无法...

7得票2回答
Python中的名称匹配

我们有一个第三方“工具”,可以查找相似的名称,并为两个名称之间分配相似度分数。 我应该尽可能地模仿该工具的行为。 在互联网上搜索后,尝试使用距离方法。使用了fuzzywuzzy来实现。 matches = process.extractBests( name, choic...