得票数最多 'fuzzywuzzy' 问题 - 第2页

关联标签

10得票3回答

FuzzyWuzzy错误：警告：root：应用处理器将输入查询缩减为空字符串，所有比较得分都为0。 [查询：'/']

试图编写一段代码，它将比较多个文件并返回多个选项中最高模糊比率。问题是我收到了一个错误消息：警告：root：应用的处理器将输入查询缩小为空字符串，所有比较得分都将为0。 [查询：'/']警告：root：应用的处理器将输入查询缩小为空字符串，所有比较得分都将为0。 [查询：'.'] 导出的文...

pythonpython-3.xfuzzy-comparisonfuzzywuzzy

9得票1回答

将数据框中的每一行与所有行进行比较，并将结果保存在列表中，逐行处理。

我会尽力进行翻译，以下是您需要翻译的内容：我尝试使用 fuzzywuzzy.fuzzy.partial_ratio() >= 85 将每一行与 pandas dataframe 中的所有行进行比较，并将结果写入每一行的列表中。示例： df = pd.DataFrame({'id':...

pythonpandasdata-analysisfuzzywuzzy

8得票5回答

找不到名为fuzzywuzzy的模块。

我用pip为Python3安装了fuzzywuzzy。当我执行pip list时，我看到： fuzzywuzzy (0.8.1) 然而，当我尝试导入时，出现了错误。 Python 3.4.0 (default, Jun 19 2015, 14:20:21) [GCC 4.8.2] on...

pythonpython-3.xversionfuzzywuzzy

8得票2回答

比FuzzyWuzzy更好的方法？

我正在使用fuzzywuzzy得到一个结果，但效果不如预期。如果中间多了一个单词，由于Levenshtein距离的影响，分数会降低。例如： from fuzzywuzzy import fuzz score = fuzz.ratio('DANIEL CARTWRIGHT', 'DANI...

pythonfuzzy-searchfuzzywuzzy

7得票2回答

改进Fuzzywuzzy-在两个列表中匹配名称

我的要求是找到两个列表中匹配的名称。其中一个列表有400个名称，第二个列表有90000个名称。我得到了想要的结果，但处理时间超过了35分钟。显然，这里有两个循环，所以它需要O(N*N)的操作次数，这是瓶颈所在。我已经从两个列表中删除了重复项。您能帮忙改进吗？我查看了许多其他问题，但不知何故无法...

pythonperformancetimelong-integerfuzzywuzzy

7得票2回答

Python中的名称匹配

我们有一个第三方“工具”，可以查找相似的名称，并为两个名称之间分配相似度分数。我应该尽可能地模仿该工具的行为。在互联网上搜索后，尝试使用距离方法。使用了fuzzywuzzy来实现。 matches = process.extractBests( name, choic...

pythonfuzzywuzzyname-matching