我有一个字符串列表作为查询,还有几百个其他字符串列表。我想将查询与每个其他列表进行比较,并提取它们之间的相似度分数。
例如:
我现在做的事情,而且我对结果不满意,是对它们的绝对比较。
我找到了一个可能会对我有帮助的库fuzzywuzzy,但我想知道你是否有其他建议。
例如:
query = ["football", "basketball", "martial arts", "baseball"]
list1 = ["apple", "football", "basketball court"]
list2 = ["ball"]
list3 = ["martial-arts", "baseball", "banana", "food", "doctor"]
我现在做的事情,而且我对结果不满意,是对它们的绝对比较。
score = 0
for i in query:
if i in list1:
score += 1
score_of_list1 = score*100//len(list1)
我找到了一个可能会对我有帮助的库fuzzywuzzy,但我想知道你是否有其他建议。