假设我有两个列表,每个列表都包含一个共同超集的不同子集,是否有算法可以给我提供相似度测量?
例如:
A = { John,Mary,Kate,Peter },B = { Peter,James,Mary,Kate }
这两个列表有多相似?请注意,我不知道共同超集的所有元素。
更新: 我表述不清,并且可能以草率的方式使用了“set”一词。我很抱歉。 澄清:顺序很重要。 如果相同的元素占据列表中相同的位置,则该元素的相似性最高。 相同元素之间的距离越大,则相似性越低。 如果元素仅存在于其中一个列表中,则相似性甚至更低。
我甚至可以添加额外的维度,较低的索引具有更大的价值,因此a[1]==b[1]比a[9]==b[9]更有价值,但这主要是因为我很好奇。