如何测量两个字符串序列之间的相似度百分比?
我有两个文本文件,文件中写有以下字符串序列:
第一个文件:
AAA BBB DDD CCC GGG MMM AAA MMM
第二个文件:
BBB DDD CCC MMM AAA MMM
如何通过字符串顺序来衡量这两个文件之间的相似性?
例如,在上面的示例中,由于字符串的顺序相同,因此两个文件具有相似性,但是某些字符串在文件2中缺失。什么算法最适合解决此问题,以便我可以衡量两个文件中字符串顺序的相似程度而不是字符串频率?
我有两个文本文件,文件中写有以下字符串序列:
第一个文件:
AAA BBB DDD CCC GGG MMM AAA MMM
第二个文件:
BBB DDD CCC MMM AAA MMM
如何通过字符串顺序来衡量这两个文件之间的相似性?
例如,在上面的示例中,由于字符串的顺序相同,因此两个文件具有相似性,但是某些字符串在文件2中缺失。什么算法最适合解决此问题,以便我可以衡量两个文件中字符串顺序的相似程度而不是字符串频率?