我有一组字符串,想要在文件中查找。如果我的列表中的字符串与文件中的完全匹配,那么这将是相当简单的。不幸的是,名称可能存在拼写错误和变体。以下是其中一些字符串的示例:
List File
B-Arrestin Beta-Arrestin
Becn-1 BECN 1
CRM-E4 CRME4
请注意,尽管这些字符串不同,但每对字符串都应计算为匹配。 我知道我可以将每种变化分类并编写单独的正则表达式来识别匹配,但这很麻烦,我手动查找匹配可能更好。我认为解决我的问题的最佳方案应该是一种表达式,它说:
“完全匹配此字符串,但仍将其视为匹配,如果存在X个不匹配的字符”
是否存在这样的东西?是否有其他方法匹配不完全相同但接近的字符串?
B-Ecn-1
,那么它也会被(我认为是错误地)标记为匹配项。您能否列出前缀及其缩写的列表以涵盖第一种情况,例如 Beta -> B? - ThisSuitIsBlackNot