我需要搜索一个相当长的字符串以查找CPV(通用采购词汇)代码。
目前,我使用简单的for循环和str.find()来完成这个任务。
问题是,如果CPV代码以稍微不同的格式列出,这个算法就无法找到它。
最有效的搜索所有不同迭代代码的方法是什么?是简单地重新格式化多达10,000个CPV代码中的每一个,并对每个实例使用str.find()吗?
不同格式的示例可能如下所示:
30124120-1
301241201
30124120 - 1
30124120 1
30124120.1
etc.
Thanks :)
r
字符串前缀而不是\\\t
。 - Fred Foo