我正在寻找一种搜索文本字段以识别可能相似的行的方法,以便确定它们是否是应该合并的重复项。例如,如果我的数据看起来像这样:
MyText_Column
1. Bob 2. Bobby 3. Robert 4. Jane 5. Janey 6. Janie 7. Joe 8. John 9. Johnathan
GROUP BY 不起作用,因为没有一个值完全相同,但如果我能有一个查询,返回一个列表,其中包含一行类似的可能性,那就太好了。也许有更好的布局,但我想象中的结果如下:
Query Result
Search Compare Likely_Match
1. Bob Bobby 96% 2. Bob Robert 12% 3. Bob Jane 0% 4. Bob Janey 0% ...... 8. Jane Janey 87% 9. Jane Janie 69% 10. Jane Joe 12%
然后,有了这样的结果,我可以按照可能性进行排序,并进行视觉扫描,以确定结果是否为重复项。
MyText_Column
1. Bob 2. Bobby 3. Robert 4. Jane 5. Janey 6. Janie 7. Joe 8. John 9. Johnathan
GROUP BY 不起作用,因为没有一个值完全相同,但如果我能有一个查询,返回一个列表,其中包含一行类似的可能性,那就太好了。也许有更好的布局,但我想象中的结果如下:
Query Result
Search Compare Likely_Match
1. Bob Bobby 96% 2. Bob Robert 12% 3. Bob Jane 0% 4. Bob Janey 0% ...... 8. Jane Janey 87% 9. Jane Janie 69% 10. Jane Joe 12%
然后,有了这样的结果,我可以按照可能性进行排序,并进行视觉扫描,以确定结果是否为重复项。