多年来,由于拼写错误,我们的数据表中添加了一些重复项。举个例子,有人将名字拼错了,把O'leary写成了Oleary。我们的系统认为这是一个完全不同的名字,并且没有任何投诉,但在大多数情况下,这是输入两次相同联系人的结果(我没有建造这个系统)。
现在我想做的是删除所有这些重复项,但我很难编写一个查询来显示它们。我尝试使用UTL_MATCH进行实验,并编写了一个查询,如果我提供名称,它将返回所有类似的名称。
现在我想做的是删除所有这些重复项,但我很难编写一个查询来显示它们。我尝试使用UTL_MATCH进行实验,并编写了一个查询,如果我提供名称,它将返回所有类似的名称。
select first_name from customers
where UTL_MATCH.edit_distance_similarity(first_name,'Oleary') > 60
order by first_name;
但我希望建立一个查询,可以自动返回所有可能的重复项,而不必提供名称。请问有人能指导我正确的方向吗?