我有一个类似于 MySQL
的表:
ID, Col1, Col2, Col3, Col4, etc...
ID是一个主键,自表格创建以来一直在使用。
我想做的是删除除一个记录外其他所有列都相同的记录。
我有一个类似于 MySQL
的表:
ID, Col1, Col2, Col3, Col4, etc...
ID是一个主键,自表格创建以来一直在使用。
我想做的是删除除一个记录外其他所有列都相同的记录。
DELETE DupRows.*
FROM MyTable AS DupRows
INNER JOIN (
SELECT MIN(ID) AS minId, col1, col2
FROM MyTable
GROUP BY col1, col2
HAVING COUNT(*) > 1
) AS SaveRows ON SaveRows.col1 = DupRows.col1 AND SaveRows.col2 = DupRows.col2
AND SaveRows.minId <> DupRows.ID;
当然,你必须在所有三个位置上将col1和col2扩展到所有列。
编辑:我刚从我的脚本中提取了这段代码并重新测试了一下,在MySQL中执行。
DELETE t1
FROM table_name t1, table_name t2
WHERE
(t1.Col1 = t2.Col1 OR t1.Col1 IS NULL AND t2.Col1 IS NULL)
AND (t1.Col2 = t2.Col2 OR t1.Col2 IS NULL AND t2.Col2 IS NULL)
AND (t1.Col3 = t2.Col3 OR t1.Col3 IS NULL AND t2.Col3 IS NULL)
AND (t1.Col4 = t2.Col4 OR t1.Col4 IS NULL AND t2.Col4 IS NULL)
...
AND t1.ID < t2.ID;
RENAME TABLE [table w/ duplicates] TO [temporary table name]
创建一个与包含重复数据的原始表名相同的完全相同的表。
INSERT INTO [new table] SELECT DISTINCT * FROM [old table with duplicates]
删除临时表。
DELETE e1 FROM emp_tbl AS e1 JOIN emp_tbl AS e2 WHERE
e1.Col1=e2.Col1 AND e1.Col2=e2.Col2 AND e1.Col3=e2.Col3 AND e1.Col4=e2.Col4
AND e1.id < e2.id;
ALTER IGNORE TABLE tbl_1
ADD UNIQUE INDEX unq_idx(col1, col2, col3);
我不能保证它会在重复记录中保留第一条记录,但MySQL通常会这样做。
CREATE TEMPORARY TABLE #Table (Col1, Col2, Col3);
INSERT INTO #Table (Col1, Col2, Col3) SELECT DISTINCT Col1, Col2, Col3 FROM Table;
DELETE FROM Table;
INSERT INTO Table (Col1, Col2, Col3) SELECT Col1, Col2, Col3 FROM #Table;
DROP TABLE #Table;
你也可以这样做
Create table new_table{id, col1,col2,col3}
insert into new_table values(select distinct * from old_table)
drop table old_table
你可以使用一些函数(如Min,取决于数据库)来删除除一个之外的所有行。
delete from Table_Name
where Id not in
( select min(Id)
from Table_Name
group by ID, Col1, Col2, Col3, Col4);