我正在编写一个简单的工具来检查重复文件(即具有相同数据的文件)。该机制是使用sha-512算法为每个文件生成哈希,然后将这些哈希存储在MYSQL数据库中。我将哈希存储在二进制(64)唯一非空列中。每行将具有唯一的二进制哈希值,并用于检查文件是否重复。
-- 我的问题是 -- 1. 我可以在二进制列上使用索引吗?我的默认表排序规则是latin1 - 默认排序规则? 2. 为了获得高性能,应该使用Btree还是Hash索引机制?我需要每秒更新或添加100行。 3. 我应该注意哪些其他事项以获取最佳性能?
-- 我的问题是 -- 1. 我可以在二进制列上使用索引吗?我的默认表排序规则是latin1 - 默认排序规则? 2. 为了获得高性能,应该使用Btree还是Hash索引机制?我需要每秒更新或添加100行。 3. 我应该注意哪些其他事项以获取最佳性能?