这更像是一个概念性问题,因为我正在计划如何最好地实现我们的目标。
我有一个postgresql / postgis表格,它有5列。 我将每隔10分钟左右通过复制命令从csv文件向数据库插入/添加数据。 由于可能会有一些重复的数据行,因此我希望将数据从csv文件复制到postgresql表格中,但是防止来自csv文件的任何重复条目进入表格。 如果这三个列"纬度","经度"和"时间"都相等,那么就意味着该条目是重复的。 我应该从所有三列中构建组合键吗? 如果我这样做,尝试将csv文件复制到数据库时是否只会出现错误?我将自动复制csv文件,因此我希望它可以继续复制其余不是重复项的文件,并且不要复制重复项。 有没有方法可以做到这一点?
另外,当然,我希望以最有效的方式查找重复项。 我不需要在整个表格(将非常大)中查找重复项...只需通过行上的时间戳查找过去约20分钟即可。 我已使用时间列索引了数据库。
感谢您的任何帮助!
我有一个postgresql / postgis表格,它有5列。 我将每隔10分钟左右通过复制命令从csv文件向数据库插入/添加数据。 由于可能会有一些重复的数据行,因此我希望将数据从csv文件复制到postgresql表格中,但是防止来自csv文件的任何重复条目进入表格。 如果这三个列"纬度","经度"和"时间"都相等,那么就意味着该条目是重复的。 我应该从所有三列中构建组合键吗? 如果我这样做,尝试将csv文件复制到数据库时是否只会出现错误?我将自动复制csv文件,因此我希望它可以继续复制其余不是重复项的文件,并且不要复制重复项。 有没有方法可以做到这一点?
另外,当然,我希望以最有效的方式查找重复项。 我不需要在整个表格(将非常大)中查找重复项...只需通过行上的时间戳查找过去约20分钟即可。 我已使用时间列索引了数据库。
感谢您的任何帮助!