在R中选择data.table的键

4

如何为data.table对象选择正确的键?

与RDBMS相似吗?我的第一个想法是查找有关RDBMS索引和键的一些文档。谷歌给出了这个有用的stackoverflow问题与Oracle相关。

那个答案中的考虑是否适用于data.tables?也许除了与UPDATE、INSERT或DELETE类型语句相关的考虑之外?我猜我们的data.tables对象不会真正以那种方式使用。

我试图通过使用文档和示例来理解这些内容,但我没有看到任何关于键选择的讨论。

PS:感谢@crayola首先向我介绍了 data.table包!

1个回答

2

我不确定这是否是一个非常有用的答案,但既然你在问题中提到了我,我还是会说出我的想法。但请记住,我自己也是一个data.table新手。

个人认为只有在明显有好处时才使用键,例如合并数据表,或者在似乎明确这样做将加速操作时(例如对变量进行重复子集操作)。 但据我所知,有时根本没有必要定义键;该软件包已经比没有键的data.frame更快。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接