我的数据是用专有格式存储的,但Apache Drill并不支持该格式。请问有没有关于如何编写自己的存储插件来处理此类数据的教程?
我的数据是用专有格式存储的,但Apache Drill并不支持该格式。请问有没有关于如何编写自己的存储插件来处理此类数据的教程?
这是一些应该在文档中提到但目前还没有的内容。界面并不太复杂,但查看现有插件并理解所有正在进行的操作可能会有些困难。
编写存储插件有两个主要组件,将信息公开给查询规划器和模式管理系统,然后实际上实现从数据源API到钻探记录表示的转换。
Kudu插件是最近添加的,并且是一个具有许多Drill可以利用的元素的存储系统的合理模型。我想指出的一件事是,如果您的存储系统不是分布式的,并且您只计划进行所有远程读取,则在组扫描中不必做太多关于亲和力/工作列表/分配的工作。如果我有时间,我将尝试撰写有关接口不同部分的文档,并可能编写有关现有插件之一的教程。