我正在寻找Apache Arrow API 的有用文档或示例。是否有人能指向一些有用的资源?我只找到了一些博客和JAVA文档(并没有太多内容)。
从我所了解的信息来看,它是用于快速分析的内存列数据库标准。是否可能将数据加载到arrow内存中并对其进行操作?
我正在寻找Apache Arrow API 的有用文档或示例。是否有人能指向一些有用的资源?我只找到了一些博客和JAVA文档(并没有太多内容)。
从我所了解的信息来看,它是用于快速分析的内存列数据库标准。是否可能将数据加载到arrow内存中并对其进行操作?
@Test
public void test() throws Exception {
BufferAllocator allocator = new RootAllocator(Integer.MAX_VALUE);
File testInFile = testFolder.newFile("testIn.arrow");
File testOutFile = testFolder.newFile("testOut.arrow");
writeInput(testInFile, allocator);
String[] args = {"-i", testInFile.getAbsolutePath(), "-o", testOutFile.getAbsolutePath()};
int result = new FileRoundtrip(System.out, System.err).run(args);
assertEquals(0, result);
validateOutput(testOutFile, allocator);
}
MessageType parquet = converter.fromArrow(allTypesArrowSchema).getParquetSchema();
Schema arrow = converter.fromParquet(supportedTypesParquetSchema).getArrowSchema();
BufferAllocator
或RootAllocator
是什么并不是显而易见的。也没有任何“操作数据”的证据... - Ramón J Romero y Vigilnew SchemaConverter()
时会出现ClassNotFoundException,尽管我在安装它时可能做错了什么,因为我找不到任何发布的parquet-arrow构件)。 - Shastick