Apache Parquet的GUI工具用于查看/编辑

25

我有一些Apache Parquet文件。我知道我可以在终端中执行parquet file.parquet并在其中查看它。但是我想要一些GUI工具以更用户友好的格式查看Parquet文件。是否存在这样的程序?


1
请查看我的答案这里,了解如何使用DBeaver查看parquet文件。 - robertspierre
8个回答

20

1
这正是我正在寻找的,谢谢 @Gabe。它也适用于macOS 2! - Lawerance
1
太棒了!在macOS Ventura 13.1上运行以查看parquet文件。 - aware

18

适用于Windows、Linux、MAC的GUI选项。

现在可以使用DBeaver来:

  • 查看parquet数据
  • 查看元数据和统计信息
  • 在一个或多个文件上运行SQL查询(支持glob表达式)
  • 生成新的parquet文件。

DBeaver利用DuckDB驱动程序对parquet文件执行操作。DuckDB还支持Projection和predicate pushdown等功能。

只需在Dbeaver中创建一个内存实例,然后像本文档所述那样运行查询。目前仅支持Parquet和CSV

这里是一个Youtube视频,以相同方式进行解释- https://youtu.be/j9_YmAKSHoA

enter image description here


8

1
谢谢您的建议,我已经尝试过了。但是对于像JSON这样具有复杂结构的Parquet文件,这种工具并不适用。它只适用于像CSV这样结构简单的Parquet文件。 - Francesco Marchitelli
我也尝试了这个方法。在我的Parquet文件中,它似乎会通过在第一列插入一个错误的0值并将所有正确的值向下移动一行来破坏每2行。我尝试了BigDataFileViewer,它可以正确查看我的文件,但只有在您打开文件两次时才能这样做。第一次它会抛出关于尾部中不正确的魔数的错误,但是当您第二次打开文件时,它似乎可以正常工作。模式和表数据似乎是正确的。 - Roochiedoor
@Roochiedoor也许可以在仓库上开一个问题单,并提供示例文件? - Sal
@Sal 刚刚在 https://github.com/mukunku/ParquetViewer/issues/20 上提交了一个问题单。 - Roochiedoor
我喜欢它,它快速简单,我只想(预览)表格parquet文件。 - citynorman

4

有一个GUI工具可以查看Parquet以及其他二进制格式的数据,如ORCAVRO。这是一个纯Java应用程序,因此可以在Linux、Mac和Windows上运行。有关详细信息,请查看Bigdata File Viewer

它支持复杂的数据类型,如数组、映射、结构等。您还可以将读取的文件保存为CSV格式。

enter image description here


3
目前这个工具需要调整Java设置才能使用,因为似乎缺少JavaFX。请参考 https://github.com/Eugene-Mark/bigdata-file-viewer/issues/25 。 - Arigion

4

1
有没有类似的东西适用于Windows 8? - DJo

2

1

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接