我有一些Apache Parquet文件。我知道我可以在终端中执行parquet file.parquet
并在其中查看它。但是我想要一些GUI工具以更用户友好的格式查看Parquet文件。是否存在这样的程序?
有一个跨平台的Tad实用程序,可以打开Parquet文件,还可以对其进行透视并将其导出为CSV。它使用DuckDB作为后端。有关DuckDB页面的更多信息:
适用于Windows、Linux、MAC的GUI选项。
现在可以使用DBeaver来:
DBeaver利用DuckDB驱动程序对parquet文件执行操作。DuckDB还支持Projection和predicate pushdown等功能。
只需在Dbeaver中创建一个内存实例,然后像本文档所述那样运行查询。目前仅支持Parquet和CSV。
这里是一个Youtube视频,以相同方式进行解释- https://youtu.be/j9_YmAKSHoA
看看这个实用工具。适用于所有Windows版本:https://github.com/mukunku/ParquetViewer
有一个GUI工具可以查看Parquet以及其他二进制格式的数据,如ORC和AVRO。这是一个纯Java应用程序,因此可以在Linux、Mac和Windows上运行。有关详细信息,请查看Bigdata File Viewer。
它支持复杂的数据类型,如数组、映射、结构等。您还可以将读取的文件保存为CSV格式。
实际上,我发现了一些针对Windows 10的解决方案。然而,我正在使用Linux Mint 18,所以我想找一些Linux(或者理想情况下是跨平台的)图形界面工具。是否有其他图形界面工具可用?
https://www.channels.elastacloud.com/channels/parquet-net/how-about-viewing-parquet-files
JetBrains(IntelliJ,PyCharm等)有一个插件可以实现这个功能,如果你使用的是专业版:https://plugins.jetbrains.com/plugin/12494-big-data-tools