我很难理解在Spark的上下文中,Avro、Kryo和Parquet到底是做什么的。它们都与序列化有关,但我见过它们一起使用,所以它们不能做同样的事情。
Parquet自称为列式存储格式,我有点明白,但当我保存一个Parquet文件时,Arvo或Kryo是否会参与其中?或者它们只在Spark作业期间相关,例如在洗牌或溢出到磁盘期间通过网络发送对象?Arvo和Kryo有何不同,当你将它们一起使用时会发生什么?
Parquet自称为列式存储格式,我有点明白,但当我保存一个Parquet文件时,Arvo或Kryo是否会参与其中?或者它们只在Spark作业期间相关,例如在洗牌或溢出到磁盘期间通过网络发送对象?Arvo和Kryo有何不同,当你将它们一起使用时会发生什么?