我希望你能为我翻译一下这段话。需要进行“准实时”的数据分析(类似于OLAP),使用HDFS中的数据。我的研究表明,相比Apache Hive,这三个提到的框架都有显著的性能提升。是否有人对其中任意一个框架有实际经验?不仅涉及性能,还包括稳定性方面的考虑。
Impala目前表现良好,并且有些人在使用它,但我对另外两个工具并不太有信心。所有这些工具都很好,但只有在您尝试将其应用于您的数据和处理需求后,才能进行公正的比较。但根据我的经验,Impala目前是最好的选择。我并不是说其他工具不好,但它们还没有足够的成熟度。但如果您希望将其与已运行的Hadoop集群(例如Apache的Hadoop)一起使用,您可能需要进行一些额外的工作,因为几乎每个人都将Impala用作CDH功能。
注意:所有这些都基于我的经验。如果您发现有错误或不适当之处,请告诉我。欢迎评论和建议。我希望这回答了您的一些疑问。