Databricks和Spark有什么区别？

Question

Databricks和Spark有什么区别？

databaseapache-sparkdata-scienceazure-databricks

9

我试图清晰地了解它们之间的相互关系，以及是否总是需要同时使用它们。如果您能给出每个术语的非技术定义或解释，我会很感激。

请不要粘贴这两个术语的技术定义。我不是软件工程师、数据分析师或数据工程师。

- StVnilor

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- vilalabinot · Accepted Answer

这两段文字综合概括了它们的区别（来自this来源）：

Spark是一个通用的集群计算系统，可用于多种目的。Spark提供了类似于MapReduce的接口，但允许进行更复杂的操作，如查询和迭代算法。Databricks是建立在Spark之上的工具。它允许用户开发、运行和共享基于Spark的应用程序。

Spark是一个强大的工具，可用于分析和处理数据。它是一个开源的集群计算框架，用于以更快速和高效的方式处理数据。Databricks是一家利用Apache Spark作为平台帮助企业加速工作的公司。Databricks可以用于创建集群、运行作业和创建笔记本。它可以用于共享数据集，并与其他工具和技术进行集成。Databricks是一个有用的工具，可以快速高效地完成任务。

简单来说，Databricks有一个基于Apache Spark构建的工具，但它以直观的方式包装和操作它，使人们更容易使用。

原则上讲，这与Hadoop和AWS EMR之间的区别是相同的。