Azure SQL 数据仓库 DWU 与 Azure SQL DTU 的比较

6
我正在考虑从Azure SQL迁移到Azure SQL数据仓库。它似乎提供了我们需要的一些功能,但是价格对于刚开始时是一个问题。100 DWU数据仓库的价格($ 521 /月)比看似相当的100 DTU Azure SQL S2层级($ 150 /月)要高得多。
为确保我在进行苹果与苹果的比较,有人能否解释一下DWU与DTU之间的区别(假设使用单个数据库的基本配置)?
编辑:对于每个倾向于回答Azure SQL DW和Azure SQL不可比较,因此比较DTU和DWU毫无意义的人:那么如何(谈论迁移)到DW才有意义?

1
会尝试获取更多信息,但 DTU 不等于 DWU。1 个 DWU 可以处理比 1 个 DTU 更多的数据。数据仓库是 Azure 上的大数据 SQL 解决方案。Azure SQL 无法扩展到千兆字节或拍字节级别。 - Dan Ciborowski - MSFT
1
SQL DB和SQL DW之间最大的区别在于,SQL DW是为大规模并行处理而设计的,这将导致比SQL DB更好的性能。此外,您还可以在SQL DW不使用时(夜间/周末)暂停它以节省一些费用。https://azure.microsoft.com/en-us/documentation/articles/sql-data-warehouse-overview-what-is/ - ckarst
谢谢,我知道这些功能的差异,只是想比较与SQL数据库大致相当的功能子集的价格。 - Andrei
3个回答

11

值得一提的是,就服务器容量而言,1 DWU = 7.5 DTU

当您查看为DW实例配置了DW实例的服务器时:

  • 100 DWU实例消耗750 DTU的服务器容量
  • 400 DWU实例消耗3000 DTU的服务器容量

尽管这些信息很有趣,但在比较价格方面可能并不是非常有用,因为DW定价仅基于DWU,而Azure SQL定价则是基于DTU和数据库大小的组合。


谢谢,我认为这实际上很有用,因为它以一种间接的方式显示了两个单位之间的相关性。 - Andrei
在服务器上查看N大小的DWU实例消耗的DTU配额是有趣且有用的。例如,目前情况下,100 DWU Gen2 Azure SQL Data Warehouse 在服务器上分配了900个DTU。 - Colin K

3
您不能以同样的工作负载比较它们,而且真的不应该这样做;它们是基于完全不同的架构设计的不同东西。因此,DTU和DWU不可比较。此外,��对技术差异深入了解到什么程度?高级功能并不是主要问题,细节可能会破坏您的应用程序(例如:您是否可以接受有限的TSQL表面积或事务隔离级别?)。
Azure SQL DB旨在成为通用的DB即服务。除了一些功能缺口外,您应将Azure SQL DB视为与SQL Server相同的功能,减少了很多管理任务,使用不同的编程模型。非常适合OLTP应用程序和大多数报告应用程序(或混合),但不适合针对非常大的数据集进行复杂分析应用程序(无法在SQL DB中存储那么多)。
SQL DW旨在用于数据仓库、分析类型的工作负载。其MPP架构特别适合处理对非常大的数据集进行复杂查询。对于具有许多小型或单例查询的典型OLTP应用程序来说,它的性能不佳,特别是当它是插入、更新和删除操作的混合时。如果您获得了SQL DW的试用实例,您可以轻松测试和验证您的工作负载相对于在SQL DB上的当前情况的行为。
SQL DW还有一些限制,例如TSQL表面积、类型、并发性、隔离级别(几乎所有OLTP应用程序都会出问题),等等......所以请务必查阅文档以获取整个画面,并评估可行性。它可能很好地工作,但我怀疑如果您正在运行OLTP工作负载,它不是最佳解决方案。报告/分析类型的工作负载可能会在SQL DW中找到一个幸福的家园。

好的,那我们就不谈论比较了。DWU是什么?它是如何定义的?如果我使用100DWU,会得到什么样的性能(例如TPS、吞吐量等)?此外,性能是否会根据分配的DWU数量呈线性增长? - Andrei
SQL DW 目前仍处于预览阶段,因此有关细节信息比较稀缺。Load Rate 和 Scan Rate 是重点关注的区域;这是数据仓库工作负载的常用度量标准。查询性能是另一个重要指标,但很难概括,因为这完全取决于查询和架构。然而,可以通过比较现有平台的扫描和加载速率与 SQL DW 来得出合理的查询性能估计值。更多详细信息请参见:https://github.com/Azure/azure-content/blob/master/articles/sql-data-warehouse/sql-data-warehouse-overview-performance.md - SQLmojoe

0

找出你需要的最好方法是查看当前的IO需求。数据仓库往往是IO猪,因此通过最大化IO吞吐量来进行优化。DWU计算器网站将引导您捕获磁盘指标并估计您需要多少DWU来满足工作负载。

http://dwucalculator.azurewebsites.net/


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接