数据仓库 (DW) 是从多个来历搜集和办理数据的进程,意图是使企业具有有价值的业务洞察力。数据仓库最常用于集成和分析来自不同来历的公司数据。数据仓库是为数据处理和陈述而规划的 BI 体系的中心。

许多公司正在将他们的数据仓库转移到云端,由于本地数据仓库容易出现存储容量不灵活、技能问题以及由于硬件保护需求而导致的贵重运营费用。

云数据仓库是在公共云上运转的托管数据库,用于分析、可扩展性和易用性。

使用依据云的数据仓库已成为常态,企业现在可以拜访简直无限的核算才能和存储空间。

图片

1、为什么使用云数据仓库

依据云的数据仓库使商业智能团队可以经过改善的拜访、可扩展性和速度供给更快、更好的洞察力,使他们可以专心于运营业务,而不是办理大量的核算机。

1)安全

传统上,本地数据仓库被认为比云数据仓库更安全。可是,企业现在意识到云数据更安全且保护本钱更低。

云数据不会分布在多个服务器上。因而,云安全专家可以创建和迭代精确的数据保护措施。此外,多因素认证等云加密技能使区域和资源之间的数据传输非常安全。最终,大多数云数据仓库都包含虚拟专用网络 (VPN),这进一步限制了数据走漏的危险。

2)数据拜访

经过将数据存储在云上,企业可以为分析师供给来自各种来历的实时数据,使他们可以更快地进行最佳的分析作用。

3)可扩展性

扩展云数据仓库比扩展本地体系更快且本钱更低,由于它不需求企业购买新硬件(并且可能会供应过多或缺乏),并且可以依据需求主动完成。

4)性能

与典型的本地数据仓库相比,在云数据仓库中可以更快地履行查询,从而下降本钱。

5)本钱

随着公司数据搜集的添加,本地数据仓库变得更加贵重。扩展业务智能程序会大大添加费用,由于本地核算和存储不能单独获取。

另一方面,数据仓库团队可以使用云数据仓库购买他们需求的核算才能和存储空间。此外,云数据仓库不需求网络、服务器机房或任何其他基础设施。

图片

2、云数据仓库的才能

每个大型公共云供给商都有自己的云数据仓库版别:BigQuery 由 Google 供给,Redshift 由 Amazon 供给,Azure SQL 数据仓库由 Microsoft 供给。

例如,Snowflake 有一个云选项,它经过在公共云上运转但独立保护的服务供给相同的功用。云供货商或数据仓库供给商为这些服务中的每一项供给以下开箱即用的功用:

  • 数据办理和存储:数据保存在依据云的文件体系中
  • 这个世界上没有“版别”或“软件更新”之类的东西
  • 容量办理:扩展(或收缩)企业的数据足迹很简单

3、挑选云数据仓库服务的因素

1)体系结构

云数据仓库规划分为两组。许多传统的部署架构都是依据集群的,例如 Amazon Redshift 和 Azure SQL 数据仓库。集群云数据仓库通常是集群化的 Postgres 衍生产品,经过调整后可以作为云服务运转。

另一种无服务器规划是最近才出现的。Google BigQuery 和 Snowflake 便是很好的例子。相比之下,无服务器云数据仓库使数据库集群“不行见”或在多个客户之间同享。每种架构都有其长处和缺点。

2)云定价

在每种情况下,企业都需求依据其保存的数据量支付一定的费用。可是,核算的定价是不同的。

例如,Google BigQuery 和 Snowflake 依据扫描的数据量或消耗的核算时间供给按需定价。Amazon Redshift 和 Azure SQL 数据仓库都依据集群中节点的数量或类型对资源收费。

两种定价战略各有利弊。按需模型只对企业使用的内容收费,这样的方法使预算存在问题,由于无法预测用户数量以及他们将履行的查询的数量。

4、总结

云数据仓库是游戏规则的改动者,也是数据仓库的标志性事情。如果使用妥当,云数据仓库可能会大大下降企业的运营费用,并使得企业随时掌握业务需求。

GitHub: github.com/yunionio/cl…

官网地址:www.yunion.cn/