Snowflake使用Python来对立Teradata、Google BigQuery和AWS Redshift
Snowflake的更新包含在Snowpark上引进对Python的支撑,数据拜访能力,以及用于内部存储的外部表
根据云计算的数据库房公司Snowflake周二在其年度Snowflake峰会上推出了一套新的东西和集成,以对立Teradata等对手公司,以及谷歌BigQuery和亚马逊Redshift等服务。
这些新功用包含数据拜访东西和公司的Snowpark使用开发系统对Python的支撑,首要针对数据科学家、数据工程师和开发人员,目的是加速他们的机器学习之旅,从而加快使用开发。
一年前推出的Snowpark是一个数据结构式的开发环境,旨在让开发人员以无服务器的方法将他们喜爱的东西部署到Snowflake的虚拟库房计算引擎。对Python的支撑正在揭露预览中。
Snowflake产品高档副总裁Christian Kleinerman说:”Python可能是咱们从客户那里听到的要求最多的一项功用”。
对Python的需求是有道理的,由于它是数据科学家的首选言语,剖析家们说。
“Constellation Research的首席剖析师Doug Henschen说:**”**Snowflake实际上在这方面正在迎头赶上,由于竞争对手包含Teradata、Google BigQuery和Vertica已经有Python支撑。
在峰会上宣布的一项更新中,该公司表明,它正在为使用开发和迭代添加Streamlit集成。Streamlit是一个开源的Python使用结构,针对机器学习和数据科学工程团队,协助可视化,改变和共享数据,在3月被Snowflake收购。
dbInsights首席剖析师Tony Baer表明,此次整合将答使用户留在Snowflake环境中,不只能够拜访、保护和管理数据,还能够开发数据科学使用程序来建模和剖析数据。
Snowflake推出与Python相关的集成服务
其他一些与Python相关的整合包含Snowflake Worksheets for Python、Large Memory Warehouses和SQL Machine Learning。
Snowflake Worksheets for Python是私家预览版,旨在让企业在该公司根据网络的界面(被称为Snowsight)中开发管道、机器学习模型和使用程序,该公司表明,它具有代码自动完结和自定义逻辑生成等能力。
为了协助数据科学家和开发团队执行内存密集型操作,如特征工程和大型数据集的模型训练,该公司说它正在开发一个名为大内存库房的功用。
现在处于开发阶段,大内存库房将通过与Anaconda数据科学渠道的整合为Python库提供支撑,它弥补说。
“多个对手是能够装备的,以支撑大内存库房以及Python函数和言语支撑,所以这是Snowflake跟上商场的需求,”Henschen说。
Snowflake也在提供SQL机器学习,从时刻序列数据开端,在私家预览中。该公司表明,这项服务将协助企业在商业智能使用和仪表盘中嵌入机器学习驱动的猜测和剖析。
据Henschen说,许多剖析性数据库供给商一直在建立机器学习模型用于数据库内执行。
“Snowflake从时刻序列数据剖析开端的理由是[它是]更流行的机器学习剖析,由于它是根据以前观察到的值来猜测未来的值,”Henschen说,并弥补说时刻序列剖析在金融领域有许多使用事例。
Snowflake更新完成了更多的数据拜访
由于更快的数据拜访能够带来更快的使用开发,Snowflake在周二还推出了新的功用,包含流数据支撑,Snowflake中的Apache Iceberg表,以及用于企业内部存储的外部表。
流媒体数据支撑,这是一个私家预览,将有助于消除流媒体和批处理管道与Snowpipe流之间的界限。Snowpipe是该公司的连续数据吸取服务。
据Henschen说,推出该功用的理由是人们对支撑低延迟选项的兴趣很高,包含近实时和真实的流媒体,而这个商场上的大多数供给商都勾选了流媒体的选项。
“该功用为工程团队提供了一种内置的方法来剖析流和历史数据,所以数据工程师不必自己去凑集一些东西。这是一个节省时刻的方法,”Henschen说。
为了跟上对更多开源表格格局的需求,该公司表明,它正在开发Apache Iceberg Tables,以便在其环境中运行。
“Apache Iceberg是一种十分抢手的开源表格局,它正在迅速取得剖析数据渠道的喜爱。像Iceberg这样的表格局提供了元数据,有助于组成和可扩展的性能。冰山最近也被谷歌选用于其Big Lake产品,”Henschen说。
同时,为了坚持其内部客户的参加,同时企图让他们选用其云数据渠道,Snowflake正在推出外部表内部存储。该公司表明,现在处于私家预览阶段,该东西答使用户拜访他们在企业内部存储系统中的数据,这些公司包含戴尔科技和纯存储公司。
“Snowflake有一段时刻的’云端专用’方针,所以他们显然有大的重要客户,他们希望有某种方法将企业内部数据带入剖析,而不需要将其悉数移入Snowflake,”Henschen说。
此外,Henschen说,包含Teradata、Vertica和Yellowbrick在内的竞争对手提供企业内部以及混合和多云部署。