作者:PsiACE
Databend 研发工程师 github.com/PsiACE
2023 年 2 月 27 日,OpenDAL 项目顺利经过投票,正式进入全球尖端开源软件基金会 —— Apache 软件基金会(ASF)的孵化器(Incubator),成为 ASF 的一个孵化项目(podling)。在 3 月 15 日,OpenDAL项目正式移交到 Apache 软件基金会名下。
这是 Databend 团队在开源社区的一个重要里程碑,也是开源社区对 OpenDAL 的技术和理念的一次认可和支撑。
Apache 孵化器成立于 2002 年10月,为那些意图成为 Apache 基金会尽力的一部分的项目和代码库,供给一个进入到 Apache 软件基金会的途径。孵化器项目需求践行 ASF 的治理和运营方法,并运用 ASF 供给的基础设施和资源。孵化器项目需求经过一系列的阶段和评估,才干终究毕业成为 ASF 的尖端项目(TLP)。
incubator.apache.org/projects/op…
什么是 OpenDAL
数据是未来最重要的财物之一,而数据拜访是数据价值完成的关键环节。
市场上存在着各种各样的存储服务,每个服务都有自己一起的接口和特性,给数据拜访带来了很多复杂性和不方便。
OpenDAL 供给一个一致、简略、高效、可靠、可调查的数据拜访层,让开发者能够无缝地运用不同的存储服务,并享受到最佳的用户体会。
OpenDAL 不仅简化了不同存储服务的接口,还供给主动重试、恳求优化和可调查性等特性。开发者只需求运用 OpenDAL 就能够无痛拜访数十种存储服务,而无需了解和把握特定 SDK 的细节。
OpenDAL 的特性包含但不限于:
- 支撑多种存储服务,包含本地文件体系、HDFS、S3、OSS 数十种服务等。
- 供给一致的数据拜访接口,无需关心底层存储细节。
- 支撑多种常用数据操作,包含
read
、write
、list
等。 - 支撑主动重试、恳求优化、可调查性机制。
- 零本钱,直接映射到 API 调用。
- 跨言语 bindings: Python, Node.js, C (working on) 等
OpenDAL 的前史、发展与现状
前史:从 dal2 到 OpenDAL
OpenDAL 的初衷是打造一个通用、一致、易用的数据拜访层,它诞生于 2021 年末,最开端是作为 Databend 项目的一部分进行开发的。
- 2021 年 12 月 21 日,Xuanwo 开端着手设想 Databend 存储拜访层的设计与完成,dal2: Add basic operations of read, write, stat, delete
- 2021 年 12 月 27 日,开端对 proposal: Vision of Databend DAL 这一提案的评论。29 日,dal2 的完成被合并到 Databend 中。
- 2022 年 2 月 14 日,dal2 正式从 Databend 的代码库房中迁出,成为独立维护的尖端项目,并正式更名为 OpenDAL 。
发展:从 1 到 +1
在 Xuanwo 、ClSlaid 和其他众多贡献者的推动下,OpenDAL 很快就成为了支撑 AWS S3 / Azure Blob / GCS / HDFS 等主流国内外存储服务的数据拜访层,并为 Databend 的 COPY INTO
、Stage、Storage 供给真实的跨多如此原生存储与拜访支撑。
GreptimeDB 是 Databend 之后第一个主动运用 OpenDAL 的大型 Rust 数据库项目,之后,在 Xuanwo 的尽力下,Mozilla 基金会旗下的 sccache 也尝试运用 OpenDAL 来接收存储层,为了供给更全面的支撑,OpenDAL 很快上线了对 GitHub Action Cache 的支撑。
随后是 RisingWave 和 Vector ,OpenDAL 的用户阵营开端完成从 1 到不断 +1 的转变。
现状:向星斗大海前进
目前 OpenDAL 已开始树立起了一个小型社区并构成产品矩阵,除 Rust 主代码以外,目前还供给有 Python 和 Nodejs 绑定。
OpenDAL 自开源以来累计发版 99 次,Github Star 700+, 累计下载次数 349 K, 累计开发者合计 48 位,项目一向处于活泼更新状态,由衷感谢每位贡献者的尽力和支付。
参加 Apache 孵化器是 OpenDAL 发展历程中的一个重要里程碑,咱们期望能够凭借 ASF 的平台和资源,让 OpenDAL 专心于供给中立、无供应商锁定、自在、无痛、高效的存储拜访层,更好地为广大开发者服务。
咱们等待 OpenDAL 能够在以下几个使用场景得到更广泛的使用:
- 数据分析:OpenDAL 能够协助数据分析师快速地从不同的存储服务中读取或写入数据,并进行各种格式转化和操作。
- 数据科学:OpenDAL 能够协助数据科学家轻松地从不同的存储服务中获取或保存数据,并进行各种预处理和后处理。
- 数据工程:OpenDAL 能够协助数据工程师高效地构建和管理不同的存储服务之间的数据流水线,并进行各种监控和调优。
称谢
From Xuanwo
大家好,我是 Apache OpenDAL Committer Xuanwo。
OpenDAL 项目凝聚着我个人一向以来的愿望,如今在社区的通力协作下走进了 Apache 孵化器,我此刻感到非常的幸福。感谢一切贡献者的支付,感谢 Databend Labs 的支撑,感谢 Champion tison 的指引,感谢各位 Mentor ningjiang, wusheng, tedliu 和 hexiaoqiao 的辅导。
让咱们遵循 Apache Way 的指引,一起构建社区并创造价值,为用户供给自在、无痛和高效的数据拜访体会!
参加咱们
欢迎有兴趣参与 OpenDAL 项目的开发者和用户参加 OpenDAL 社区,并关注 OpenDAL 的最新动态。你能够经过以下方法获取更多信息:
- 拜访 OpenDAL 官方网站:opendal.apache.org
- 探究 OpenDAL GitHub 库房:github.com/apache/incu…
- 参加 OpenDAL Discord 频道:discord.gg/XQy8yGR2dg
- 订阅 OpenDAL 邮件列表:dev@opendal.apache.org