DataLeap是火山引擎数智渠道VeDI旗下的大数据研发办理套件产品,帮助用户快速完结数据集成、开发、运维、办理、财物、安全等全套数据中台建造,降低作业本钱和数据保护本钱、发掘数据价值、为企业决议计划供给数据支撑。

本篇文章首要环绕火山引擎DataLeap一站式数据办理实践打开共享,从数据办理思路、渠道建造以及才能升级三个进程动身,带你全面仿制字节跳动数据办理经历。

▌机会与应战

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

数据办理存在落地困难的问题,体现在:

首要,办理效益与事务影响存在矛盾。数据办理需求对事务体系、生产流程改造,由此对事务形成影响。

第二,办理触及的安排和办理难度大。数据办理触及的人物多、范围广、链路长,且办理方针对齐、办理和跟进难度大。

第三,规范“人”的动作难度大。数据办理要依靠人来推进和履行,人员才能参差不齐,安排文明、方针也存在不对齐的状况。

第四,缺少适配性强、大局视角且灵敏的数据办理东西。

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

下面结合字节的特色,介绍数据办理作业的机会和应战。

  • 字节文明

首要,字节事务多、发展快、敏捷迭代,要求能快速呼应事务需求;

第二,OKR文明使得每个人都能够参与拟定数据办理规划和战略,并且主动寻找完结途径;

第三,为寻求高效办理,没有设立一致的数据办理委员会,而是由各部门依据各自的事务状况进行办理。

  • 事务榜首

字节事务规模大,且着重数据驱动,导致数据质量对事务的影响十分大。

综上所述,数据办理在字节是应战机会与并存的作业。

▌3个关键进程,仿制字节跳动数据办理经历

进程一:立异数据办理思路——散布式数据自治

什么是散布式自治?

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

针对上述问题,概括考虑办理收益、事务影响、履行功率,火山引擎DataLeap提出了散布式数据自治的思路。

首要,在事务影响方面,为确保影响小,办理作业按照事务单元进行。一个事务单元或许是一个小团队或许小项目。

  • 第二,沉积各事务线办理经历,提升办理功率。
    • 经过产品辅佐事务自驱,完结规矩化、战略化、主动化办理。
    • 经过低门槛、算法引荐等渠道才能,降低办理门槛。
    • 支撑灵敏的办理方法,如办理者视角,自上而下规划性办理;如一线履行者视角,自下而上推进办理。
  • 第三,适配性强,产品建造掩盖办理全链路。
    • 产品才能掩盖稳定性、质量、安全、本钱、报警等多场景。
    • 各模块能够独立运用、按需组合。
    • 产品供给完好的开发才能,支撑事务依据本身特色和发展阶段自行接入。

与集中式办理的差异

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

与传统集中式办理比较,散布式办理有很多优势。

  • 集中式办理:要求拟定制度,并进行大范围安排推行;要求区分权责,定时抽查查核;建造周期长,适配才能弱,且安排投入多。

  • 散布式自治:事务影响小;周期短,见效快;功率高,节省人力;便于算清事务收益,降低本钱。

进程二:构建一站式渠道,引入数据办理双途径

一站式数据办理渠道架构

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

DataLeap一站式数据处理计划,首要区分为三层。

  • 榜首层 视图层

从财物视角、办理者视角 、施行者视角纵览数据办理的状况。

  • 第二层 计划层
  • 针对办理进程,提出了双途径。
    • 途径一【主动规划】规划式流程
  • 首要处理的问题是确定方针后,怎么推进履行的问题。主动规划途径还支撑办理方针拆解成办理规矩进行确诊,并依据确诊成果,履行办理。最终,经过收益核算、改善计划等进行总结复盘。
    • 途径二【体系发现】呼应式流程

先由体系发现问题,再经过告警等形式告诉财物责任人,并进行处理。最终经过根因剖析等完结总结。

  • 第三层 东西层

东西层首要为视图层、计划层供给齐备的办理东西,掩盖质量、安全、本钱、稳定性、报警与起夜等场景。东西层还经过打通根底服务,赋能主动规划和体系发现两条办理途径。

适用于事务驱动的规划式流程

接下来为大家介绍规划式途径的详细建造进程。

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

  • 特色: 财物明晰,规矩丰厚,动线完好,收益精确。

  • 思路:

    • 拟定方针,包含健康分方针,以及降低存储、核算资源等。
    • 依据方针拟定办理计划,明晰办理域、圈选办理规矩。
    • 拟定计划后,由体系主动查询存储、核算等问题的明细,经过剖析后,经过音讯催办等方法,将问题下发到责任人,推进数据办理。
    • 体系主动对办理作用进行搜集,反应方针达成状况,并对一段时间内的办理成果进行验收和核算。

以上是规划式流程的主线思路 。

下面介绍怎么完结规划式途径的首要完结手段。

财物明晰

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

DataLeap首要从办理全景和健康分两个方面对财物进行描绘。

榜首,办理全景。 从各个维度,经过明细、核算量,对团队或个人财物的详细状况进行描绘。如各个表占了多少存储空间,核算资源运用状况,使命报警率、起夜率,数据及时性和质量等。

第二,健康分。 首要依据办理的笔直方向区分为存储健康分、核算健康分、质量健康分三个层级。在榜首层的维度下,第二层细化问题大类,如存储方面,包含:无效存储、异常存储等;质量方面,包含:及时性、报警、元信息装备规范等。第三层则将详细问题经过标签界说,如无效存储触及TTL不合理、热度方面信息(xx天无查询)等。

综上,首要经过健康度和办理全景将财物明晰地表述出来,再经过元数据仓库进行底层数据建造。

规矩丰厚

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

现在渠道具备了齐备的办理规矩,包含存储、核算、质量、报警4大维度,50多个规矩。

其间包含大局规矩,如:生命周期永久、近7天产出为空、暴力扫描使命等;也包含一些自界说的规矩,如生命周期xxxt天,近xxx天产出为空等。一起还兼具发掘类规矩,包含依据核算信息进行聚合后形成的规矩,以及依据财物(包含库、表等)类似性发现问题的规矩。

DataLeap办理规矩首要经过以下流程建造起来。

  • 首要,经过底层与渠道根底组件打通,完结数据搜集,形成数据仓库的根底层;
  • 其次,依据根底层对数据财物进行画像描绘,进一步形成特征域,做特征发掘和相关剖析;再将使用数据放到数据服务中,对外供给灵敏的数据查询才能。
  • 最终,经过最上层的规矩引擎,将数据和规矩进行联动,使用于规矩建造。

动线完好

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

明晰出问题的财物后,怎么尽快完结办理,减少和事务的冲突,关于提高功率至关重要。

依据办理渠道的才能,结合各个笔直场景,DataLeap建造完善的办理动线。大致的思路如下:

  • 使命办理方面,与使命开发、使命运维渠道打通,支撑使命关闭、调整、调参,链路优化等;
  • 库表规范方面,和元数据渠道联动,完结表办理、库办理、财物移交、特色修正等;
  • 生命周期方面,经过办理渠道将底层存储(包含hdfs、hive等组件)打通,形成闭环式办理;
  • 在数据质量方面,触及sla及时性,离线、实时数据监控等,经过与质量规矩渠道强联动,相互挂号数据,进行sla签署以及强跳转交互等。

完好的动线能运用户在渠道中,以低操作本钱完结一站式闭环办理。

收益精确

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

完结办理后,怎么判断办理收益?

现在DataLeap建造了依据事情中心的底层结构。经过界说数据的消费模型,由音讯通道来定时搜集各个渠道操作的音讯;一起,经过界说事情SDK,兼容API的方法,来灵敏对接上游不同渠道。

经过音讯订阅和消费的方法,数据办理渠道和研发渠道、元数据渠道、质量渠道等完结对接,将办理事情接入事情中心,并将事情中心的离线数据dump到数据仓库,进行离线加工,一起咱们也会将最新事情,注入在线元数据服务中,及时完结办理收益核算。

技能架构

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

在技能架构层面,遵从以下原则:一致数据查询、规矩灵敏组合、操作解耦、办理收益精确。

  • 渠道后端负责分发和转化办理逻辑,包含查数、设置方针、健康分展示与透出,办理操作等;
  • 依据获取的音讯后,后端渠道进行详细事情拆分。举个例子,在看板类查数的部分,需求将一致发送到查询服务完结底层存储做适配,经过点查、list、聚合类查询,并在解析后选取不同的底层存储。
  • 规矩引擎服务可与数据查询服务联动。经过数据查询服务获取数据,再经过规矩界说成标签,并笼统成服务。该服务能够对外供给对财物标签描绘,并成为通用才能。
  • 数据办理详细施行被一致笼统成后台模块,包含设置音讯、设置ddl、进行删去等。由该模块下发到组件层进行操作,再经过事情搜集服务,并返回数据查询服务,完结办理收益汇总。

适用于经历沉积的呼应式流程

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

  • 特色:事后办理、问题总结、经历沉积。

  • 思路:

    • 首要,接到报警和音讯,包含sla破线、数据质量报警、核算使命报警等;
    • 其次,体系将上述音讯汇总,并展示在办理渠道中。数据开发人员经过办理渠道进行音讯检索、问题归因,并完结根因打标,把问题详细定位到组件、渠道等颗粒度;
    • 再次,经过公司安排方法找到组件侧对接人,或经过安排会议将问题提交给相关责任方,推进对方完结确保;
    • 最终,列出体系中的问题描绘、改善计划,界说问题并剖析办理作用,并在问题处理后,推进计划共享、沉积和复用。

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

呼应式办理架构与规划式办理大部分类似,最大差异在于音讯服务部分。作为根底才能,音讯服务将大数据渠道相关产品中的音讯,接入一致服务中,成为所有报警音讯进口。并且音讯服务还能够做升级战略,如音讯聚合、音讯加急等。

进程三:敞开接入、智能化数据办理才能升级

敞开接入

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

事务有各自发展阶段以及不同办理方针。例如,新兴事务中心注重sla的才能;而老练事务,则更注重规范性。怎么防止一刀切,让不同事务需求都能经过同一个办理渠道满足?敞开才能很重要。也就是说,要构建数据办理生态,让事务能够自界说接入办理规矩,并施行办理。

当前阶段,咱们将数据办理分为四个象限,横坐标为元数据(三方元数据、规范元数据),纵坐标为规矩(表达式、算法包)。

  • 榜首象限&第二象限:榜首象限首要为界说规范元数据和一致表达式,经过规矩引擎直接适配。如果事务方存在第三方元数据接入已界说规矩,则如第二象限所示,接入的第三方元数据需求遵从接入规范,并经过规矩引擎完结适配。
  • 第三象限&第四象限:如果规矩部分要进行类似度核算,且不是表达式能够描绘的规矩,则被界说为算法包或逻辑单元。如第三象限&第四象限所示,要求界说输入、输出规范,经过调用包或插件方法,履行逻辑。

全体而言,将渠道才能敞开,让事务接入本身的规矩和数据,根底是办理渠道有完善的元数据格式和接入规范。 事务方只需负责加工本身接入部分,完结装备和数据映射,经过表达式或算法包核算后,完结一致输出。

现在,上图的敞开接入才能正在开发当中,未来将对外供给服务。

智能化才能

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

接下来介绍智能化才能,该才能能够进一步降低办理本钱,提高办理功率。代表性落地场景如下:

使命SLA签署引荐

  • 问题: 在SLA签署中,使命上下游或许存在上千个节点,怎么估计产出时间?
  • 处理思路: 现在首要经过血缘关系找到节点的关键途径,依据运行时间进行权重分配,确保节点有相对合理的SLA buffer。在引荐签署环节,DataLeap现在现已申请专利,并在生产中产生必定作用。第二期将依据运行失败概率散布状况来调整上游buffer紧缩,下游buffer宽松的问题。

动态阈值监控

  • 问题: 数据量正常散布,但短期异常化的状况。如流量日志在假日或活动日,出现正常突增或突降的状况。

  • 处理思路: 常规的数据质量监控通常限定绝对值阈值,如前史7天波动率等,简单形成假日或活动日误报警,给值班人员形成不必要的打扰。DataLeap提出了动态阈值的思路:依据数据前史状况,概括出不同散布状况,并供给不同的猜测方法。例如,动态阈值猜测整个表在某一天的量级状况,然后依据数据量级设置上下阈值,超出阈值再进行报警或音讯告诉。

    • 数据散布:数据量单调不减,大部分为快照表或全量表;假日或活动日或许出现数据量突增或突降,往往为日志类表时;数据量比较稳定,维度发生变化时,能反应出必定问题,往往是维度表。
    • 猜测方法:移动平均法、指数平滑法、自回归法、同期检测法。

有类似使命识别

  • 问题: 因为事务巨大、开发人员多、使命量大,在开发进程中,存在不知道线上是否存在类似使命的问题,在跨团队状况下更明显,因此使命检测十分必要。
  • 处理思路:DataLeap的基本思路是将方针源代码和待检测源代码sql的ast序列化和向量化,对特征向量做余弦类似度核算,经过产品进行核算成果透出,再由事务完结标注,经过人工确认剖析,对使命进行兼并或下线。

以上是DataLeap在智能化方面的一些探究。

架构总结与未来展望

架构总结

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

最终总结一下,渠道总体架构分为三层。

  • 产品层,从办理者视角和履行者视角做出区分。在详细办理进程中,遵从双途径方法:

    • 规划式办理:方针拟定、规矩圈选、办理施行、收益核算、经历总结
    • 呼应式办理:订阅音讯、发现问题、施行办理、挂号问题、复盘总结
  • 服务层,也称为全体服务逻辑层,拆分了数据服务、使命履行、音讯服务、事情中心等不同模块,特别是接入服务模块,能够供给敞开才能。

  • 数据组件层,作为根底建造层,包含元数据仓库建造、大数据组件适配等。

未来展望

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

未来展望首要包含三个部分。

  • 体会打磨

在渠道建造阶段,DataLeap现已树立比较完善的才能,并在内部有用使用。接下来,咱们会继续遵循双途径的建造方法。在规划式途径上,使财物更明晰、规矩更丰厚,进一步打磨动线,提高收益精确性。在呼应式途径上,除了问题挂号、归因外,后续将首要针对总结概括、经历沉积进行建造,使字节内部办理经历更好地复用到其他事务方。

  • 敞开才能
  • 散布式自治的理念,确保事务能够自界说方针,并对齐SLA。后续,咱们将从三个方面继续敞开才能:
    • 自界说目标,比如自界说健康分、自界说安排,使不同事务能够本身状况界说健康分的安排形式和描绘。
    • 自界说计划,进一步打磨自界说规矩的接入流程,并将规矩才能敞开,支撑事务调用,并完结本身财物剖析。
    • 打通事务,以事务视角看待问题,针对事务问题和需求,完善渠道建造。
  • 增强型数据办理

现在DataLeap大部分都是核算类规矩,正在建造发掘类规矩。后续会在智能化模型建造方面,做更多猜测剖析。

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

以上介绍的一站式数据办理才能和实践,现在大部分现已过火山引擎DataLeap对外供给服务,欢迎大家点击大数据研发办理套件 DataLeap 了解概况!