更多技术沟通、求职机会,欢迎重视字节跳动数据渠道微信大众号,回复【1】进入官方沟通群
经过近年开展,抖音电商的体量和规模现已相当可观。
根据数据驱动思路,在数仓建设、数据管理等层面的工作,推动抖音电商能准确剖析和测量数据,做出以数据为根据的决议计划,然后推动事务快速开展。
其中,数据有用性、及时性、准确性关系到 C 端用户体验和 B 端商家决议计划,在数据体量巨大的状况下,难以避免数据缺失、纬度过错、产出延时等问题,这与数据质量管理息息相关。
本文对话抖音电商团队,为你揭秘巨大数据体量下的数据质量管理最佳实践。
据抖音电商数据团队介绍,现在数据质量问题集中体现在:历史数据繁复,导致无法准确定位反常数据;缺少合理的监控规矩;补齐表监控规矩时刻、人力成本高等。
为了高效、快捷完结数据质量监控,抖音电商数据团队引进火山引擎 DataLeap 数据质量渠道,经过数据波动监控、反常报警、数据内容探查及差异对比东西等功能,保证数据在生产及运用流程中的可靠性和合理性,避免因为数据质量导致的数据失期、决议计划失误等事故。
抖音电商数据团队首要介绍了数据质量监控、数据反常管理两个场景。
在数据质量监控上,抖音电商经过火山引擎 DataLeap 对抖音 APP 存量数据质量装备监控,并沉积合理的监控规矩,便利监控使命的装备状况及把关数据质量。
火山引擎 DataLeap 数据质量渠道
首先,在监控范围上,经过数据质量渠道完结 ToB、ToC 使命覆盖全量监控,及时躲避数据质量风险;其次,在推动机制上,由于 ToC 链路上游多且监控使命带来过多核算资源消耗,抖音电商团队优先从中心数据链路开展数据质量监控;最终,在落地执行上,经过确立方针、Owner 和进度,完结表行数、重复值、空值、表字段、反常值的整理。
最终完结抖音电商数据质量管理全链路标准化,即由牵头人发起装备事项,经过火山引擎 DataLeap 数据质量渠道完结监控装备,并盯梢完结状况,最终相关数据被推送至看板,便利相关数据研制人员查看和复盘。
对于数据反常状况,抖音电商团队首要经过火山引擎 DataLeap 表探查的能力来处理。
数仓中较多数据表字段存在反常值、空值,在运用前无法感知,导致在数据运用时才发现质量问题,再由事务方反馈,处理功率较低。
火山引擎 DataLeap 具备制定统一的监控标准与开发标准能力,支持检测历史数据反常以及空值等状况,并默许处理、标注数据属性,保证无数据质量问题,才推动表上线流程。
除数据质量管理外,火山引擎 DataLeap 还具备数据集成、开发、运维、财物、安全等全套数据中台建设能力,有用提高数据研制功率、下降管理成本,现在现已应用于泛互联网、制造、新零售、轿车等领域。
点击跳转 大数据研制管理套件 DataLeap 了解更多