引子
“生命是靠负熵来维持的。” –《何为生命》埃尔温薛定谔
在现在的互联网年代,数据是企业重要的财物。咱们无时无刻不在产生数据:每一次翻开手机应用,每一次网购下单,乃至每一次驾车穿过红绿灯,都会产生数据。数据无处不在。在企业中也更是如此。如此之多的原始数据,加上日渐老练的数据剖析技能,让企业家们大为兴奋,由于这便是企业堆积如山的金矿啊。然而,工作并没有想象中的这么简单,要从这些杂乱无章的酷似垃圾堆的所谓 “金矿” 中提取有价值的宝物,并不简单。笔者之前的文章《浅谈数据:数据领域需求掌握些什么?》也稍微提到了数据办理(Data Governance)这个概念。本篇文章将从企业数据办理的角度,介绍数据办理是怎么在混乱的企业数据中创造价值的。
数据孤岛问题
中大型企业(一般超过 100 人,且有多个职能部分)在快速开展事务的一起,也会遭遇办理混乱的问题。出售部分有着自己的出售计算数据,通常是庞大而分散的 Excel 或者简单的在线表单;IT 部分自己建立且办理一套财物和库存系统;HR 部分又维护着一整个人员计算名单。而这样的状况会导致不少头疼的工作:大老板抱怨每周才干收到整个公司运营的办理报表;经理们看着报表中忽上忽下的数据,置疑着真实性;底层职工加班加点整理好老板要的数据,却被质疑数据有问题。了解么?这些都是企业中经常产生的问题,其直接原因便是所谓的数据孤岛(Isolated Data Island)问题。
数据孤岛产生的首要原因是来自于各个部分或团队数据不连通。许多时分,由于事务高速开展,一些团队需求快速建立一套数据系统,但又无法及时开发出来,因此只能选用 Excel 或一些快速而有用的数据录入东西来保证事务运营功率。跟着事务的增加,这些野路子数据办理模式不断衍生出新的内部流程,到必定规划后瓶颈会逐步显现出来,特别是在需求与其他部分或外部系统集成相关的时分。
当老板们意识到数据孤岛的问题之后,想要改变的时分,大都时分会显得举步维艰。这是由于他们要处理的问题许多如下之类的问题:
- 格局标准(Format and Standard):营销部分的每月出售数据可能存在各个 Excel 文件,而产品部分则是存储在 SQL Server 数据库中;
- 计算口径(Statistical Caliber):管帐金融部分的最小计算口径为每月,但营销部分精确到每一订单;
- 相关性(Association):营销部分是用的订单编号,而产品部分用的是数据库订单 ID;
- 规划(Scale):成千上万的格局不统一的 Excel 文件,难以进行快速处理。
数据办理
现在所谓的数据办理,其实便是使用数据整合东西对数据孤岛问题进行处理。如下图,数据办理团队会将各个部分的事务数据整合、清洗、转换、存储在数据仓库(Data Warehouse)中,最终供给整个安排使用。经过数据办理和数据仓库,各个事务部分的数据孤岛被连通,各类数据经过必定相关和整合,能够发现许多洞见(Insights)。例如,营销团队会惊讶的发现自己的首要客户居然很少用APP!
不过,上图是一个简化的流程。真实的大型企业或安排会比这个更杂乱,可能需求涉及安排、文化、政治、事务性质等多方面要素的考虑。这也是为什么,许多大中型企业,特别是习惯了传统 Excel 报表的企业在数字化转型方面会遇到重重阻止。
对于数据办理团队来说,成功的关键不在于技能,而在于对事务流程和企业文化的了解和掌握。怎么清洗和转换数据都有现成的东西和技巧,但事务流程和企业文化往往不那么直观。这需求数据办理团队有良好的沟通才能和事务才能。成功的数据办理,需求不仅是有用的东西和技能,更重要的是与各个事务团队打交道的才智。
不断精进
企业开展离不开数据洞见,但要完成数据驱动决策(Data-Driven Decision Making),往往还需求事务部分之间的沟通和沟通。这也是为什么许多企业都开端向敏捷(Agile)转型,这儿能够参阅笔者之前的文章《浅谈敏捷:你的团队在正确实践敏捷吗?》。数据办理需求做的更多是理解事务,思考怎么使用数据整合优化事务,从数据洞见中创造更多价值。
社区
如果您对笔者的文章感兴趣,能够加笔者微信 tikazyq1 并注明 “码之道”,笔者会将你拉入 “码之道” 沟通群。
本篇文章英文版同步发布在 dev.to,技能分享无国界,欢迎大佬们指点。