时刻序列:一种普遍存在的数据形状
众所周知,时刻序列是一种普遍存在的数据形状,与咱们的日常日子及生产活动密切相关。如:股票指数、原油价格等金融市场数据;温度、湿度等气候数据;振动、转速等工业设备运行工况数据;以及电力负荷、新能源发电功率等电力数据;还有与咱们身体相关的血压、心率、血氧饱和度等健康监测数据,都属于时刻序列数据。
概括起来,时刻序列能够被定义为一组或多组按发生时刻排列的随机变量。
时序数据如此普遍,时序建模也一直都是许多领域所重视的要点问题。简言之,人们希望在对前史数据进行深入剖析的基础上预知数据未来的走势,并依据猜测作用来影响或改动决策。
对时序数据进行研究通常涉及以下三类使命:
-
缺失值处理、反常值处理、归一化等数据处理使命;
-
时域剖析、频域剖析、时序分解等数据剖析使命;
-
时序猜测、时序反常检测、时序分类、时序聚类等建模使命;
一个典型的时序运用场景,往往需要综合运用这些时序技能,才干有用处理问题并到达预期作用。
技能晋级:深度学习推进时序建模进入新开展阶段
简略回忆一下时序技能的开展进程,能够发现时序技能的演进首要阅历了3个阶段。
首先是从上个世纪50年代开端的统计学阶段,代表性的办法有简略滑动均匀、指数平滑、ARIMA等经典办法。
从2000年开端,机器学习办法开端在时序建模中被广泛运用,代表性的办法有XGBoost、LightGBM等Boosting Tree办法,由于其优异的作用和较好的可解释性,这类办法被很多开发者所喜爱。
从2017年开端,呈现了很多基于深度学习的时序建模办法。在每年人工智能领域的顶级会议上,都会有代表性的工作被提出。比方,支撑概率猜测的DeepAR,具备可解释才能的Nbeats和TFT,时序表征学习TS2Vec和CoST等。能够看到,深度学习正在推进时序建模进入新的开展阶段,能够有用处理多变量、非平稳、长时序等时序建模所面对的一系列技能应战。
PaddleTS:基于飞桨的深度时序建模库
为了使这些不断涌现的深度时序建模技能能够无门槛地惠及广阔职业用户和开发者,咱们打造了基于飞桨的深度时序建模算法库PaddleTS。望文生义,这儿TS便是Time Series的缩写。
PaddleTS所包含的首要功用模块构成,如下图所示:最下方是TSDataset,它供给了对整个时序数据的统一表达,是PaddleTS各个模块最首要的数据操作对象。在TSDataset内,对不同属性、不同用途、不同类型的数据列进行区分,方便模型算法按需对不同的数据列做不同处理。
中间是一系列数据处理、数据剖析、模型算法及高档建模才能相关的模块,其间模型算法当时首要包含时序猜测、时序表征和时序反常检测这三类算法。
最上面是流水线的支撑,包含通用流水线和场景化流水线。流水线的设计,是为了满意各种十分典型的时序运营需求。
**PaddleTS产品特征:**简略易用、算法先进、开发者友好
在设计和开发PaddleTS的过程中,咱们始终坚持3个基本准则:简略易用、算法先进以及开发者友好,这3个准则也构成了PaddleTS的产品特征。
简略易用
PaddleTS简略易用,希望用户无门槛运用前沿的深度时序建模办法,来处理实践事务问题。为了完成这个方针,PaddleTS首要从统一时序数据结构、标准化编程接口、供给丰厚的数据处理才能入手,答使用户只编写少量代码就能够完成从数据加载到数据处理,再到建模的全过程。
此外,咱们也供给了包含主动机器学习和集成学习这样的高档建模才能,这些功用能够帮助用户取得更好的建模作用。咱们也供给了包含回测和交叉检验这样的实用工具。当然,针对所有的功用,咱们供给了十分详实的API文档和丰厚的示例教程,方便用户快速学习并通晓PaddleTS。
算法先进
PaddleTS的另一特征便是算法先进。一方面咱们供给了对近几年主流深度时序算法的支撑,一同通过对前沿研究的跟踪,持续引进代表性的新算法,让用户能够在第一时刻就体会到学术界最新的算法作用,并取得杰出的建模作用。当时PaddleTS首要支撑3类深度时序模型,包含时序猜测、时序表征、时序反常检测,现已完成了10余种极具代表性的深度时序建模算法。
开发者友好
PaddleTS希望能够持续引进前沿的模型算法来让广阔的用户受益。这个方针的完成离不开社区的积极参与。为了让社区开发者、时序技能研究人员、职业从业人员都能够对模型算法的引进做出奉献,咱们对模型开发结构做了精心的封装,使得开发者在充沛了解算法的基础上,只须重视网络结构的完成。
对于较为复杂的模型,咱们也引荐进行层次化设计,比方常见的从Block到Module再到Network,这样完成的代码逻辑清晰,可读性强,也便于维护。开发者能够参考PaddleTS已有的模型完成,快速熟悉模型开发工作。
PaddleTS工业实践事例
接下来咱们分享一则PaddleTS在电力职业的运用事例——电力母线负荷猜测。
精准的电力母线负荷猜测是完成电网安全调度的重要基础。近年来,由于很多新能源发电的并网,明显增大了母线负荷的波动性,从而为电力母线负荷猜测带来了新的应战。基于对事务的深入了解,咱们与电力调度领域的专家一同提出了立异的母线负荷猜测技能方案,包含基于电网结构的负荷分解与重构、多变量深度时序猜测技能、多母线统一建模技能以及归因剖析技能等。
基于PaddleTS所供给的强壮的建模才能,通过充沛利用前史负荷数据和气象预报信息、节假日信息等各类数据,完成了十分精准的猜测作用,准确率超越98%。整个电力母线负荷猜测体系的投入运用也极大提高了电网调度工作人员的工作效率,人效提高5倍。
除此之外,PaddleTS也在新能源发电功率猜测、设备健康管理、水质猜测等众多时序建模场景做了很多实践,均取得了很好的作用。很多来自不同职业的用户,现已把PaddleTS用在各自的事务场景,也取得了十分不错的作用。
最终,真诚希望与广阔开发者、研究人员、职业从业人员一同将PaddleTS建成简略易用、算法先进、作用杰出的深度时序建模库,一起促进工业数据智能开展,迈上新的台阶。
欢迎参加PaddleTS社区,体会最新的产品特性。一同为PaddleTS的开展献言献策,一起推进PaddleTS的迭代晋级。
- PaddleTS社区网址
github.com/PaddlePaddl…