在本文中,我将尝试对 MLOps 进行友好的介绍,并以简略的办法解说关键概念。作为一开端也觉得很难了解的人,我了解有必要对这个主题进行更简略的介绍。我希望在阅览本文后,初学者能够更轻松地阅览有关 MLOps 的更高档文档。
1. MLOps 的动机
因为机器学习技能在各个研究范畴的成功,许多公司都企图将其归入他们的软件体系,以进步功率和解决实际国际的问题。但是,关于许多公司而言,在出产环境中施行机器学习或许是一个具有挑战性且耗时的进程。此外,一旦布置,就必须办理和维护模型,而且必须监控其功用以保证其正常运转。这些使命在大型软件体系中特别困难。
另一方面,软件工程师运用 DevOps(开发和运营)范式,这是一组促进开发和运营团队之间协作和交流的实践和东西,以开发和办理他们的体系。这有助于保持开发速度和质量。 MLOps 旨在使这些 DevOps 原则适用于机器学习体系。考虑到这一布景,MLOps 究竟是什么?
2. 界说
要界说 MLOps,让咱们从检查各种界说开端:
- “MLOps(机器学习操作)是一种范式,包含最佳实践、概念集以及机器学习的端到端概念化、施行、监控、布置和可扩展性方面的开发文化等方面产品。”
- “DevOps 办法的扩展,将机器学习和数据科学资产作为 DevOps 生态中的一等公民”
- 咱们能够运用机器学习工程 (MLE) 的界说,其间 MLE 是运用机器学习和传统软件工程的科学原理、东西和技能来规划和构建复杂的核算体系。 MLE 包含从数据搜集到模型构建的一切阶段,使模型可供产品或顾客运用。” (作者:A.Burkov)
根据前面的界说,咱们能够将 MLOps 了解为一组用于以高效、优化和有安排的办法规划、构建和布置机器学习模型的技能和实践。这些技能和实践一般在 MLOps 生命周期的上下文中进行谈论。
3. MLOps 生命周期
MLOps 生命周期由 MLOps 典范中触及的进程和技能组成,从规划和开发机器学习模型到将其布置到出产环境中并跟着时刻的推移对其进行监控和维护。它一般分为三个主要阶段:
- 榜首阶段是规划进程,触及界说事务问题、模型的要求及其预期用例。这一般触及创建 AI/ML 画布。
- 第二阶段是模型开发进程,包含数据和模型工程。
- 第三阶段是包含模型布置和维护的操作进程。
在布置模型后,跟着时刻的推移保持模型的功用很重要,因而这些阶段一般以循环办法履行。这保证了模型运转杰出而且依然满意榜首阶段界说的需求。现在咱们已经谈论了 MLOps 生命周期的各个阶段,让咱们检查一下 MLOps 作业流,它概述了在流程的每个阶段履行的特定使命和活动。
4. MLOps 作业流
MLOps 作业流概述了开发、布置和维护机器学习模型要遵从的进程。在抱负状况下,遵从作业流程就足够了:首要,了解事务问题,然后挑选、练习和布置模型。但是,在实际国际中状况并非总是如此。在任何时候,都或许需求返回到上一步。此外,在布置模型后,必须对其进行维护和监控,这便是了解 MLOps 生命周期和 MLOps 作业流很重要的原因。
4.1. 事务问题
MLOps 作业流程的榜首步是了解事务问题,这触及界说模型的输入和输出,以及流程及其各种子使命。要构建此进程,您能够运用 AI(人工智能)画布或 ML(机器学习)画布,它们能够被视为安排 MLOps 作业流程的模板。 AI 画布一般为 ML/AI 实现供给高档结构,而 ML 画布供给体系的高档描绘和细节。
让咱们举个例子!假定为了改善其产品,一家乳制品公司有兴趣搜集顾客的反应。为此,需求对顾客对交际媒体平台上的产品的谈论进行心情剖析。机器学习技能可用于练习模型,将这些谈论的心情分类为正面、负面或中性。这将使公司能够更好地了解客户对其产品的体会,并确认需求改善的当地。此事务问题描绘已转换为 AI 画布和/或 ML 画布,以取得更明晰的表明:
- 猜测/猜测使命:人工智能体系将剖析文本输入并猜测文本的心情(正面、负面或中性)。
- 判断:体系将运用自然语言处理技能来了解文本的意义和情感。
- 行动/决策:根据猜测的心情,体系或许会采纳不同的行动,例如符号负面谈论以供进一步审查或优先考虑活跃的交际媒体帖子以进行推广。
- 成果:希望的成果是体系能够精确地对文本输入的心情进行分类,从而进步客户满意度、更好的交际媒体参加度,或根据特定用例取得其他好处
- 练习:体系将在符号文本数据的数据集上进行练习,其间包含输入文本和相应的情感标签。
- 输入/数据源:体系将接受来自各种来历的文本输入,例如交际媒体帖子或客户谈论。
- 输出/做出猜测:体系将剖析文本输入并猜测文本的心情(正面、负面或中性)。
- 反应:体系或许会整合来自用户或利益相关者的反应,以跟着时刻的推移进步其功用,例如经过调整自然语言处理算法的参数或向练习数据集增加新数据。
- 离线评价:体系将运用精确度、召回率和 F1 分数等标准评价指标进行评价,以保证其精确地对文本输入的情感进行分类。
- 实时监控:体系将根据需求持续监控和更新,以保证它跟着时刻的推移继续精确运转。
4.2. 数据工程
了解手头的事务问题后,MLOps 作业流程的下一步便是数据工程流程。这包含数据吸取、探究和验证、数据清理、数据符号和数据拆分。
- 数据吸取触及运用一组技能来搜集数据、创建备份、维护私人信息、创建元数据目录以及对测验集进行采样以防止数据窥视误差。
- 为了探究和验证数据集,运用了一组核算和可视化技能。
- 搜集的数据一般有噪声、包含离群值和缺失值。这些问题会影响下一个进程,因而应用数据清理进程来解决它们。
- 当所选模型根据监督学习时,数据符号是必要的。此进程能够手动、主动或半主动完成。
- 数据拆分是此进程的最后一步,触及将数据划分为练习集、验证集和测验集。
4.3. 机器学习模型工程
MLOps作业流程的第三步是机器学习工程,包含模型练习、模型评价、模型测验和模型打包。
- 练习模型触及特征工程、代码审查和版本控制以及超参数调整。您或许想知道为什么特征工程包含在这一步而不是上一步中。原因是在这一步测验了很多类型和架构的模型,所以一切模型的特征工程往往不一样。值得注意的是,在这一步挑选最合适的模型之前,练习和测验了几个模型。
- 模型评价触及验证模型以保证它满意事务问题进程中描绘的事务目标。
- 在模型测验进程中,运用初始测验集进行模型验收测验。
- 模型经过验证和测验后,最后一步是以特定格式导出模型,以便将其供给给事务应用程序。
4.4. 代码工程
在此进程中,模型已准备好布置到出产环境中。模型布置包含三个进程:模型服务、功用监控和功用日志记录。
- 要为模型供给服务,必须考虑服务模式和布置战略。服务模式是指模型怎么集成到软件中,例如将其集成为服务、作为依赖、运用预核算服务、按需服务或混合服务。布置战略是指用于包装模型的办法,例如将其布置为 Docker 容器或无服务器功用。
- 监控模型触及观察模型的整体行为,例如其猜测与先前模型功用的误差。
- 功用日志记录触及将模型猜测的成果保存在日志记录中。
5. 总结
在本文中,咱们简要介绍了 MLOps。咱们谈论了对 MLOps 的需求,提出了各种界说,解说了 MLOps 生命周期,并描绘了 MLOps 作业流程。假如您想了解有关 MLOps 的更多信息,我推荐 ml-ops.org 以获取更多信息。
这是关于 MLOps 的榜首篇文章,当然不是最后一篇!我将编写更多关于 MLOps 及其各种技能的教程,并供给示例,敬请期待。假如您有任何问题或建议,请随时在下方给我留言。
本文由mdnice多平台发布