0

点赞

收藏

分享

MLOps专栏文章汇总

进击的包籽 2022-11-06 阅读 178

标签: 人工智能数据机器学习 Linux 系统/运维

MLOps 技术栈架构

MLOps专栏文章汇总_机器学习

MLOps stack architecture

MLOps

全球的MLOps和ML工具概览
聊聊MLOps是什么，它对算法工程师带来了什么
可重复可复现的机器学习在生产中的12个要素
软件工程大师 Martin Fowler 谈机器学习持续交付
谷歌大佬谈 MLOps ：机器学习中的持续交付和自动化流水线
如何测试你的机器学习流水线？
浅述MLOps的价值
AI 产业三大发展趋势（AutoML/MLOps/XAI）将加速企业 AI 应用落地
Algorithmia 首席执行官 Diego 谈从研发到人工智能的投资回报率
机器学习模型在生产中表现不佳的5个原因

为什么您的机器学习模型可能表现不佳（现实的变化-概念漂移(真实世界)、工程与数据科学迷失在转化中(应用接口)、应用程序更新(应用接口)、特征处理 Bug(内部数据流水线)、数据 Schema 变化(内部数据流水线)）、使用指示器来检测模型的 常见问题（字段删除、类型不匹配、默认值更改、值超出范围、分布漂移、性能指标下降）

如何将 MLOps 用于物联网和边缘设备（Valohai）
降低模型输出风险的三种方法（Valohai）
Arize AI 对顶级 ML 团队调查得出的 3 个结论

解决模型问题仍然太痛苦和缓慢（建议：评估并实现一个 ML 可观测性平台，帮助暴露和消除AI盲点。）、 ML 团队需要与业务主管更好地沟通（建议：提高内部可见性、提高 ML 读写能力并将模型指标与业务结果联系起来）、 可解释性很重要，但它不是一切（建议：不要仅仅依靠可解释性；采取积极主动的方法进行模型性能管理。）

识别人工智能用户场景---一种规格并不适用于所有场景（Noogata）
如何规模化企业人工智能（Noogata）

无代码与以数据为中心的 AI 平台

无代码 AI 和 MLOps：无代码 AI 仅用于不会代码的终端用户（Valohai）
以数据为中心的人工智能应该如何实施（Valohai）
数据优先的人工智能会是下一个颠覆性的大事件吗？（Continual）
无代码 AI 概览（Levity）
无代码人工智能：它是什么，它为什么重要？（Noogata）
我们为什么创建无代码 AI 平台 Noogata
无代码人工智能平台：成功的基石（Noogata）
无代码 AI 工具的类型（NoCode.ai）
无代码平台如何为中小型企业带来人工智能
DLOps：用于深度学习的 MLOps（Valohai）

数据版本管理

捕获数据版本以重现、跟踪和记录您的 ML 模型血缘。

用于 MLOps 的最佳数据版本控制工具（Aporia）
数据科学家 Emily Gorcenski 谈数据版本控制（CD4ML）

DVC

DVC 官网教程-中文版

特征存储

现代数据团队的特征工程（Continual）
现代数据栈的未来（Continual）
特征平台（Feature Store）：您需要知道的关于特征平台的一切信息（Continuous）
用于 MLOps 的最佳特征平台（Aporia）

AutoML

NNI

浅析自动机器学习（AutoML）工具NNI

模型实验跟踪

跟踪有关实验的重要信息，如参数、指标和模型。

MLflow

浅谈机器学习生命周期平台MLflow
MLflow 快速入门

机器学习流水线（Pipeline）

自动化ML实验的步骤。调度流水线运行，以根据新数据重新训练模型。

开源机器学习流水线工具调研（MLOps）
正向数据工程和逆向数据工程（Prefect工作流）
开源机器学习工作流Ploomber
五分钟快速了解Airflow工作流
浅析数据工作流Prefect
浅析机器学习工作流Kubflow Pipelines
如何将 Apache Airflow 用于机器学习工作流
Kubeflow 和 Argo 的综合比较
用于 MLOps 的最佳训练编排工具（Aporia）

模型可视化

如何将模型可视化工具Netron改造为通用的WEB服务(Flask)?
机器学习模型可视化类型和工具
可视化机器学习实验指标和超参数的最佳工具（Neptune）
机器学习模型可视化：指南和工具（Neptune）
机器学习模型可视化的最佳工具（Neptune）

模型服务

创建API端点并使用模型进行预测。

浅析云原生模型推理服务框架KServe
在线推理是否会导致您的白发？

BentoML

快速入门统一模型部署（Model Serving）框架 BentoML
BentoML核心概念（一）：服务定义
BentoML核心概念（二）：API 和 IO 描述符
BentoML核心概念（三）：构建Bentos
BentoML核心概念（四）：模型和 Bento 管理

Seldon

使用 Seldon Core 服务模型

什么是模型服务（通过 API 与您的模型交互、将模型部署到云端或边缘设备、轻松扩展模型以满足用户需求）、Seldon Core简介、Seldon Core 安装、Seldon 如何为模型服务、使用自定义 Docker 镜像服务、Seldon 适合你吗

使用 Seldon Alibi 进行模型监控

模型监控如何工作（数据漂移、异常值、偏见）、Alibi Detect 简介、监控模型（部署图像分类器、部署漂移检测器）、从 Alibi 中获取指标、Alibi 适合你吗？

可解释机器学习

Umang 谈部署可解释机器学习面临的挑战
机器学习模型可解释性实践指南（Aporia）
ML 模型解释工具：模型解释是什么、为什么需要模型解释以及如何解释模型

模型监控

机器学习可观察性 VS 机器学习监控（Aporia）
如何理解机器学习中的偏见和公平（Aporia）
如何监控你的 ML 流水线
特定领域的机器学习监控
机器学习模型监控的 9 个技巧
监控模型在生产环境的性能（Arize）
可解释的监控：停止盲目行动并监控您的 AI
评估ML监控解决方案时要避免的常见陷阱（mona）
ML 模型再训练无法解决的问题（mona）
监控生产环境中的机器学习模型

模型监控概述

什么是模型监控？（Valohai）

为什么要监控模型、 机器学习模型监控清单（数据分布变化、性能改变、健康指标/运营指标、数据完整性、分段性能、偏见/公平）、在 Valohai 中如何监控模型（存储指标、在 UI 中可视化指标）

机器学习模型监控清单

服务健康、数据质量和完整性、数据和目标漂移、模型性能、分段性能表现、偏见/公平、异常值

模型监控：定义、重要性和最佳实践（AI Multiple）

什么是模型监控、为什么模型监控很重要、ML 模型随时间退化的原因（不断变化的环境、更改业务数据）、 模型监控变量（真实值与预测值检查、数据分布变化、无错误数据、公平、运行指标）

机器学习模型监控（Aporia）

机器学习模型监控（什么是模型监控、 如何监控机器学习（数据漂移检测、数据完整性检测、概念漂移检测、数据偏差、异常））、 模型中的漂移检测（模型漂移、数据漂移（KS检验、PSI、Z-score）、概念漂移）、 机器学习性能监控（如何监控机器学习性能、如何提高模型性能）、机器学习模型管理、模型可解释性、机器学习实验跟踪、机器学习模型注册表

MLOps：模型监控

模型监控背景、模型监控动机、 模型监控指标（稳定性指标、性能表现指标、运营指标）

监控生产中的ML系统，您应该跟踪哪些指标？

为什么需要ML监控、ML监控动机、模型监控金字塔（软件后端、数据、ML模型、业务或产品KPI）、 模型监控指标（ML系统健康监测、ML数据质量监控、ML模型质量监控、业务指标和KPI）、模型监控利益相关者、 模型监控难点

模型漂移

机器学习中的概念漂移（Aporia）

机器学习中的 漂移类型（概念漂移、预测漂移、标签漂移、特征漂移）、 概念漂移可以以不同的方式出现（突然漂移、逐渐漂移、递增的漂移、重复出现的概念）、 概念漂移的两种类型（虚拟的漂移、真正的漂移）、现实生活中的概念漂移、概念漂移的难点

机器学习概念漂移检测方法（Aporia）

统计方法（JS散度、KL散度、KS检验）、 统计过程控制方法（DDM/EDDM、CUMSUM及其变体PH）、 时间窗口分布方法（ADWIN、Paired Learners）、 上下文方法（树特征）、漂移检测实现工具

如何检测和克服MLOps中的模型漂移

模型漂移的类型（概念漂移、数据漂移）、 解决模型漂移、创建可持续的机器学习模型

数据漂移、概念漂移以及如何监控它们（mona）

什么是数据漂移、什么是概念漂移、 数据漂移和概念漂移的区别、什么时候应该关注概念漂移、 监控数据漂移和概念漂移的建议

模型监控数据类型

如何检测文本（NLP）和图像（计算机视觉）数据漂移

四种不同类型的实时监测技术来 检测和减少模型漂移(数据质量、模型质量、模型偏差、模型可解释性)、NLP 数据漂移（协变量漂移、标签漂移、概念漂移、 模型监控方法）、图像数据漂移（ 模型监控方法）

使用 Arize 监控非结构化数据（Arize）

为什么要 Embeddings、Arize 发布 Embeddings 的支持、使用 Arize 的示例工作流程

数据漂移检测（一）：使用表格数据的多变量漂移（Arthur）

单变量漂移检测（ 测量现在通过模型的数据与 训练集之间的分布相似性）、多变量漂移检测（ 我们必须考虑数据的高维联合分布，将 多维辅助模型拟合到 训练集的完整联合分布）

数据漂移检测（二）：NLP 和 CV 中的非结构化数据（Arthur）

非结构化数据漂移检测方法、概述（向量表示、密度模型、评分）、评估

模型监控工具

ML 模型监控最佳工具

如何比较 ML 模型监控工具（易于集成、灵活性和表现力、开销、监控功能、警报）、 ML 模型监控工具（Neptune、Arize、WhyLabs、Grafana+Prometheus、 Evidently（开源）、Qualdo、Fiddler、Amazon SageMaker Model Monitor、 Seldon Alibi Detect（开源）、Censius）

一个精选的模型监控工具列表

Aporia、 Deepchecks（开源）、MLRun、 Evidently（开源）、WhyLabs

机器学习模型监控工具：Evidently 与 Seldon Alibi 对比

比较标准（兼容性、集成、能力）、Evidently（ 离线分析、实时监控）、Seldon Alibi Detect（ 离线分析、实时监控）

Evidently

如何检测、评估和可视化数据中的历史漂移（Evidently）
如何在 20 天内损坏一个模型？一个生产环境模型分析教程（Evidently）
你的模型隐藏了什么？一个评估 ML 模型的教程（Evidently）

Seldon Alibi Detect

在 IMDB 电影评论数据集上进行文本数据漂移检测（Seldon Alibi Detect）

加载 数据集/Tokenizer、预处理、 KS检验、 MMD（TensorFlow/PyTorch）、 从头开始训练的模型中的 embeddings（TensorFlow）

在 CIFAR-10 数据集上使用最大均值差异（MMD）漂移检测器（Seldon Alibi Detect）
在 CIFAR-10 数据集上使用 Kolmogorov Smirnov 数据漂移检测器（Seldon Alibi Detect）

人工智能系统（AI System）

人工智能系统（一）：概述
人工智能系统（二）：技术栈

向量数据库

云原生向量数据库Milvus（一）-简述、系统架构及应用场景
云原生向量数据库Milvus（二）-数据与索引的处理流程、索引类型及Schema

0 条评论

进击的包籽

关注