Kubeflow
Kubeflow 是在 k8s 平台之上针对机器学习的开发、训练、优化、部署、管理的工具集合,内部集成的方式融合机器学习中的很多领域的开源项目,比如 Jupyter、tfserving、Katib、Fairing、Argo 等。可以针对机器学习的不同阶段:数据预处理、模型训练、模型预测、服务管理等进行管理。只要安装了 k8s,可以在本地、机房、云环境中部署。
安装部署
关于 kubeflow 的安装部署如果没有比较好的外网访问环境的话,大家可以参考我开源的一个project,专门做国内manifest,镜像仓库都是采用阿里云镜像,在国内网络环境下也能快速轻松安装部署:
|
|
安装完成后查看等待所有 pod running。
关于其部署的各个组件介绍如下:
cert manager
dex
istio
knative
访问控制
Operator
- MPI Operator, see mpi
- Training Operators
Pipeline
参考资料
Linked Mentions
-
No backlinks found.