Kubeflow 是在 k8s 平台之上针对机器学习的开发、训练、优化、部署、管理的工具集合,内部集成的方式融合机器学习中的很多领域的开源项目,比如 Jupyter、tfserving、Katib、Fairing、Argo 等。可以针对机器学习的不同阶段:数据预处理、模型训练、模型预测、服务管理等进行管理。只要安装了 k8s,可以在本地、机房、云环境中部署。

An architectural overview of Kubeflow on Kubernetes
An architectural overview of Kubeflow on Kubernetes

安装部署

关于 kubeflow 的安装部署如果没有比较好的外网访问环境的话,大家可以参考我开源的一个project,专门做国内manifest,镜像仓库都是采用阿里云镜像,在国内网络环境下也能快速轻松安装部署:

1
git clone https://github.com/shikanon/kubeflow-manifests.gitcd kubeflow-manifestspython install.py

安装完成后查看等待所有 pod running。

关于其部署的各个组件介绍如下:

cert manager

dex

istio

knative

访问控制

Operator

  • MPI Operator, see mpi
  • Training Operators

Pipeline

kubeflow-pipelines

参考资料