240 发简信
IP属地:北京
  • 120
    容器云管平台存储架构设计

    概述 k8s中每个容器都有独立的文件系统 ,容器磁盘上的文件的生命周期是短暂的(临时的)。 当容器重启或崩溃时,容器会被以“干净的”状态(镜像初始状态)重新创建,这意味着原有...

  • kubeflow搭建

    部署docker 选一个合适的源确认安装 创建目录 下载kind kind指的是Kubernetes IN Docker(用于在 Docker 容器中运行 Kubernete...

  • Volcano的gang-scheduling调度策略

    概述 Volcano的gang-scheduling(组调度)是一种调度策略,它确保一个作业的所有Pod要么全部同时启动,要么都不启动。这种策略对于需要所有任务协同执行的计算...

  • 120
    Volcano的架构 和 原理

    概述 Volcano 是一个基于 Kubernetes 的批量计算系统,专为高性能计算(HPC)、机器学习和大数据等工作负载设计。它扩展了 Kubernetes 的调度能力,...

  • kubeflow部署

    概述 kubeflow部署实操开始了,加油。 下载 下载kfctl 下载kfctl_k8s_istio.v1.2.0.yaml 执行按照

  • CRD在AI部署中的应用

    概述 CRD作为MLOps部署中的必要技术,需要重点学习和研究一下。 CRD定义 没有自定义CRD(类似数据库表结构),因此没有生成自定义的clientSet,使用的dyna...

  • kubeflow基础

    基础 问题:请简要介绍一下Kubeflow是什么? 答案:Kubeflow是一个基于Kubernetes的开源机器学习平台,旨在简化机器学习工作流程的部署和管理。它集成了多个...

  • 120
    Tensowflow深度学习流程

    Tensowflow深度学习流程基本按照这8个步骤来执行的: 一、执行图的构建1.数据的特征工程2.模型构建二、执行图的执行1.数据加载2.数据清洗3.数据划分、提取4.模型...

  • 120
    kubenetes 与 kubeflow版本匹配

    概述 kubernetes平台部署kubeflow,都适配哪些版本?查了好久才找到。 kubenetes 与 kubeflow版本匹配 https://v1-2-branch...

  • 120
    TensorFlow简介

    TensorFlow基本概念 图(Graph): 图描述了计算的过程,TensorFlow使用图来表示计算任务 张量(Tensor): TensorFlow使用tensor表...

  • 120
    terraform安装及provider下载

    概述 Terraform 是一个安全和高效的用来构建、更改和合并基础架构的工具,采用 Go 语言开发。Terraform 可管理已有的流行的服务,并提供自定义解决方案。Ter...

  • kind 部署 kubernetes 集群

    概述 kind(Kubernetes in Docker)是一个基于Docker构建的Kubernetes集群的工具,操作简单,学习成本低,非常适合用来在本地搭建基于Kube...

  • 卸载kubernetes

    1. 停止 Kubernetes 服务 2. 重置 Kubernetes 集群 3.删除 Kubernetes 包 4.删除配置文件和数据 5. 卸载 Docker(如果不再...

  • kubernetes 1.24.0部署方案

    概述 为了部署istio,需要在虚拟机环境安装kubernetes 1.24.0 。具体参考单master节点Kubernetes部署 安装前准备及预处理 节点环境: 操作系...

  • 基于云原生AI的RDMA网络分布式训练

    概述 RDMA(Remote Direct Memory Access)是新一代的网络通信技术,它允许计算机之间直接进行内存对内存的数据传输,而不需要经过操作系统或中央处理器...

  • kubeflow功能架构

    概述 kubeflow提供很多功能,这里按模块介绍下 Kubeflow 的几个核心组件: Notebook Servers,作为一个管理线上交互实验的记录工具,可以帮助算法人...

个人介绍
左手学习架构设计,右手学习项目管理,正念放中间。实践中台的本质不在于知,而在于行;其验证不在于逻辑,而在于果。