Congming Zhu's Docs
nvidia GPU Operator
正在初始化搜索引擎
    • Home
      • Index
          • HomePage
          • PageAdmin
          • fastapi_amis_admin 的主页
            • fastapi_amis_admin
            • 静态页面处理
            • 数据接入方式
          • 01 Docker搭建开发环境
          • Cyberchef
              • 01 golang 基础语法之hello world
              • 02 golang 基础语法之基础语法
              • 03 golang 基础语法之数据类型
              • 04 golang 基础语法之变量
              • 05 golang 基础语法之常量
              • 06 golang 基础语法之运算符
              • 07 golang 基础语法之条件语句
              • 08 golang 基础语法之循环语句
              • 09 golang 基础语法之函数
              • 10 golang 基础语法之变量作用域
              • 11 golang 基础语法之指针
              • 12 golang 基础语法之结构体
              • 13 golang 基础语法之切片
              • 14 golang 基础语法之范围(Range)
              • 15 golang 基础语法之集合
              • 16 golang 基础语法之递归函数
              • 17 golang 基础语法之类型转换
              • 18 golang 基础语法之接口
              • 01 golang 项目开发基础环境准备
              • 02 golang 项目开发项目设计方案
                • 01 命令行项目
            • 01 python 常用方式
            • 执行使用tcpdump抓取TCP的连接
              • Kubepi
              • Console界面配置
              • Openshift console
              • 01 rancher 安装和部署
            • etcd数据异常
            • 01 Gateway
            • Harbor存储helm chart
            • helm
            • helm模板入门
            • helm学习
              • helm内置对象
              • values文件
              • 变量
              • 命名模板
              • 在模板内部访问文件
              • 子chart和全局值
              • 模板函数列表
              • 模板函数和流水线
              • 流控制
            • 01_ingress-nginx 配置
            • 02 ingressClass的配置和使用
            • 03 ingress nginx监控
            • 04 ingress nginx 配置透传真实IP
            • 污点和容忍度
            • k8s 自签证书
            • 03 kor列出k8s 未使用的资源
            • 04 kubectl命令自动补全
            • 05 k8s根据不同命名空间指定不同节点
            • 06 k8s修改节点数量限
            • k8s 常用命令
              • kubeadm 安装 k8s
              • kubekey 部署k8s
              • POC 部署
              • 01 sealos
              • 02 sealos 构建镜像
              • 03 sealos 自定义配置
            • Kind 的主页
            • go基础语法学习
            • kubebuilder的主页
            • kubebuilder 安装
            • HAproxy负载均衡
            • Openshift 将节点踢出集群
            • openshift学习主页
            • openshift 证书升级
              • 01 openshift节点重启之后证书错误
              • 02 openshift 部分节点无法exec 进入后台和不能进入日志界面
            • opertor安装和初始化
              • nvidia GPU Operator
            • skopeo
            • trivy
            • 01 NVIDIA GPU Operator
            • 02 Nvidia GPU 虚拟化部署搭建步骤
            • 03 GPU配置
            • 04 gpu监控
            • 001 k8s删除资源时hang住案例和处理过程
              • Cert Manager
              • 01 let's encrpyt
              • Kubeconfig 创建步骤
              • 01 k8s调度器
              • Service
                • Local path storage
                • Nfs
                • openebs 部署
                • 01 如何修改默认的storageClass
              • Lxcfs
              • 01 安装搭建Istio
              • Skywalking
              • Dragonfly
              • Spegel
              • 01 使用shell 脚本进行备份
              • 01 了解Velero
              • 01 containerd支持pull 不安全仓库(http)的镜像
              • 02 containerd 工具nerdctl
            • 网络
              • 01 docker重启失败问题处理
              • 02 docker 镜像如果不支持bash如何调试
              • 03 docker 启动容器运行失败
              • attach
              • build
              • commit
              • cp
              • create
              • diff
              • events
              • exec
              • export
              • history
              • images
              • import
              • info
              • inspect
              • kill
              • load
              • login/logout
              • logs
              • pause/unpause
              • port
              • ps
              • pull
              • push
              • rm
              • rmi
              • RUN
              • save
              • search
              • docker start/stop/restart
              • status
              • tag
              • top
              • version
              • wait
              • harbor 部署
              • 01 buildx 构建镜像
              • 02 docker squash
              • 01_ubuntu搭建docker
              • 02 ubuntu卸载docker
              • 03 安装Containerd后安装docker
              • 04 手动安装docker
              • Opentelemetry基础学习
          • 磁盘性能测试
            • 09 rocky9 固定内核版本
            • rocky9 安装htop
            • rocky9 单用户
            • rocky9 命令
            • rocky9 显卡驱动安装
            • rocky9 系统安装
            • 01 什么是Linux 内核
              • borg 备份
            • Acme自动安装证书
            • Crontab
            • Dd
            • Dust
            • iotop
            • iperf 测试节点之间网速
            • jq
            • Json工具
            • logrotate
            • nfs-server
            • nfs
            • pigz用法
            • Pushd and popd
            • qemu
            • linux 常用命令
            • rsync
            • Sar
            • Scp
            • screen
            • Sed
            • Squid
            • ssh 端口转发
            • Sshpass
            • strace
            • Yum
            • zstd用法
            • 文件扩展属性
            • 磁盘分区
            • Bash界面没有颜色
            • linux离线安装软件
            • Linux 查看服务器的硬件信息
            • Linux 清理内存buffer内容
            • Linux 针对僵尸进程处理
            • Linux 设置代理
            • Shell代码例子
            • shell扩展变量
            • 为什么Linux内存得buffer 和cache 占用过高
            • kernel 内核升级
            • 磁盘IO 优化
            • linux 系统优化
            • 03 内核参数优化
            • Linux 进程学习
              • 02 kubernetes 修改 cgroup 版本
              • 03 centos7.9 升级cgroup 版本为systemd
              • 04 docker 修改cgroup版本
              • Cgroup
              • 01 systemd初始化模块
            • 网络故障排查常用命令
              • iptables 详细理解
              • 02 iptables实际操作之规则查询
              • 03 iptables规则管理
              • 04 iptables匹配条件
              • 05 iptables扩展匹配条件
              • 06 iptables扩展匹配条件之 tcp flags
              • 07 iptables匹配udp扩展之icmp匹配
              • 07 iptables扩展udp之icmp扩展
              • 08 iptables扩展模块之state扩展
              • 09 iptables黑名单机制
              • 10 iptables自定义链
              • iptables 详解
              • Vxlan
              • 01 修改网卡为eth顺序
          • Brew+on my zsh
          • administrator 管理员账户启用
          • Win通过命令行重启服务
            • 01 hyper v 简单使用
            • 02 Hyper V问题处理
            • 03 windows 家庭版如何启动hyper v
            • win11装机时跳过联网方案
            • 01 域控服务器选型搭建
            • 02 域控服务器中DNS 搭建
            • 03 域控中添加samba 服务器
            • 04 域控搭建Exchange
            • 05 域控账户管理策略配置
              • 01 加入域控后权限不足问题
              • 02 windows 加备域时sid 报错
              • 01 终端状态栏不显示
            • 01 deepseek私有化部署
          • 01 什么是高性能计算(HPC)
            • Apollo 安装和搭建
            • 01 Argo CD get start
            • 01 code server 安装和部署
            • 02 code server 编译合适的开发环境镜像
            • 01 gitlab搭建步骤
            • git 查看详细日志
            • 03 git 安装旧提交新建分支
            • 04 gitlab 对接ldap
            • 05 gitlab 拉取代码证书异常
            • 06 gitlab 添加子项目
            • 07 gitlab ee 破解
            • 08 gitlab 对接gitlab runner
            • 09 gitlab 占用内存过高排查
            • 10 gitlab 迁移代码仓库步骤
            • 00 jenkins 介绍
            • 01 jenkins安装和搭建
            • 02 jenkins 对接gitlab配置流水线
            • 03 jenkins 使用云效对android的apk 包进行编译
            • 00 SonarQube简介
            • 01 SonarQube安装
              • 01 SonarQube升级版本
            • Buildkit
            • Clickhouse
            • influxdb
            • 01 kafka
              • 01 mongo安装
              • 01_mongo 不能正常启动故障
              • 02 mongo使用副本集时连接报错
              • 01 mongodb用户和collection的维护
              • 02 mongo 查询最大连接数
              • 03 mongo删除重复数据
            • 03 mysql 查看数据库是否已被锁定
            • 04 mysql 查询表和库的空间占用
            • 05 mysql 归档方案
            • 06 mysql 性能优化
            • 07 mysql 免密
            • 08 mysql 回收表空间
            • 09 mysql 用户权限管理
            • mysql dump 备份脚本
            • mysql部署
              • Maxwell
            • 01 nginx下载安装
            • 02 nginx将http 重定向到https
            • 03 nginx配置方案
            • 04 nginx添加接口访问频率限制
            • 05 proxy protocol
            • 06 反向代理到ingress 地址
            • 07 四层代理透传证书给后端服务认证
            • 08 nginx 修改文件上传大小限制
            • 09 nginx 修改dns 解析
            • 101 nginx 示例写法
            • 01 openresty监控
            • postgres 主页
            • postgres免密登录
            • postgres 删除数据库
            • postgres 数据库增量同步
            • postgres迁移数据库
            • postgres最大链接数
              • 01 postgres 找不到检查点
            • Rabbitmq
            • 01 redis 简介
            • 02 redis 哨兵模式搭建
            • 01 RocketMQ 安装和使用
            • 02 RocketMQ 更换暴露端口方案进行部署
            • 03 执行删除topic
            • 01 ssdb 设置过期
              • 01 yearning 安装和配置
            • 01 达梦连接数问题
            • 02 查询达梦数据库总容量
            • 01 存储分类
            • 02 inotify
            • raid 配置和维护
            • beegfs测试部署
            • beegfs
            • beegfs原地升级
            • Beegfs日常维护
            • beegfs 生产安装
            • buddymirror
            • minio主页
            • 磁盘挂载
            • 01 华为云CDN
          • 01 DNS 简介和配置
          • 02 域名转移方案
            • Godaddy 介绍
            • 01 linux通过ping 域名时响应时间过长
          • 01 Jumpserver 的搭建
          • 02 jumpserver 对接域控
          • 01 softether vpn
          • 02 tailscale
          • 03 openvpn
            • Hadoop
            • 01 列式存储和行式存储方案
            • Csv
            • 01 数据库同步DTS进行数据脱敏
            • 01 雷池WAF
          • 20240823 日志分享
              • 01 elasticsearch 环境配置和搭建
              • 02 elasticsearch 的简单使用
              • Odigos
              • 01VictoriaLogs部署
                • 01 架构搭建
                • 01 vector 日志采集
                • 02 vector 配置选项
                  • 01 vector 配置
          • 01 LDAP
            • 01 Prometheus Operator
            • 02 prometheus
            • 监控方案
              • 1_背景说明
            • Victorametrics
            • ActiveMQ性能指标
            • Apache HTTP Server性能指标
            • Dell服务器性能指标
            • Docker监控指标
            • Elasticsearch性能指标
            • Kafka性能指标
            • Kubernetes监控指标
            • MongoDB性能指标
            • MySQL性能指标
            • Nginx性能指标
            • Oracle性能指标
            • PostgreSQL性能指标
            • RabbitMQ性能指标
            • Redis性能指标
            • SQL Server性能指标
            • Windows主机性能指标
            • Zookeeper性能指标
            • linux 主机性能监控指标
            • 交换机性能指标
            • 内网监控指标
            • 路由器性能指标
            • K8s 基础问题
            • 日志架构
        • 01 磁盘数据零拷贝
        • Cloudflare
              • TCP/IP网络模型
              • 01 华为交换机修改dhcp 配置
          • 喇叭河
          • 狮子山出游计划
          • 赵公山出游计划
            • 代码管理方案
            • 架构图
            • 环境检查
            • 01 部署Jumpserver
            • 02 jumpserver 使用文档
            • 01 华为云功能
            • 02 华为云ECS
          • 01 视频分片处理并播放

    nvidia GPU Operator

    文档参考: https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/getting-started.html

    ©2024 cmzhu.cn - 蜀ICP备2022026268号-1
    Made with Material for MkDocs