Skip to content

云原生课程表

go 专家课

001 | 实战项目背景:通过 OneX 项目设计背景及方式,洞察课程设计思路,提高课程学习效率

002 | 实战项目介绍:OneX,一个功能全、扩展强、代码质量高、源自一线大厂的企业级 GO+云原生实战项目

003 | 实战项目介绍:通过 OneX 功能列表,感受 OneX 项目的价值

004 | 项目部署(1):如何快速准备一个易用的 Go 开发环境?

005 | 项目部署(2):如何使用 Docker 快速部署 OneX 项目?

006 | 项目部署(3):通过测试,了解 OneX 项目的使用方式和功能

007 | 项目部署(4):手把手教你部署 OneX 实战项目,通过动手实践,高效学习企业应用部署技能

008 | 二次开发实操:如何对 OneX 项目进行代码修改,并编译、部署、测试?

009 | 排障指南:OneX 项目部署排障指南

010 | 规范先行:好的项目,从制定并遵守规范开始

011 | 开发流程(1):Go 项目开发中,研发流程是什么样的?

012 | 开发流程(2):Go 项目开发中,代码提交的工作流如何设计?

013 | 开发流程(3):了解 OneX 项目开发流程,参与 OneX 项目的开发,提高你的学习效率

014 | 版本发布(上):如何发布版本?

015 | 版本发布(中):如何自动生成语义化的版本号和 CHANGELOG?

016 | 版本发布(下):如何自动生成 CHANGELOG ?

017 | 项目设计:如何开发一个易扩展、易维护的 Go 项目?

018 | 编程范式(上):命令式编程范式介绍与实战

019 | 编程范式(下):声明式编程范式介绍与实战

020 | 项目设计:如何给大型项目设计一个易维护、易扩展的目录结构?

021 | 架构设计(理论):Go 项目中如何优雅的设计简洁架构,以及如何实现?

022 | 架构设计(实战):学习 zero-fakeserver 组件,掌握企业应用开发中如何设计、开发简洁架构

023 | 项目文档:常见的 API 文档编写方式有哪些,如何优雅的编写项目的 API 文档?

024 | 项目文档:如何使用 vitepress 生成项目文档?

025 | ID 生成:Go 项目如何生成全局唯一 ID?

026 | 设计模式:Go 常用设计模式精讲及实战

027 | 基础功能(日志):如何设计一个易用、功能齐全的日志包?

028 | 基础功能(错误):API 接口常见的错误返回方式有哪些?如何设计一个优雅的错误返回码?

029 | 基础功能(错误实战):Kratos 框架 error 包源码解析及开发实战

030 | 基础功能(版本):如何给应用添加易读、易用的版本信息,方便排查问题?

031 | 应用构建(基础):应用构建三剑客 pflag、viper、cobra 核心功能介绍及开发实战

032 | 应用构建(实战):如何构建一个优秀的企业应用框架?

033 | Web 应用(基础):开发 Web 应用的常见方法有哪些,以及如何开发一个 Web 应用?

034 | Web 应用(HTTP):教你掌握 HTTP 服务基础知识,并带你快速开发一个简单的 HTTP 服务

035 | Web 应用(Gin 框架)什么是 Gin 中间件,常用的 Gin 中间件有哪些,如何使用?

036 | Web 应用(GRPC):如何开发一个简单的 gRPC 服务?

037 | Web 应用(微服务):如何使用 kratos 框架开发一个简单的微服务?

038 | Web 应用(微服务):微服务如何添加中间件,增强服务功?

039 | 核心功能(限流):限流策略有哪些,如何实现一个限流中间件?

040 | 应用安全(HTTPS):应用程序应该如何使用 HTTPS 协议通信,确保通信安全?

041 | 应用安全:如何制作 CA 证书?

042 | 应用安全(理论):应用程序认证功能如何设计、实现?

043 | 应用安全(实战):OneX 项目认证功能开发实战

044 | 应用功能(Web 应用):如何实现一个优秀的 Web 服务?

045 | 应用功能(认证授权):如何设计和实现一个认证和授权服务器?

046 | 应用功能(接入层):如何设计并实现一个统一接入层?

047 | 核心功能(有限状态机):Go 语言如何实现有限状态机?

048 | 应用功能(分布式作业):如何设计和实现一个异步任务处理服务?

049 | 应用功能(资源限流):如何设计和实现分布式资源限流服务?

050 | 应用功能(ETL):如何实现一个 ETL 数据抽取服务

051 | 应用功能(代码检查):如何实现一个静态代码检查工具

052 | 应用功能(命令行):如何实现一个优秀的命令行工具?

053 | 应用功能(SDK):OneX 如何对外提供 SDK 访问能力?

054 | 应用功能(代码生成):如何开发一个代码生成工具?

055 | 缓存实战(基础):缓存基础知识扫盲

056 | Go 特性(前置学习,泛型):Go 语言泛型详解及实战

057 | Go 特性(前置学习,实战):泛型在 OneX 项目中的实战

058 | 缓存实战(实战):如何开发一个缓存包

059 | 缓存实战(OneX 实战):OneX 项目二级缓存实战

060 | 应用功能(缓存、元数据):如何设计和开发一个缓存服务?

061 | 核心功能(优雅关停):配置应用程序优雅关停策略,提高程序健壮性

062 | 核心功能(参数校验):在大型企业级应用中,如何优雅的进行请求校验?

063 | 核心功能(Protobuf 插件):如何设计和开发一个 Protobuf 插件?

064 | 核心功能(事务):如何在简洁架构中优雅的实现事务处理?

065 | 核心功能(分布式锁):有状态服务如何优雅的通过分布式锁,实现多副本容灾?

066 | 依赖注入:什么是依赖注入,如何优雅的使用依赖注入提高开发效率?

067 | Go 特性(Embed):Embed 是什么,如何使用?

068 | 国际化(理论):什么是国际化,以及如何优雅的实现国际化?

069 | 国际化(实战):OneX 项目是如何实现国际化的?

070 | 幂等设计(理论):为什么需要幂等调用,以及如何优雅的实现幂等调用?

071 | 幂等设计(实战):OneX 项目是如何实现幂等调用的?

072 | Go 特性(多工作区):Go 工作区模式介绍,以及如何使用多模块工作区

073 | 中间件(MySQL,上):一文讲全 GORM 操作

074 | 中间件(MySQL,ä):如何使用 GORM 操作 MySQL 数据库?

075 | 中间件(Redis):Redis 操作实战及 OneX 项目操作实战

076 | 中间件(Etcd):Etcd 操作实战及 OneX 项目操作实战

077 | 中间件(MongoDB):MongoDB 操作实战及 OneX 项目操作实战

078 | 中间件(Kafka):Kafka 操作实战及 OneX 项目操作实战

079 | 客户端 SDK:如何优雅的开发一个 HTTP/RPC Client SDK?

080 | 项目测试(上):Go 代码测试种类有哪些,如何编写测试用例?

081 | 项目测试(中):如何进行代码性能分析,提升代码性能的手段有哪些?

082 | 项目测试(下):如何测试、分析并优化 API 接口性能?

083 | 项目管理(1):代码静态检查最佳实践及 OneX 项目实践

084 | 项目管理(2):如何通过 Makefie 来高效管理你的项目?

085 | 项目管理(3):OneX 项目中,还有哪些项目管理方式值得我们去学习?

086 | 项目管理(4):OneX 项目中核心脚本介绍

087 | 项目管理(5):如何使用 Githooks 进行提交拦截?

088 | 项目管理(6):如何生成项目文档?

089 | 项目管理:如何高效生成 GORM Model

090 | 应用部署:应用软件 Systemd 部署方式介绍及实战

091 | 代码设计:如何开发一个易扩展、可复用的 Go 包?

092 | 代码设计:如何设计和开发一个易扩展的项目?

093 | 代码设计:Go 项目开发中,如何合理的共享 Go 包?

094 | 鸟瞰 Go 语言:Go 语言生态圈介绍

095 | 开发技巧:Go 常用开发技巧有哪些?

096 | Go 项目开发专家实战课结课考试

097 | Go 语言高级开发工程师能力评估考试

098 | 附录:Go 项目开发专家实战课附录

099 | 未来会持续不断更新该课程(新增内容、更新之前的内容等)

k8s 集群安装课

前言 | Kubernetes 集群安装课程介绍

02 | 组件版本和配置策略

03 | 初始化系统和全局变量

04 | 创建 CA 根证书和秘钥

05 | kubectl

06 | Etcd 集群

07 | 部署 Master 节点组件

08 | 部署 Worker 节点组件

09 | 验证 Kubernetes 集群功能

10 | Addons 部署(1):部署 Kubernetes Dashboard

11 | Addons 部署(2):部署 Prometheus

12 | 清理 Kubernetes 集群

13 | Kubernetes 源码编译

14 | 附录 A:安装过程问题记录

15 | 附录 B:部署 EFK 插件

16 | 附录 C:部署 Flannel 网络插件

17 | 附录 D:部署 Harbor 镜像服务

18 | 附录 E:配置浏览器访问 kube-apiserver 安全端口

19 | 附录 F:部署 metrics-server 插件

20 | 附录 G:校验 TLS 证书

k8s 源码剖析课

01 | 开篇词 | Kubernetes 源码剖析课导读

02 | 耳熟能详的云计算是什么?

03 | 究竟什么是云原生?

04 | 云原生中有哪些核心技术栈?

05 | 为什么要学习云原生技术及开发?

06 | 如何学习云原生技术?

07 | 云原生开发实战课介绍及如何学习?

08 | 如何高效的阅读开源项目源码?

09 | 如何高效阅读 Kubernetes 源码?

10 | 如何给 Kubernetes 社区贡献源码?

11 | Kuberentes 架构及核心组件介绍

12 | Kuberentes 有哪些核心概念核心资源和?

13 | 通过 Pod 创建流程来了解 Kubernetes

14 | Kubernetes 代码仓库介绍

15 | Kubernetes 集群部署方法有哪些,如何选择?

16 | 如何配置和创建一个 Kind 集群?

17 | 如何在 Kubernetes 集群中部署 Web 服务?

18 | 一文读懂 Kubernetes 源码构建、测试和本地调试的方法

19 | Kuberentes 是如何管理 Go 依赖包的?

20 | 通过 Kubernetes 应用构建模型,来看如何构建应用?

21 | 剖析 Kubernetes 应用构建模型

22 | Kubernetes 是如何设计 REST 资源的?

23 | Kubernetes 是如何定义标准化资源对象的?

24 | Kubernetes 资源对象实现源码剖析

25 | Kubernetes 是如何设置 HTTP 接口路径的?

26 | Kubernetes 中资源核心概念精讲

27 | Kubernetes 支持哪些 RESTful API 接口?

28 | 如何使用 go-restful 开发一个 Web 服务器?

29 | Kubernetes 路由构建源码剖析

30 | Kubernetes HTTP 请求处理流程详解

31 | Kubernetes HTTP 请求逻辑核心功能点详解

32 | Kubernetes 是如何进行请求参数校验的?

33 | Kubernetes 是如何设置默认值的?

34 | Kubernetes 默认值设置函数是如何生成的?

35 | Kubernetes API 的版本兼容性机制详解

36 | Kubernetes 中如何向稳定版本添加不稳定的功能?

37 | Kubernetes 版本转换原理源码剖析

38 | kube-apiserver(上):kube-apiserver 核心代码讲解

39 | kube-apiserver(下):kube-apiserver 核心代码讲解

40 | kube-controller-manager 应用配置与构建

41 | kube-controller-manager 控制器插件源码剖析:Job Controller

42 | kube-scheduler 功能及源码概览

43 | kube-scheduler 应用配置与构建

44 | kube-shceduler 调度原理

45 | kube-scheduler 调度器实例创建

46 | kube-scheduler 调度器插件初始化

47 | kube-scheduler 调度队列管理

48 | Kubernetes Pod 调度流程

49 | Kubernetes 调度器插件源码剖析

50 | Kubernetes 调度器生态介绍

51 | 扩展能力:Kubernetes 提供了哪些扩展机制?

52 | 扩展能力:横向层、客户端层、API 层扩展机制详解

53 | 扩展能力:控制面层、基础设施层扩展机制详解

54 | 组件配置:Kubernetes 组件配置详解

55 | 组件配置:Kubernetes 组件配置开发实战

56 | Feature Gates(上):Kubernetes 中的 Feature Gates 设计

57 | Feature Gates(下):Kubernetes 中的 Feature Gates 开发实战

58 | Leader Election:Kubernetes Leader Election 原理解析

59 | Leader Election:在 Kubernetes 中使用 Leader Election 的场景

60 | Leader Election:基于 Lease 的 Leader Election 源码剖析

61 | 通过 API 接口的定义流程学习 Kubernetes API Server

62 | 动手实现一个 Kubernetes 控制器

63 | 动手实现一个 Kuberentes 调度器插件

64 | Leader Election 开发实战

65 | 结束语 | 如何在 Kubernetes 之路上走得更远?

k8s 开发实战课

001|client-go:client-go 项目介绍

002|client-go 客户端:RESTClient 客户端原理及实战

003|client-go 客户端:DiscoveryClient 客户端原理及实战

004|client-go 客户端:ClientSet 客户端原理及实战

005|client-go 客户端:DynamicClient 客户端原理及实战

006|client-go 客户端:ScaleClient 客户端原理及实战

007|client-go Informer 机制:Informer:Informer 架构设计及原理

008|client-go Informer 机制:Informer 创建及启动流程分析

009|client-go Informer 机制:Reflector 源码剖析与实战

010|client-go Informer 机制:DeltaFIFO 源码剖析与实战

011|client-go Informer 机制:Controller 源码剖析

012|client-go Informer 机制:Indexer 源码剖析与实战

013|client-go 核心功能:WorkQueue 源码剖析与实战

014|client-go 核心功能:EventBroadcaster 事件管理器

015|client-go 核心功能:乐观锁原理与实战

016|client-go 核心功能:client-go 多副本选举功能设计与实战

017|client-go 活学活用:如何开发 client-go 风格的 Go SDK?

018|client-go 活学活用:client-go 中有哪些开发技巧可供我们学习使用?

019|自定义资源:Kubernetes CRD 概念及功能介绍

020|自定义资源:自定义资源的创建和定义

021| 自定义资源:Kubernetes CRD 部署实战

022|自定义资源: 自定义资源的高级功能

023|自定义资源: 自定义资源的扩展

024|自定义资源: 如何自定义资源版本

025|自定义资源:结构化 Schema 与 CRD 的未来

026|自定义资源: 自定义资源的最佳实践和注意事项

027|自定义资源: 自定义资源的社区支持和资源

028|代码自动生成:为什么需要代码生成器?

029|代码自动生成: 如何调用代码生成器?

030|代码自动生成: 如何通过标签控制代码生成器?

031|代码自动生成:如何生成 client-go 风格 的 Go SDK?

032|代码自动生成:各类代码生成开发与实战

033|Controller:Controller 有哪些类型,如何选择合适的 Controller 类型并高效快速的开发?

034|Custom Controller:如何开发一个最简单的 Controller?

035| Custom Controller:sample-controller 介绍、部署及使用

036|Custom Controller:sample-controller 实现详解

037|Custom Controller:如何基于 sample-controller 快速开发一个 controller?

038|controller-runtime 原理及实战:controller-runtime 原理及实战

039|controller-runtime 原理及实战:Manager 模块源码剖析

040|controller-runtime 原理及实战:Controller 模块源码剖析

041|controller-runtime 原理及实战:Client 模块源码剖析

042|controller-runtime 原理及实战:Cache 模块源码剖析

043|controller-runtime 原理及实战:WebHook 模块源码剖析

044|controller-runtime 原理及实战:Reconciler 模块源码剖析

045|controller-runtime 原理及实战:Source 模块源码剖析

046|controller-runtime 原理及实战:EventHandler 模块源码剖析

047|controller-runtime 原理及实战:Predicate 模块源码剖析

048|controller-runtime 原理及实战:controller-runtime 最佳实践

049|controller-runtime 原理及实战:kubebuilder 实战及源码解读

050|controller-runtime 原理及实战:controller-tools 介绍及实战

051|Operator Controller:如何使用 Kuerbuild 快速开发一个 Operator

052|Operator Controller:如何部署 Operator?

053|Operator Controller:社区有哪些优秀的 Operator,它们分别用在什么场景?

054|开源 Operator 实战:使用 jaeger-operator 重新部署 Jaeger

055|聚合 API 服务器:我们为什么需要编写一个 Aggregated APIServer

056|聚合 API 服务器:kube-apiserver 聚合架构实现剖析

057|聚合 API 服务器:如何部署聚合 API 服务器?

058|聚合 API 服务器:如何实现一个准入 Webhook?

059|自定义 API 服务器:sample-apiserver 介绍、部署及使用

060|自定义 API 服务器:sample-apiserver 实现详解

061|自定义 API 服务器:如何基于 sample-apiserver 开发自定义 API 服务器?

062|APIServer 项目实战:如何基于 sample-apiserver 开发一个不依赖于 Kubernetes 的 APIServer?

063|https://blog.gmem.cc/kubernetes-style-apiserver

064|APIServer 项目实战:onex-apiserver 架构设计详解

065|APIServer 项目实战:onex-apiserver 启动流程分析

066|APIServer 项目实战:onex-apiserver 如何完美使用 kubectl 提供的功能

067|APIServer 项目实战:如何注册一个新的资源类型(资源添加、注册、Table 功能)?

068|APIServer 项目实战:onex-apiserver 如何迁移 Kubernetes 原生的资源?

069|APIServer 项目实战:onex-apiserver Admission Controller 实现解析

070|APIServer 项目实战:如何添加一个 Adminssion Webhook?

071|APIServer 项目实战:如何添加 Authentication Webhook?

072|APIServer 项目实战:如何添加一个 Authorization Webhook?

073|APIServer 项目实战:认证和授权服务开发

074|Controller 项目实战:onex-controller-manager 实现分析

075|Controller 项目实战:onex-minerset-controller 实现分析

076|Controller 项目实战:onex-miner-controller 实现分析

077|Controller 项目实战:onex controller 事件过滤器剖析

078|Controller 项目实战:Controller 缓存能力建设

079|Controller 项目实战:如何仅依赖 onex-apiserver 生成全局唯一 ID?

080|Controller 项目实战:如何提高 Reconcile 吞吐量及如何进行客户端限流?

081|Controller 项目实战:如何通过 controller 删除资源?

082|Controller 项目实战:Controller 性能测试及分析

083|Controller 项目实战:Controller 多副本选举功能实现及部署(两种选举机制)

084|Controller 项目实战:如何测试 Controller?

085|Controller 项目实战:开发 Controller 时,有哪些坑,如何避免?

086|核心能力构建:OneX 配额限制能力建设

087|核心能力构建:OneX 安全能力建设

088|核心能力构建:OneX 事件能力建设

089|核心能力构建:onex-apiserver 性能测试及分析

090|核心能力构建:onex-apiserver FeatureGate 功能实现

091|核心能力构建:如何使用 Kuberentes 的方式来配置 OneX 服务?

092|核心能力构建:如何全方位监控你的应用?

093|核心能力构建:如何构建一个可快速排障的日志系统?

094|容器化部署实战:软件发布流程、环境及多环境处理

095|容器化部署实战:Docker 镜像的构建原理和方式

096|容器化部署实战:如何编写 Dockerfile 文件?

097|容器化部署实战:如何编写 Kubernetes 资源定义文件?

098|容器化部署实战:服务部署时,如何进行权限管控?

099|容器化部署实战:使用 Kuberentes 资源定于文件部署 OneX 项目

100|Kustomize 部署实战:Kustomize 基础及使用实战

101|Kustomize 部署实战:基于 Kustomize 的应用部署实战

102|Helm 部署实战:Helm 基础知识介绍

103|Helm 部署实战:Helm 基本操作实战

104|Helm 部署实战:使用 Helm 部署 OneX 应用实战

105|运维能力构建实战(日志):如何快速构建 OneX 的日志排障系统?

106|运维能力构建实战(监控):如何快速构建 OneX 的监控体系?

107|运维能力构建实战(调用链):如何快速构建 OneX 的调用链体系?

108|进入圈子:云原生生态圈介绍

109|开源贡献:如何向开源社区贡献代码?

110|一份云原生面试准备清单

111|云原生高级开发工程师能力评估考试

112|下一站:学完 Kubernetes 编程的下一站是哪里?如何进一步提升技术能力、职场竞争力,并获取更高的职场收益?

LLMOPS 开发实战课

前言 | LLMOPS 开发实战课课程介绍

01 | 什么是 LLMOPS?

02 | 业界有哪些优秀的 LLMOPS 平台

03 | 了解大模型的能力

04 | LLMOPS 平台(Dify):Dify 介绍及实现剖析

05 | LLMOPS 平台(Coze):Coze 介绍及实现剖析

06 | LLMOPS 平台(BetterYea):BetterYea 介绍及实现剖析

07 | LLMOPS 平台一般有哪些核心功能?

08 | 核心概念:什么是智能体(Agent)?

09 | 核心概念:如何提高职业竞争力,避免被 Agent 替代?

10 | 核心概念:什么是 RAG?

11 | 核心概念:RAG 架构、原理及实现

12 | 如何开发一个 LLMOPS 平台

13 | EasyAI 平台架构介绍及架构设计

14 | EasyAI 声明式及命令式编程设计

15 | 部署:LLMOPS 平台快速部署

16 | 业界开源的 AI 相关的包介绍

17 | LangChainGo:LangChainGo 介绍及原理

18 | LangChainGo :LangChainGo 开发实战

19 | Agent 的常见推理模式介绍

20 | 核心功能:如何开发一个智能体?

21 | 智能体记忆能力设计和实现

22 | 智能体技能设计和实现

23 | 智能体 Function call

24 | 智能体流式输出功能实现

25 | 智能体个性化配置功能设计和实现

26 | 智能体评估:如何设计和实现智能体评估功能

27 | 核心功能:如何开发数据集功能?

28 | Minio 核心原理介绍

29 | Minio 实战

30 | 核心功能:如何实现数据处理?

31 | 多模态介绍

32 | 提示词:如何开发 Prompt 功能?

33 | 提示词:如何实现 Auto Prompt?

34 | 提示词:如何调优 Prompt?

35 | 核心功能:如何实现 RAG 功能?

36 | 向量数据库原理及实战

37 | Milvus 核心原理介绍

38 | Milvus 实战

39 | 知识库内容分片及处理

40 | 文本向量化功能设计和实现

41 | 检索器功能设计和实现

42 | 核心功能(1):如何实现工作流功能?

43 | 核心功能(2):如何实现工作流功能?

44 | 核心功能(3):如何实现工作流功能?

45 | 核心功能(4):如何实现工作流功能?

46 | 核心功能(5):如何实现工作流功能?

47 | 核心功能:如何实现工作流插件?

48 | 核心功能:如何先 Agent 效果评估功能?

49 | 核心功能(模型仓库,上):如何实现一个模型仓库?

50 | 核心功能(模型仓库,下):如何实现一个模型仓库?

51 | 核心功能(模型训练,上):业界常见的模型训练方法有哪些?

52 | 核心功能(模型训练,中):如何设计和实现一个模型训练功能?

53 | 核心功能(模型训练,下):EasyAI 项目模型训练功能设计和实现

54 | 模型评估:如何设计和实现模型对比功能?

55 | 核心功能(模型部署):如何部署一个模型?

56 | 核心功能(仓库,1):如何设计和实现模型仓库功能?

57 | 核心功能(仓库,2):EasyAI 项目是如何设计和实现仓库空能的?

58 | 核心功能(仓库,3):如何接入第三方模型

59 | 核心功能(仓库,4):如何部署开源模型?

60 | 核心功能(编排,上):行业中哪些编排实现及开源项目?

61 | 核心功能(编排,下):EasyAI 项目中是如何设计和实现工作流?

62 | 核心功能(编排,下):EasyAI 项目工作流设计和实现

63 | 核心功能:如何设计和实现一个工作流插件?

64 | 核心功能:如何设计和实现一个商店?

65 | Agent 调用如何进行资源限流?

66 | 部署:如何部署 LLMOPS 平台

67 | 部署:LLMOPS 平台观测能力构建

68 | 实战:RAG 功能体验测试

69 | 实战:Agent 功能体验测试

70 | 实战:数据集能力体验功能体验测试

71 | 实战:如何部署开源大模型?

72 | 实战:如何写好 Prompt?

73 | 实战:Agent 与 Kuberentes 运维

74 | 实战:Agent 与 Kuberentes 运维

75 | 案例:如何创建一个 Agent 实现自动项目代码生成?

76 | 案例:如何基于 EasyAI 训练一个分类模型?

77 | 案例:如何基于 EasyAI 接入一个分类模型?

k8s 调度器开发实战课

前言 | Kubernetes 调度器开发实战课程介绍

001 | Pod 调度实战演示

002 | Kubernetes 调度器概述

003 | Kubernetes 中的 Pod 调度方法

004 | Kubernetes 调度器简介

005 | Kubernetes 调度器的演进历史

006 | Pod 调度流程概览

007 | Kubernetes 调度器调度策略

008 | Kubernetes 调度器的扩展方式

009 | SIG Scheduling 兴趣小组简介

010 | Kubernetes 社区子项目介绍

011 | 业界调度项目的现状与前景

012 | Kubernetes 社区调度插件概览

013 | Kubernetes 社区调度器项目介绍

014 | 如何给 Kubernetes 社区贡献代码

015 | kube-scheduler 功能及源码概览

016 | kube-scheduler 应用配置与构建

017 | kube-scheduler 调度原理

018 | kube-scheduler 调度器实例创建

019 | kube-scheduler 调度器插件初始化

020 | kube-scheduler 调度队列管理

021 | Pod 调度流程

022 | 调度器插件实现

023 | 调度器内置调度插件概览

024 | 指定 NodeName 定点调度

025 | NodeSelector 定向调度

026 | Node 亲和性

027 | Pod 亲和性与反亲和性

028 | 资源请求与限制

029 | 污点与容忍

030 | 优先级与抢占

031 | 自定义调度策略

032 | Pod 容灾调度:Even Pod Spreading

033 | 主动保护驱逐:Pod Disruption Budget

034 | 资源紧缺时的 Pod 驱逐调度

035 | 基于服务质量等级 QoS 的 Pod 调度

036 | scheduler-plugins 项目简介

037 | scheduler-plugins 源码解析

038 | capacityscheduling 插件介绍

039 | coscheduling 插件介绍

040 | networkaware 插件介绍

041 | noderesources 插件介绍

042 | noderesourcetopology 插件介绍

043 | podstate 插件介绍

044 | preemptiontoleratio 插件介绍

045 | qos 插件介绍

046 | sysched 插件介绍

047 | trimaran 插件介绍

048 | 为什么需要 Device Plugin?

049 | 什么是 Device Plugin?

050 | Device Plugin 原理介绍

051 | Kubernetes 扩展资源介绍

052 | Device Plugin 源码剖析

053 | NVIDIA GPU 插件实现解析

054 | 社区 Device Plugin 介绍

055 | AI 场景下调度特点和挑战

056 | AI 场景下的调度策略

057 | 容器云演进方向

058 | 多集群调度面临的挑战

059 | 多集群调度常见实现方法

060 | 多集群调度插件实现举例

061 | 多集群调度实战

062 | 开发一个自定义调度器

063 | 自定义调度器的部署

064 | 调度器插件开发实战

065 | Device Plugin 开发实战

066 | descheduler 负载均衡实战

067 | 如何有效测试调度器

068 | kube-scheduler-simulator 测试实战

069 | kwok 测试实战

070 | 调度器性能优化

071 | 监控调度器

072 | 调度器排障

073 | 调度器中的软件架构模式

074 | 调度器中的软件设计模式

075 | 调度器中的软件设计技巧

076 | 调度器架构模式迁移案例

077 | 大规模集群调度

078 | 混合云环境下的调度

079 | AI 场景下的调度

080 | 降本场景下的调度

081 | 集群节点负载均衡场景下的调度

082 | 边缘计算下的调度

083 | Kubernetes 调度器功能演进

084 | 多云及 AI 场景下更多的调度支持

085 | AI 驱动的智能调度

086 | 绿色计算与能效优化调度

087 | 动态资源调度

088 | WebAssembly?

089 | 调度器性能持续优化

090 | 调度器可观测性持续增强

机器学习平台开发实战课

前言 | MLOPS 开发实战课介绍

01 | 机器学习的主流框架

02 | 机器学习平台开源项目调研及分析

03 | 机器学习“Hello World”

04 | Kubeflow 概述

05 | Kubeflow 部署与应用

06 | Kubeflow 自定义资源介绍

07 | Kubeflow PyTorchJob 介绍

08 | Kubeflow PyTorchJob 核心原理介绍

09 | Kubeflow PyTorchJob 源码分析

10 | Kubeflow PyTorchJob 源码分析

11 | Kubeflow PyTorchJob 实战

12 | Kubeflow pipleline 介绍

13 | Kubeflow pipleline 核心原理介绍

14 | Kubeflow pipleline 源码分析

15 | Kubeflow pipleline 源码分析

16 | Kubeflow pipleline 实战

17 | 模型训练:Kubeflow Katib 超参调优功能介绍

18 | 模型训练:Kubeflow Katib 超参调优架构解析

19 | 模型训练:Kubeflow Katib 超参调优核心原理

20 | 模型训练:Kubeflow Katib 超参调优源码剖析

21 | 模型训练:Kubeflow Katib 超参调优源码剖析

22 | 模型训练:Kubeflow Katib 超参调优功能实战

23 | 模型部署:Kubeflow KFServing 介绍

24 | 模型部署:Kubeflow KFServing 核心原理

25 | 模型部署:Kubeflow KFServing 架构解析

26 | 模型部署:Kubeflow KFServing 源码剖析

27 | 模型部署:Kubeflow KFServing 源码剖析

28 | 模型部署:Kubeflow KFServing 实战

29 | Kubeflow Metadata 介绍

30 | Kubeflow Metadata 核心原理

31 | Kubeflow Metadata 架构解析

32 | Kubeflow Metadata 源码剖析

33 | Kubeflow Metadata 源码剖析

34 | Kubeflow Metadata 实战

35 | EasyAI 如何对接 Kubeflow 平台