共计 38 篇文章
2024
2024开源之夏参与经验总结
如何在K8s集群中管理与使用GPU
InternLM 书生大模型实战营
【论文阅读】{MegaScale}:Scaling Large Language Model Training to More Than 10,000 {GPUs}
【论文阅读】Fluid:Dataset Abstraction and Elastic Acceleration for Cloud-native Deep Learning Training Jobs
设置Clash代理,彻底解决linux系统Docker pull的问题
CNCF项目全景图介绍
【K8s源码分析(六)】-K8s中Pod拓扑分布约束(Pod Topology Spread Constraints)插件介绍
【K8s源码分析(五)】-K8s中Pod亲和性调度插件介绍
【K8s源码分析(四)】-K8s调度器绑定周期介绍