共计 76 篇文章
2025
【Megatron-LM源码分析(二)】-GPT模型pretrain流程
【Megatron-LM源码分析(一)】-环境配置与训练示例跑通
【论文阅读】The Llama 3 Herd of Models(Section 3 Pre-Training)
【论文阅读】Reducing Activation Recomputation in Large Transformer Models
【论文阅读】Megatron-LM论文阅读
【k8s APIServer 源码阅读(一)】-对象缓存
【k8s kubelet 源代码阅读(二)】-节点状态上报
【k8s kubelet 源代码阅读(一)】-Pod管理
【pytorch-fsdp 源代码阅读(二)】-参数流转
【pytorch-fsdp 源代码阅读(一)】-全流程概览