<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
    <channel>
      <title>Pastens</title>
      <link>https://liuhc.cn</link>
      <description>最近的10条笔记 on Pastens</description>
      <generator>Quartz -- quartz.jzhao.xyz</generator>
      <item>
    <title>开源项目分析</title>
    <link>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/</link>
    <guid>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/</guid>
    <description><![CDATA[ 开源项目分析 开源项目源码级深度技术分析 标题说明veScale 深度技术分析字节跳动 AI 训练系统源码分析msOpProf Simulator 模式深度技术分析华为 Ascend C 算子的 Profiling Simulator 模式CANN Runtime CAModel 深度技术分析CANN Runtime 计算架构模型分析npu_drv_camodel 驱动仿真层深度技术分析Ascend NPU 驱动仿真层分析MindSpeed-LLM vs TorchTitan vs TorchTitan-NPU 训练特性对比分析三大 LLM 训练框架并行策略/模型/优化特性全面对比SimuMax LLM分布式训练静态分析模型深度技术分析摩尔线程开源的大模型分布式训练静态分析模型. ]]></description>
    <pubDate>Wed, 03 Jun 2026 01:07:08 GMT</pubDate>
  </item><item>
    <title>SimuMax LLM分布式训练静态分析模型深度技术分析</title>
    <link>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/SimuMax-LLM%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%AD%E7%BB%83%E9%9D%99%E6%80%81%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B%E6%B7%B1%E5%BA%A6%E6%8A%80%E6%9C%AF%E5%88%86%E6%9E%90</link>
    <guid>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/SimuMax-LLM%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%AD%E7%BB%83%E9%9D%99%E6%80%81%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B%E6%B7%B1%E5%BA%A6%E6%8A%80%E6%9C%AF%E5%88%86%E6%9E%90</guid>
    <description><![CDATA[ SimuMax: 大模型分布式训练静态分析模型 深度技术分析 一、概览 属性内容项目名称SimuMax开发者Moore Threads Technology Co., Ltd（摩尔线程）代码github.com/MooreThreads/SimuMax许可Apache 2.0语言Python (25,728 lines)最新版本v1.2 (2026-05-11)核心定位LLM 分布式训练吞吐量、峰值内存、Pipeline 行为的静态分析模型（无需启动真实训练） 核心贡献 三输入驱动建模 — 以 system（硬件能力）、strategy（并行策略）、model（模型架构）三个 JSON 配置文件驱动，将训练性能预测转化为配置组合问题 支持 Dense + MoE 全系并行策略 — 涵盖 TP / PP / EP / CP / SP / ZeRO-1 / recompute / MLA / ... ]]></description>
    <pubDate>Wed, 03 Jun 2026 00:00:00 GMT</pubDate>
  </item><item>
    <title>ByteDance Cloud-Native LLM Inference 深度分析</title>
    <link>https://liuhc.cn/Knowledge/%E8%AE%BA%E6%96%87%E5%88%86%E6%9E%90/%E8%8A%AF%E7%89%87%E5%BB%BA%E6%A8%A1/ByteDance-Cloud-Native-LLM-Inference-%E6%B7%B1%E5%BA%A6%E5%88%86%E6%9E%90</link>
    <guid>https://liuhc.cn/Knowledge/%E8%AE%BA%E6%96%87%E5%88%86%E6%9E%90/%E8%8A%AF%E7%89%87%E5%BB%BA%E6%A8%A1/ByteDance-Cloud-Native-LLM-Inference-%E6%B7%B1%E5%BA%A6%E5%88%86%E6%9E%90</guid>
    <description><![CDATA[ ByteDance 云原生 LLM 推理工作负载特征分析与未来 AI 加速器优化机遇 Characterizing Cloud-Native LLM Inference at ByteDance and Exposing Optimization Challenges and Opportunities for Future AI Accelerators HPCA 2026 — ByteDance (豆包) × 清华大学 一、论文概览 属性内容标题Characterizing Cloud-Native LLM Inference at Bytedance and Exposing Optimization Challenges and Opportunities for Future AI Accelerators会议HPCA 2026 (International Symposium ... ]]></description>
    <pubDate>Thu, 28 May 2026 00:00:00 GMT</pubDate>
  </item><item>
    <title>📚 知识库</title>
    <link>https://liuhc.cn/Knowledge/</link>
    <guid>https://liuhc.cn/Knowledge/</guid>
    <description><![CDATA[ 📚 知识库 AI Workload Modeling &amp; Simulation 相关研究、分析与学习笔记 目录说明业界动态分析业界最新技术动态与基础设施分析开源项目分析开源项目源码级深度技术分析论文分析学术论文深度技术分析笔记性能建模仿真性能建模与仿真系统性学习路径 快捷入口: 论文分析目录 · 性能建模仿真目录 . ]]></description>
    <pubDate>Thu, 21 May 2026 09:14:12 GMT</pubDate>
  </item><item>
    <title>业界动态分析</title>
    <link>https://liuhc.cn/Knowledge/%E4%B8%9A%E7%95%8C%E5%8A%A8%E6%80%81%E5%88%86%E6%9E%90/</link>
    <guid>https://liuhc.cn/Knowledge/%E4%B8%9A%E7%95%8C%E5%8A%A8%E6%80%81%E5%88%86%E6%9E%90/</guid>
    <description><![CDATA[ 业界动态分析 业界最新技术动态、基础设施分析 日期标题2026-05-21OpenAI MRC 超级计算机网络协议深度分析. ]]></description>
    <pubDate>Thu, 21 May 2026 02:40:56 GMT</pubDate>
  </item><item>
    <title>Pastens</title>
    <link>https://liuhc.cn/</link>
    <guid>https://liuhc.cn/</guid>
    <description><![CDATA[ Pastens AI Workload Modeling &amp; Simulation About Haocheng Liu. Principle Research Engineer, Fullstack. 9-years work experience at Huawei. ]]></description>
    <pubDate>Thu, 21 May 2026 02:40:56 GMT</pubDate>
  </item><item>
    <title>OpenAI MRC 超级计算机网络协议深度分析</title>
    <link>https://liuhc.cn/Knowledge/%E4%B8%9A%E7%95%8C%E5%8A%A8%E6%80%81%E5%88%86%E6%9E%90/OpenAI-MRC-%E8%B6%85%E7%BA%A7%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE%AE%E6%B7%B1%E5%BA%A6%E5%88%86%E6%9E%90</link>
    <guid>https://liuhc.cn/Knowledge/%E4%B8%9A%E7%95%8C%E5%8A%A8%E6%80%81%E5%88%86%E6%9E%90/OpenAI-MRC-%E8%B6%85%E7%BA%A7%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE%AE%E6%B7%B1%E5%BA%A6%E5%88%86%E6%9E%90</guid>
    <description><![CDATA[ OpenAI 联合 AMD、Broadcom、Intel、Microsoft、NVIDIA 发布的 MRC (Multipath Reliable Connection) 多路径可靠连接协议深度分析 ]]></description>
    <pubDate>Thu, 21 May 2026 00:00:00 GMT</pubDate>
  </item><item>
    <title>MindSpeed-LLM vs TorchTitan vs TorchTitan-NPU 训练特性对比分析</title>
    <link>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/MindSpeed-LLM-vs-TorchTitan-vs-TorchTitan-NPU-%E8%AE%AD%E7%BB%83%E7%89%B9%E6%80%A7%E5%AF%B9%E6%AF%94%E5%88%86%E6%9E%90</link>
    <guid>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/MindSpeed-LLM-vs-TorchTitan-vs-TorchTitan-NPU-%E8%AE%AD%E7%BB%83%E7%89%B9%E6%80%A7%E5%AF%B9%E6%AF%94%E5%88%86%E6%9E%90</guid>
    <description><![CDATA[ MindSpeed-LLM vs TorchTitan vs TorchTitan-NPU 训练特性对比分析 三个框架分别代表了 LLM 训练领域的三种不同哲学： MindSpeed-LLM — 华为 Ascend 生态的全功能训练套件（基于 Megatron-LM 深度定制） TorchTitan — Meta PyTorch 团队的 PyTorch Native 新一代框架（ICLR 2025） TorchTitan-NPU — 华为在 TorchTitan 上的 NPU 插件化扩展 一、概览 属性MindSpeed-LLMTorchTitanTorchTitan-NPU开发者华为昇腾 AIMeta (PyTorch 团队)华为昇腾 SIG版本v26.0.0 (core_v0.12.1)v0.2.00.2.2.post2基础框架Megatron-LM 深度定制PyTorch Nativ... ]]></description>
    <pubDate>Thu, 21 May 2026 00:00:00 GMT</pubDate>
  </item><item>
    <title>veScale 深度技术分析</title>
    <link>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/veScale-%E6%B7%B1%E5%BA%A6%E6%8A%80%E6%9C%AF%E5%88%86%E6%9E%90</link>
    <guid>https://liuhc.cn/Knowledge/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E6%9E%90/veScale-%E6%B7%B1%E5%BA%A6%E6%8A%80%E6%9C%AF%E5%88%86%E6%9E%90</guid>
    <description><![CDATA[ veScale 深度技术分析 一、概览 属性内容项目veScale — ByteDance Seed 的开源 PyTorch 分布式训练库GitHubgithub.com/volcengine/veScale ⭐ ~0.8K论文 1veScale: Consistent and Efficient Tensor Programming with Eager-Mode SPMD (arXiv Sep 2025)论文 2veScale-FSDP: Flexible and High-Performance FSDP at Scale (arXiv Feb 2026)机构ByteDance Seed (字节跳动 Seed 团队)LicenseApache 2.0核心创新RaggedShard 非对称分片格式 + Eager-mode SPMD + 零拷贝 FSDP 通信 项目演化 veScale... ]]></description>
    <pubDate>Tue, 19 May 2026 00:00:00 GMT</pubDate>
  </item><item>
    <title>性能建模与仿真全面导论：从芯片到系统的系统性学习路径</title>
    <link>https://liuhc.cn/Knowledge/%E6%80%A7%E8%83%BD%E5%BB%BA%E6%A8%A1%E4%BB%BF%E7%9C%9F/%E6%80%A7%E8%83%BD%E5%BB%BA%E6%A8%A1%E4%B8%8E%E4%BB%BF%E7%9C%9F%E5%85%A8%E9%9D%A2%E5%AF%BC%E8%AE%BA%EF%BC%9A%E4%BB%8E%E8%8A%AF%E7%89%87%E5%88%B0%E7%B3%BB%E7%BB%9F%E7%9A%84%E7%B3%BB%E7%BB%9F%E6%80%A7%E5%AD%A6%E4%B9%A0%E8%B7%AF%E5%BE%84</link>
    <guid>https://liuhc.cn/Knowledge/%E6%80%A7%E8%83%BD%E5%BB%BA%E6%A8%A1%E4%BB%BF%E7%9C%9F/%E6%80%A7%E8%83%BD%E5%BB%BA%E6%A8%A1%E4%B8%8E%E4%BB%BF%E7%9C%9F%E5%85%A8%E9%9D%A2%E5%AF%BC%E8%AE%BA%EF%BC%9A%E4%BB%8E%E8%8A%AF%E7%89%87%E5%88%B0%E7%B3%BB%E7%BB%9F%E7%9A%84%E7%B3%BB%E7%BB%9F%E6%80%A7%E5%AD%A6%E4%B9%A0%E8%B7%AF%E5%BE%84</guid>
    <description><![CDATA[ 性能建模与仿真全面导论：从芯片到系统的系统性学习路径 本文基于知识库中 ~60 篇性能建模仿真相关的芯片建模、训练系统、推理系统、缓存系统和开源项目分析笔记编写而成，旨在为新接触本领域的同事提供从理论基础到前沿方法论的系统性入门指南。 一、为什么需要性能建模与仿真？ 1.1 核心问题 在 AI 基础设施领域，我们面临一个根本性矛盾： 硬件/系统的设计空间增长 &gt;&gt; 实际部署/测试的能力增长 具体体现在： 场景问题举例芯片设计流片前无法验证性能一次流片成本 $10M+，周期 12-18 个月推理部署配置空间巨大模型×GPU×并行策略×批大小×调度策略 = 数万种组合训练集群采购前需规划1024 GPU 集群需 $5-10M，跑一次基准测试需 42K GPU 小时架构探索新方案评估难MoE 中专家数、Top-K 值、路由策略的联合搜索 性能建模与仿真就是解决这一矛盾的核心方法：用低... ]]></description>
    <pubDate>Tue, 19 May 2026 00:00:00 GMT</pubDate>
  </item>
    </channel>
  </rss>