MAESTRO: Understanding Reuse, Performance, and Hardware Cost of DNN Dataflows

一、论文概览

属性内容
标题Understanding Reuse, Performance, and Hardware Cost of DNN Dataflows Using MAESTRO
arXiv1805.02566
发表HPCA 2018 + Emeralds 2018
机构Georgia Tech, NVIDIA
代码https://github.com/maestro-project/maestro

核心贡献

  1. 数据重用距离(Data Reuse Distance)理论:量化 DNN 数据流中的空间/时间重用
  2. 硬件成本模型:从映射自动计算所需 MAC 数、缓冲区容量、能耗
  3. 与 Timeloop 互补:MAESTRO 做数据流分析,Timeloop 做映射搜索

二、技术方法

数据重用分析

MAESTRO 将 DNN 映射分解为 Nesting & Temporal/Spatial loops,计算每层数据在不同级别的重用距离。基于重用距离估算:

指标计算方式
吞吐 (Throughput)每个时钟周期的 MAC 操作数
内存访问 (DRAM BW)基于重用距离计算 buffer miss
能耗 (Energy)数据在不同存储层级间搬运的能量成本 × 搬运次数

与 Timeloop/SCALE-Sim 分工

工具职责
MAESTRO给定映射 → 数据流分析 + 性能估算
Timeloop搜索最优映射空间
SCALE-Sim对选定映射做周期级验证

相关链接