CANN(Compute Architecture for Neural Network)是昇腾 AI 计算平台的核心架构,它定义了神经网络计算的 “协作规则”。本文将深入解析 CANN 的逻辑架构,帮助开发者理解昇腾 AI 算力的底层运行机制。

一、应用层:多样化的 AI 应用入口

应用层是 CANN 与开发者的 “交互界面”,包含两类核心组件:

  • 推理与训练入口:支持推理 APP 直接调用,也兼容 MindSpore、TensorFlow、Caffe 等主流 AI 框架,让开发者可基于既有技术栈接入。
  • 工具链与库:提供 Bias 加速库、AutoML、模型小型化工具、MindStudio 工具链,覆盖模型优化、自动化训练、工程化部署等全流程需求。

二、芯片使能层:AI 计算的 “能力引擎”

芯片使能层是 CANN 的核心,承担 “图优化、编译、算子执行” 的关键职责,包含多个技术组件:

  • 图引擎(GE):负责神经网络图的优化,如子图切分、算子融合,提升计算效率。
  • 融合编译(FE)ACPU 引擎集合通信引擎(HCCI):FE 处理前端编译逻辑,ACPU 引擎负责 CPU 侧算子执行,HCCI 实现多设备间的集合通信,三者协同保障计算任务的高效分发。
  • 张量加速引擎(TBE)算子库:TBE 是昇腾特有的张量加速引擎,专为 AI Core 优化;算子库提供丰富的预实现算子,满足常见神经网络计算需求。
  • 运行管理器(Runtime)数字视觉预处理(DVPP):Runtime 负责设备、内存、流的运行时管理;DVPP 针对视频 / 图像场景,提供编解码、预处理加速能力。

三、计算资源层:AI 算力的 “物理底座”

计算资源层是 CANN 的硬件支撑,分为计算设备通信链路两部分:

  • 计算设备
    • AI Core:昇腾芯片的核心计算单元,专为神经网络算子(N 类算子)优化,是大算力的核心来源。
    • AICPU:负责 CPU 侧算子执行,处理 AI Core 不擅长的通用计算任务。
    • DVPP 硬件:专用的视频 / 图像处理硬件,卸载 CPU 的多媒体处理压力。
  • 通信链路
    • PCIe:实现芯片与 CPU 之间的高速数据传输。
    • HCCS:保障多芯片间缓存一致性,支持多卡协同计算。
    • RoCE:实现芯片间的 RDMA(远程直接内存访问),降低通信延迟。

四、系统管理层:全生命周期的运维支撑

系统管理层为 CANN 提供 “保驾护航” 的运维能力,包含:

  • 系统启动 / 监控 / 配置:保障平台稳定启动,实时监控运行状态,支持参数动态调整。
  • 低功耗 / 日志 / 住断 / 故障 / 设备管理:从功耗优化到故障排查,覆盖 AI 平台全生命周期的运维需求。

总结

CANN 逻辑架构通过 “应用层 - 芯片使能层 - 计算资源层 - 系统管理层” 的分层设计,实现了 AI 应用、软件框架、硬件资源的高效协同。理解这一架构,是开发者优化昇腾 AI 应用性能、解决技术瓶颈的关键前提。

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。

报名链接:https://www.hiascend.com/developer/activities/cann20252

Logo

CANN开发者社区旨在汇聚广大开发者,围绕CANN架构重构、算子开发、部署应用优化等核心方向,展开深度交流与思想碰撞,携手共同促进CANN开放生态突破!

更多推荐