昇腾 AI 计算平台 CANN 逻辑架构详解：揭开神经网络计算的技术面纱

CANN 逻辑架构通过 “应用层 - 芯片使能层 - 计算资源层 - 系统管理层” 的分层设计，实现了 AI 应用、软件框架、硬件资源的高效协同。理解这一架构，是开发者优化昇腾 AI 应用性能、解决技术瓶颈的关键前提。2025年昇腾CANN训练营第二季，基于CANN开源开放全场景，推出0基础入门系列、码力全开特辑、开发者案例等专题课程，助力不同阶段开发者快速提升算子开发技能。获得Ascend C算

2501_93660706

731人浏览 · 2025-11-18 23:44:00

2501_93660706 · 2025-11-18 23:44:00 发布

CANN（Compute Architecture for Neural Network）是昇腾 AI 计算平台的核心架构，它定义了神经网络计算的 “协作规则”。本文将深入解析 CANN 的逻辑架构，帮助开发者理解昇腾 AI 算力的底层运行机制。

一、应用层：多样化的 AI 应用入口

应用层是 CANN 与开发者的 “交互界面”，包含两类核心组件：

推理与训练入口：支持推理 APP 直接调用，也兼容 MindSpore、TensorFlow、Caffe 等主流 AI 框架，让开发者可基于既有技术栈接入。
工具链与库：提供 Bias 加速库、AutoML、模型小型化工具、MindStudio 工具链，覆盖模型优化、自动化训练、工程化部署等全流程需求。

二、芯片使能层：AI 计算的 “能力引擎”

芯片使能层是 CANN 的核心，承担 “图优化、编译、算子执行” 的关键职责，包含多个技术组件：

图引擎（GE）：负责神经网络图的优化，如子图切分、算子融合，提升计算效率。
融合编译（FE）、ACPU 引擎、集合通信引擎（HCCI）：FE 处理前端编译逻辑，ACPU 引擎负责 CPU 侧算子执行，HCCI 实现多设备间的集合通信，三者协同保障计算任务的高效分发。
张量加速引擎（TBE）、算子库：TBE 是昇腾特有的张量加速引擎，专为 AI Core 优化；算子库提供丰富的预实现算子，满足常见神经网络计算需求。
运行管理器（Runtime）、数字视觉预处理（DVPP）：Runtime 负责设备、内存、流的运行时管理；DVPP 针对视频 / 图像场景，提供编解码、预处理加速能力。

三、计算资源层：AI 算力的 “物理底座”

计算资源层是 CANN 的硬件支撑，分为计算设备和通信链路两部分：

计算设备：
- AI Core：昇腾芯片的核心计算单元，专为神经网络算子（N 类算子）优化，是大算力的核心来源。
- AICPU：负责 CPU 侧算子执行，处理 AI Core 不擅长的通用计算任务。
- DVPP 硬件：专用的视频 / 图像处理硬件，卸载 CPU 的多媒体处理压力。
通信链路：
- PCIe：实现芯片与 CPU 之间的高速数据传输。
- HCCS：保障多芯片间缓存一致性，支持多卡协同计算。
- RoCE：实现芯片间的 RDMA（远程直接内存访问），降低通信延迟。