登录社区云,与社区用户共同成长
邀请您加入社区
为期四天的CANNBot学 习周-入门课程圆满收官。本次活动以CANNBot算子开发为主题,通过4场连续直播,带领开发者从0到1体验CANN算子开发流程。 本次课程从入门体验到进阶实操,覆盖Ascend C、PyPTO、TileLang-Ascend等多种编程语言,充分展现了CANNBot依托Agent实现的全流程自动化能力,为算子开发带来了显著效率提升与全新开发体验。 Day 1|CA
CANN开源社区tilelang链接:https://gitcode.com/cann/cann-recipes-infer/tree/master/ops/tilelangTilelang-Ascend开源社区链接:https://github.com/tile-ai/tilelang-ascend
借助GE图引擎能力,PyTorch、TensorFlow、MindSpore、PaddlePaddle等主流AI框架的算法模型可以统一转换为使用Ascend IR(Ascend Intermediate Representation)表示的计算图(Ascend Graph),并通过GE的图编译加速技术,显著提升计算图在昇腾硬件上的执行效率。相较于单个计算操作依次下发的方式,图模式具备图的全局视角,
IPC(Inter-Process Communication,进程间通信)允许不同进程之间直接访问共享的设备内存,而无需进行显式的内存拷贝操作,从而显著提升通信效率。昇腾当前已基于Ascend Extension for PyTorch(昇腾NPU适配PyTorch框架的插件,也称为torch_npu)提供了IPC特性的原子能力,使开发者在分布式训练、强化学习等需要多进程大规模数据通信场景可以自
它类似于传统编译器中的优化步骤,允许在不修改模型源代码的前提下,实现算子融合、常量折叠等高级变换。TorchAir通过开放此能力,使得开发者不仅能在FX Graph中直接定义并执行算子替换、子图重构等通用优化,还能调用TorchAir特有的API,在FX Graph中直接表达原生框架所不具备的多流并行与流间执行时序控制等硬件级优化。编译过程中涉及的主要图优化阶段如下图所示,可以看到TorchAir