搜索
CANN开发者社区
https://cann.csdn.net
成员
CANN开发者社区旨在汇聚广大开发者,围绕CANN架构重构、算子开发、部署应用优化等核心方向,展开深度交流与思想碰撞,携手共同促进CANN开放生态突破!
开发者学堂
查看更多
面向昇腾950的算子编程必修课(PyPTO)
PyPTO让算子开发更简单,Tensor编程范式显著降低开发门槛,多层级计算图转换充分释放硬件算力。本周课程带你解锁PyPTO核心技能,从环境搭建、Tensor编程范式、IDE可视化性能调优到网络融合算子实操,全方位驾驭新一代芯片编程。让算子开发更高效,算法创新更自由。立即加入,抢占技术前沿!
CANNBot自动算子生成
PyPTO Agent 实操:1天开发自定义融合算子
TileLang-Ascend 学习周
本课程将系统讲解TileLang在昇腾平台上的核心编程范式:通过Developer模式的高效原语快速实现算子功能。我们将基于官方指南,手把手带你完成从环境配置、算子开发、调优到集成部署的全流程实战,助你掌握在Ascend架构上构建高性能算子的完整能力。
热门直播
查看更多
回放中
基于昇腾的OSP-Next文生视频模型HiF8训推优化实践
本次直播将介绍基于昇腾的OSP-Next文生视频模型的HiF8工程实践:以业界少有可原生对接FlashAttention与大规模并行的Skiparse-2D稀疏注意力为核心,叠加自研HiF8浮点格式的低精度训练,充分利用HiF8卓越的动态范围特性,实现"HiF8+SkiParse"直接从基座模型训练至收敛,以及首次在8-bit量化的稀疏视频模型上跑通强化学习后训练。当前阶段在昇
回放中
Mega Moe技术介绍
想跑万亿参数MoE大模型?专家并行的跨卡Token收发是性能瓶颈!本场直播带你揭秘昇腾950上MegaMoe的优化:将MoE层5个算子端到端融合为单一大算子,消除中间结果编排与同步开销;通过Cube/Vector双核协同及多级流水编排,掩盖搬运与量化开销;由AIV直驱MTE通信,与矩阵计算深度交织,用计算流水掩盖通信时延。直播内容覆盖硬件协同、流水优化、通算融合真实落地经验,不容错过!
未开播
CANNBot支持生成单指令多线程算子
还在手动开发AscendCSIMT算子?这场直播带你解锁CANNBot的高效开发新模式。我们将梳理SIMT相关知识库Skill,剖析AscendCSIMT生成过程中的核心难点,随后讲解Harness如何精准解决这些技术瓶颈,最后分享实践案例与成果。借助CANNBot实现端到端算子生成,泛化场景精度达100%,轻松应对复杂开发挑战。





