CANN开发者社区

06.26

19:00:00

Vector Function高性能编程指南(二)

本次直播将带你快速上手 Ascend 950 的 RegBase 编程模型。不仅会通过Elemwise、Broadcast、Reduce这三种最常见的Vector计算场景，手把手教你写出高性能的Vector Function；还会针对原有的MemBase类算子，展示一套向RegBase高效迁移的实操方案。

2026-06-26 19:00:00

立即查看

06.26

16:00:00

CANNBot支持生成单指令多线程算子

还在手动开发AscendCSIMT算子?这场直播带你解锁CANNBot的高效开发新模式。我们将梳理SIMT相关知识库Skill，剖析AscendCSIMT生成过程中的核心难点，随后讲解Harness如何精准解决这些技术瓶颈，最后分享实践案例与成果。借助CANNBot实现端到端算子生成，泛化场景精度达100%，轻松应对复杂开发挑战。

2026-06-26 16:00:00

立即查看

06.25

16:00:00

Vector Function 高性能编程指南（一）

本次直播将带你快速上手 Ascend 950 的 RegBase 编程模型，写出第一个 Vector Function 代码。讲清 SIMD VF 的关键编程约束，写出使能芯片能力的高效代码。梳理 UB 与寄存器之间的访存选型，帮你在不同计算场景下选对搬运指令，带你打通 VF 开发的完整链路。

2026-06-25 16:00:00

立即查看

06.24

19:00:00

基于昇腾的OSP-Next文生视频模型HiF8训推优化实践

本次直播将介绍基于昇腾的OSP-Next文生视频模型的HiF8工程实践:以业界少有可原生对接FlashAttention与大规模并行的Skiparse-2D稀疏注意力为核心，叠加自研HiF8浮点格式的低精度训练，充分利用HiF8卓越的动态范围特性，实现"HiF8+SkiParse"直接从基座模型训练至收敛，以及首次在8-bit量化的稀疏视频模型上跑通强化学习后训练。当前阶段在昇

2026-06-24 19:00:00

立即查看

06.23

19:00:00

Mega Moe技术介绍

想跑万亿参数MoE大模型?专家并行的跨卡Token收发是性能瓶颈!本场直播带你揭秘昇腾950上MegaMoe的优化:将MoE层5个算子端到端融合为单一大算子，消除中间结果编排与同步开销;通过Cube/Vector双核协同及多级流水编排，掩盖搬运与量化开销;由AIV直驱MTE通信，与矩阵计算深度交织，用计算流水掩盖通信时延。直播内容覆盖硬件协同、流水优化、通算融合真实落地经验，不容错过!

2026-06-23 19:00:00

立即查看

06.18

16:00:00

CANNBot算子Harness工程建设

本次直播聚焦CANNBot Harness工程建设，主要分享如何以Harness设计为核心基座，全面承载与串联算子需求分析、算子设计、算子开发、测试设计、测试执行、结果分析以及性能调优全流程。辅以严格的门禁与自动化检查机制，全面解析如何构建高效、完备、全自动化的算子Harness工程系统。

2026-06-18 16:00:00

立即查看

06.17

16:00:00

HCCL入门课程：HCCL北极星平台介绍

在大模型时代，HCCL北极星平台为HCCL验证带来全新范式。它能够精准捕捉被复杂HCCS与RoCE网络拓扑掩盖的细微算法逻辑错误，将原本必须上机才能发现的海量逻辑问题，高效拦截在纯软件分析阶段。该平台无需依赖昂贵的集群资源，也无需长时间排队等待，即可完成深度验证，从而大幅缩短研发周期，释放稀缺的真机算力，支撑业务的敏捷迭代。

2026-06-17 16:00:00

立即查看

06.16

19:00:00