登录社区云,与社区用户共同成长
邀请您加入社区
想跑万亿参数MoE大模型?专家并行的跨卡Token收发是性能瓶颈!本场直播带你揭秘昇腾950上MegaMoe的优化:将MoE层5个算子端到端融合为单一大算子,消除中间结果编排与同步开销;通过Cube/Vector双核协同及多级流水编排,掩盖搬运与量化开销;由AIV直驱MTE通信,与矩阵计算深度交织,用计算流水掩盖通信时延。直播内容覆盖硬件协同、流水优化、通算融合真实落地经验,不容错过!
CANN开发者社区旨在汇聚广大开发者,围绕CANN架构重构、算子开发、部署应用优化等核心方向,展开深度交流与思想碰撞,携手共同促进CANN开放生态突破!
更多推荐
【Bug已解决】OpenClaw 升级后报错 Cannot find module ‘@buape/carbon‘ 解决方案
索引“卡死“?3个explain技巧让你的查询快10倍
自己动手开发编译器(八)用Linq编写解析器组合子
在函数式语言发展起来之后,有些人发现函数式语言的抽象能力非常强,甚至能够直接用函数式语言的代码来表达文法的产生式,并将解析器“组合”出来,这称作解析器组合子(parser combinator)。解析器组合子的基本思想是“组合”,首先我们要定义一些最基本的产生式作为基础组合子,然后通过组合的方式拼装出最终的解析器来。这个组合子接受一个Token作为参数,而返回的解析器从输入的Scanner中读取下
扫一扫分享内容
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
所有评论(0)