登录社区云,与社区用户共同成长
邀请您加入社区
当芯片越来越强,程序员为什么反而更难掌控它? 2026年3月,新一代昇腾950系列芯片逐渐浮出水面。 如果把它摊开来看,像不像一张密密麻麻的工业园区图? 32个矩阵运算单元、64个向量处理核心、1.6TB/s的DDR带宽、1728 TFlops的FP4算力。数字很耀眼,硬件很凶猛。可问题也正出在这里:芯片越强,驾驭它的人却未必越轻松。 为什么?因为它不再是一座小作坊,而是
近日,CANN开源社区首个面向垂直行业的Material Chemical Engineering SIG(材料化学工程特别兴趣小组,简称MCE SIG)正式发布两款科学计算算子——LJForceFused分子动力学算子与耗散粒子动力学(DPD)算子。两款算子分别面向微观原子尺度与介观流体尺度,标志着该SIG初步完成多尺度计算布局,为流程工业领域提供了专业开源算子基础设施。 目前两款算子已覆盖催化
面向Ascend 950,CANN技术架构的变与不变 当前,人工智能正以前所未有的速度渗透千行百业,推动 AI 算力需求呈指数级增长,算力已成为人工智能产业发展的核心竞争力。 在此背景下,昇腾推出新一代AI芯片Ascend 950PR与Ascend 950DT。两款芯片在继承上一代优秀能力的基础上,围绕计算、通信等关键维度实现多项技术突破,涵盖NDDMA、CV融合、SIMT、UB、CCU等创新特性
摘要 在大规模分布式训练和推理业务中,集合通信的性能是影响整体系统性能的关键瓶颈之一。传统集合通信方式依赖AI CPU、AI Vector等计算单元通过软件协议栈构造通信任务描述符,驱动硬件执行通信任务。然而,这种执行方式不仅需要占用计算核资源,而且软件接口的开销较大,叠加计算算子后,计算和通信会抢占多种硬件资源,导致效率下降。为了解决这一问题,Ascend 950中引入了 集合通信处理器(Col
直播回放链接:PTO ISA教你如何快速上手Ascend 950_哔哩哔哩_bilibili
直播回放链接:HCCL集合通信专用引擎CCU技术介绍_哔哩哔哩_bilibili
直播回放链接:HiFloat8数据格式及其训推应用_哔哩哔哩_bilibili
直播回放链接:探索Ascend 950的性能天花板_哔哩哔哩_bilibili
直播回放链接:加速开发,释放生产力的必备利器_哔哩哔哩_bilibili
直播回放链接:面向Ascend 950的编程语言选型_哔哩哔哩_bilibili