利好国产芯片?英伟达将CUDA引入 RISC-V 体系
在最近举办的RISC-V中国峰会上,英伟达Frans Sijstermans正式宣布,他们将CUDA软件平台移植至RISC-V架构。 目前,高性能计算...
在最近举办的RISC-V中国峰会上,英伟达Frans Sijstermans正式宣布,他们将CUDA软件平台移植至RISC-V架构。
目前,高性能计算生态基本由x86与Arm垄断,随着新架构闯入AI计算的核心领域,未来或许有更多新的发展契机出现。
布局多年,英伟达的RISC-V计划
虽然直到现在才对外宣布移植计划,但英伟达与RISC-V的渊源远超外界想象。当2015年全球科技巨头还在观望RISC-V的前景时,英伟达已悄然将这一开源架构选定为专有Falcon微控制器的继任者。如今,十年磨一剑的投入或许迎来爆发。
据Frans Sijstermans在RISC-V中国峰会披露,英伟达已开发出三类自研RISC-V核心:NV-RISCV32基础控制核心、NV-RISCV64乱序双发射核心、以及增加向量运算能力的NV-RVV。这些核心被集成在30多个IP中,每年随GPU、DPU等产品出货超过10亿颗。
当然,将CUDA引入RISC-V绝非简单适配。英伟达工程师面临三重技术壁垒:
硬件性能是面临的第一个问题,当前可用开发板集中于SiFive P550和阿里玄铁C920等中端平台,单核性能落后服务器级CPU约40%,且尚未有符合RVA23新规范的商用SoC落地。这也是RISC-V架构处理器普遍存在的问题。
接着是AI芯片最常见的内存墙问题。GPU与CPU间需统一虚拟内存架构,否则数据传输延迟将吞噬30%以上加速效益。而RISC-V的AIA中断控制器和IOMMU支持仍在演进中,制约协同效率。
最后就是软件生态,RISC-V虽已支持75个基础软件包,但CUDA涉及的900多个垂直行业库——从PyTorch等AI框架到cuDNN、cuBLAS等核心计算库——需逐一定制移植,映射逻辑需彻底重构。
移植路线图显示,英伟达采取分层策略:先攻克CUDA Toolkit和驱动程序的底层适配,再通过标准化接口实现与RISC-V生态的体系化融合。
战略棋局
英伟达的决策表面是技术演进,实则暗藏商业智慧:
首先是突破地缘封锁。此前,美国出口管制使顶级GPU无法进入中国,而中国正将RISC-V列为“处理器核心技术战略支点”,计划2025年投入50亿扶持生态建设。英伟达借势融入中国支持的RISC-V生态,实为保住百亿级市场的迂回战术。
在支持RISC-V的同时,其实也能瓦解x86/Arm霸权。2019年,英伟达支持Arm后,后者服务器份额从近乎零跃升至2024年的15%。如今故技重施,以CUDA生态为RISC-V赋能,黄仁勋直言:“我们不在乎CPU是什么架构,关键在于给开发者选择权”。
最后就是定义异构计算标准:在NVLink Fusion系统架构中,RISC-V将承担控制路径角色,与GPU、DPU形成“三芯一体”。通过3D封装实现芯片级融合,数据传输能耗可降低40%,大模型推理效率提升3倍。此举将加速英伟达从硬件供应商向全栈平台提供商的转型。
从英伟达的视角来看,CUDA这个“金字招牌”一直完美扮演护城河的角色,面对中国半导体产业的崛起,英伟达仍有机会重构游戏规则。
当然,中国RISC-V爆发前夜,CUDA软件平台的加入对于国内厂商来说也是一种机遇。
至于是“双赢”还是“卡脖子”,在芯片这个硝烟弥漫的战场上,产品才是硬道理。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新
