性能超英伟达 10 倍?微软投资的 OPU 又是什么黑科技

jh 4小时前

前有GPU,后有TPU,如今的AI芯片市场又来了新玩家——OPU。 据科技媒体Tom's Hardware 报道,比尔·盖...

前有GPU,后有TPU,如今的AI芯片市场又来了新玩家——OPU。

据科技媒体Tom's Hardware 报道,比尔·盖茨旗下盖茨前沿基金领投的初创公司Neurophos宣布推出首款光学处理单元(OPU)Tulkas T100,这一突破性产品在FP4/INT4低精度计算负载下,性能直接达到英伟达最新Vera Rubin NVL72 AI超级计算机的10倍,且功耗水平基本持平,为破解当前AI算力瓶颈提供了全新的光子计算路径。

我们都知道传统电子芯片正受摩尔定律物理极限约束,面临能耗过高、算力增速不足的困境,新型算力芯片一直是产业突破的核心方向。而这款OPU的核心竞争力就是源于光晶体管微型化技术的重大突破。

Neurophos首席执行官Patrick Bowen介绍,传统硅光芯片公司量产的光晶体管长度不仅难以实现高密度集成,更无法与成熟的芯片比拼计算密度,且存在传输损耗大、能耗控制难等问题。

而该公司通过技术创新,成功将光晶体管体积缩小至原来的万分之一,使其可完全兼容标准CMOS工艺量产,首次实现单芯片集成百万级微米级光学处理元件,从根本上解决了光子计算规模化应用的核心障碍,为大规模光子计算架构落地奠定了坚实基础。

依托这一核心突破,Tulkas T100在硬件架构设计上进一步放大优势,凭借大尺寸计算矩阵与超高运行频率实现对传统AI芯片的性能反超。其集成了1000×1000像素规格的光子传感器矩阵,规模达到主流AI GPU 256×256矩阵的15倍,大幅提升了并行数据处理能力,尤其适配大语言模型训练、自动驾驶实时感知等高频并行任务。

同时,该芯片理论运行频率高达56GHz,是英特尔酷睿i9-14900KF频率纪录的6倍,搭配768GB高带宽HBM内存,可实现470PetaOPS的运算速度,仅需1个25平方毫米的光学张量核心,就能媲美英伟达GPU数十甚至数百个核心的综合效能,能效比优势显著。

如果Tulkas T100进展顺利,那么很有可能成为英伟达GPU的有力竞争者。

技术突破背后离不开资本的强力加持,Neurophos近期刚完成1.1亿美元超额认购A轮融资,累计融资规模达1.18亿美元,投资方涵盖微软、沙特阿美风投、博世风投等多家跨行业巨头机构。

据了解,本轮融资将主要用于加速OPU全系统交付进程,包括数据中心专用模块、适配AI场景的软件栈及开发者硬件套件研发,同时扩建美国德州总部研发基地,并在旧金山增设工程中心强化技术落地能力。

作为核心支持者,微软正积极探索将OPU融入自身Azure云服务的AI基础设施,以期解决大模型推理中的算力瓶颈与能耗难题。

尽管性能表现亮眼,但Tulkas T100要实现大规模商业化仍需跨越多重量产门槛。目前该产品仍处于实验室验证阶段,预计2028年初实现首批系统量产,初期年供应量仅以千台为单位,远无法满足市场需求。

技术层面,除了要攻克光芯片一直存在的核心技术难题,还需解决光子芯片量产中的良率控制、成本优化等行业共性问题。

不过有微软的口碑,Neurophos在商业化道路上已快速实现落地布局,与挪威数据中心运营商Terakraft达成合作,计划2027年在数据中心算力加速场景启动试点应用,积累实际运行数据以优化产品。

当前光子计算已成为全球半导体赛道的新风口,除了Neurophos,科技巨头纷纷加速布局,例如英伟达在Vera Rubin平台中集成光子交换系统,AMD计划投资2.8亿美元建立硅光子研发中心,IBM、英特尔等也在光逻辑器件、光互联技术领域深耕。

分析师Holger Mueller指出,随着AI算力需求呈指数级增长,仅靠英伟达一家难以填补市场缺口,若OPU等创新技术若能突破量产瓶颈,那自然能满足更多市场需求。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到