镁客网 https://www.im2maker.com 硬科技产业媒体,关注技术驱动创新 Mon, 18 Mar 2024 07:57:49 +0800 zh-CN hourly 1 https://wordpress.org/?v=4.9.8 微软的另一条“腿”,要做真正Open的AI https://www.im2maker.com/news/20240229/kbyv3cspdfo7ws1d.html https://www.im2maker.com/news/20240229/kbyv3cspdfo7ws1d.html#respond Thu, 29 Feb 2024 09:35:10 +0000 https://www.im2maker.com/?p=87700 微软的另一条“腿”,要做真正Open的AI

这两天,苹果不造车改转AI的新闻闹得火热,另一边,作为老对手的微软也在悄摸扩张自己的AI版图。

是的,坐拥OpenAI这座“人工智能金字招牌”的微软并没有停下脚步,在27号收购了一家名为Mistral AI的欧洲初创公司的少数股权。Mistral与OpenAI一道,成为了微软行走在人工智能领域的坚实“大腿”。

区别于名字带着“Open”实际并不“Open(开源)”的OpenAI,Mistral创立之初的使命就是“引领开放模型的革命。”

欧洲人自己的“Open”AI

Mistral从创立至今,一直很少在打得火热的人工智能竞赛中发声。

微软的另一条“腿”,要做真正Open的AI

(图源:Mistral AI)

团队的三位创始人CEO Arthur Mensch和CTO Timothée Lacroix、首席科学家Guillaume Lample此前分别在DeepMind和Meta从事大模型的相关工作。

由于抱有相同的理念,机缘巧合之下三人在法国创立了Mistral AI。由于人工智能产业在欧洲市场本就不多,再加上几位创始人的履历,在没有任何产品的情况下,Mistral就收获了来自Lightspeed Venture Partners光速全球领投的1.13亿美元种子轮投资

造就了“6人,4周,7页PPT,1.13亿美元”的AI投融资传奇,当然,这样的故事自然会引起一定的非议,当时也被认为是AI泡沫的代表。

不过好在,收下融资的Mistral AI相当迅速地拿出了第一个作品——Mistral 7B,并且没有任何花里胡哨的宣传、发布会,直接在社交媒体上贴了一个磁力下载链接,让所有想部署的用户都能直接免费获取。

带领“小”模型风潮

根据Mistral官方的说法,在所有的基准测试中,Mistral 7B的表现甚至还要优于130亿参数的Llama 2,在代码、数学和推理测试中,甚至超过了有数倍参数量差距的Llama 1 34B。

微软的另一条“腿”,要做真正Open的AI

(图源:Mistral AI)

不仅在性能上更优,Mistral 7B由于参数量的原因,更适合在消费级设备上进行部署,有人就分享了在自己的苹果笔记本上运行的效果,在量化后更是发现,Mistral 7B只需要不到5GB内存和6GB的GPU显存,只需微调,即可在单卡上运行。

微软的另一条“腿”,要做真正Open的AI

(图源:网络)

而且就在不到2个月后,他们又火速拿出了首个MoE开源模型Mixtral 8x7B,参数量级还是70亿,但是架构方案有了少许变化。

根据描述,Mixtral 8x7B采用了一种稀疏的专家混合网络,模型分成了8个不同方向领域的专家,在每次处理时,选择其中两个专家来实现输出,这样既能够快速响应完成任务,也相应减少了推理成本。

这个模式就非常眼熟,很像传闻中GPT-4的架构方案(即16个专家总数,单个专家166B参数),不过是缩小版的,并且Mixtral 8x7B与GPT-4一样也是32K上下文。

在这样的改变下,Mixtral 8x7B不仅有多项测试能够领先10倍参数的Llama 2 70B,还差不多追平了GPT-3.5。

微软的另一条“腿”,要做真正Open的AI

(图源:Mistral AI)

这样的产品不仅让Mixtral AI在去年11月初收获了一笔3亿美元的战略投资,也掀起了AI行业“小”模型的风潮,毕竟再强的模型也需要有用户才有价值。

初心变了?

可就在AI圈因为有这样的真·“Oepn”AI而雀跃时,事情突然急转之下。

Mixtral AI在被微软收购的同时,带来了一款号称可以跟GPT-4扳手腕的新品——Mistral Large。官方宣称的性能、训练成本等等具体如何姑且不论,有人发现,这次Mixtral没有再大手一挥抛出下载链接任人取拿,反而还把官网中关于开源社区义务的相关内容给删除了。

微软的另一条“腿”,要做真正Open的AI

(图源:Mistral AI)

从后续CEO“坚持开源理念,但也会有闭源模型参与商业竞争”的回应来看,Mistral Large“闭源”是板上钉钉了。

也无怪Mistral,毕竟还是初创公司,在算力、资金等方面还是有所欠缺的,一直“用爱发电”也无法长久。

Mistral AI 的使命是引领开放模型的革命。

“Mistral AI”撤回了一条消息

本文作者:Visssom,观点仅代表个人,题图源:@MistralAI

]]>
https://www.im2maker.com/news/20240229/kbyv3cspdfo7ws1d.html/feed 0
先进封装行业深度解析:发展条件已具备,高端材料成关键 https://www.im2maker.com/news/20240131/jxiz2r8dht6bi9al.html https://www.im2maker.com/news/20240131/jxiz2r8dht6bi9al.html#respond Wed, 31 Jan 2024 10:47:37 +0000 https://www.im2maker.com/?p=87651

在半导体产业,摩尔定律一直驱动着行业整体向前发展:其核心内容为,集成电路上可以容纳的晶体管数目大约每经过18个月到24个月便会增加一倍。换言之,处理器的性能大约每两年翻一倍,同时价格下降为之前的一半。

然而随着芯片尺寸逐渐逼近极限,关于摩尔定律失效的质疑声越来越多,如何延续摩尔定律也成了业界巨头共同面临的难题。

对此,有人选择研发晶体管架构,有人选择寻找新型材料,还有一种方法是在不缩小尺寸的情况下使用先进封装技术提高芯片整体性能。

如今先进封装技术发展到哪里?哪有环节需要重点关注?

在近期国金证券发布的报告《先进封装发展充要条件已具,关键材料国产替代在即》一文里,分析师以高端材料为重点,介绍了先进封装的最新进展。

以下内容为报告重点内容节选:

先进封装发展充要条件均已具备

什么是先进封装:

封装技术的定义为:在半导体开发的最后阶段,将一小块材料(硅晶芯片,逻辑和存储器)包裹在支撑外壳中,以防止物理损坏和腐蚀,并允许芯片连接到电路板的工艺技术。

根据定义,封装的两大关键作用:1)解决芯片如何与外界连接的问题;2)芯片隔绝保护与支撑。

研报认为:先进封装与传统封装对于半导体的作用并无二致,两者的区别在于在解决芯片与外界连接的问题上关注的重点有所不同。

具体来看:

1、传统封装技术变革的重点集中在封装主体与PCB之间的连接方案,行业解决思路仍然停留在“芯片间通信需要通过PCB走线”的层面。

2、 先进封装技术变革的重点开始转向优化芯片主体对外连接方式,最具有代表性的转变就是芯片传统对外连接方式从Wire Bonding变成了Flip Chip,这一转变提高了1级封装层面连接方式的灵活性,由此延伸出后续的2.5D/3D等高端先进封装方式。

总结来看,先进封装就是把芯片间通信问题提升至1级封装层面的技术。

为什么发展先进封装

传统封装中的芯片间通信需要经过“芯片-载体-PCB板-载体-芯片”一整套完整的流程,其中“载体”可以是TO/DIP形式的引线框架,也可以是BGA形式的封装基板,但无论是哪种载体、无论载体的性能如何提升,整个芯片通信过程所涉及的层级太多就无法完全解决通信传输信号损失的问题。

根据“两节点之间的传输损耗=传输距离*单位距离传输损耗”,传统封装的架构形式要求信号经过的路径较长,即使大幅度提升载体的性能,效率瓶颈也会很快就达到。

缩短芯片间通信距离能够大幅度提升整个功能系统效率,SoC的方案将不同芯片功能集成在一颗芯片上,使得芯片间通信在零级封装就已经完成,通信效率提升到极大水平,因此我们看到过去几年在摩尔定律的引领下,芯片制程不断演进,从而使得单芯片上晶体管数量大幅提升。

但随着多年以来摩尔定律的推进,SoC 方案的发展在设计和制造等方面都遇到了相当大的瓶颈:

1、设计瓶颈,传统的SoC是将不同类型计算任务的计算单元设计在一块晶圆上,并且每个计算单元都采用统一的工艺制程,导致SoC芯片上各个单元需要同步进行迭代,这样不仅会使得系统重构风险高,同时也会使得芯片设计成本越来越高。

2、 制造瓶颈,当前芯片工艺制程尺寸已走向极致(3nm至1nm),而1nm的宽度仅能容纳2个硅原子晶格,进一步微缩就将进入量子物理范畴,将面临量子隧穿效应等问题;

同时SoC挤进更多功能将导致芯片面积较大,从而导致良率难以提升。

除此之外还存在光刻技术难以跟进、单芯片功耗和散热问题越发突出、存储带宽难以跟进等问题,可见 SoC 制造难度正在加速上升。制造难度的提升导致摩尔定律逐步开始失效。

根据IBS的统计,芯片制程下降所带来的制造成本下降幅度已经逐步收窄,16nm到10nm每10亿颗晶体管的成本可降低31%, 而从7nm到5nm仅降低18%、从5nm到3nm仅降低4%。

在传统封装效率不足、SoC 又遭遇设计和制造瓶颈的当下,Chiplet 指导方向下的先进封装方案的发展成为了必然选择。

Chiplet俗称“芯粒”,又称为“小芯片组”,它是将多个功能单元通过封装而非晶圆制造的方式连接在一起的一种芯片异构手段,Chiplet通过先进封装的方式来实现,其可有效弥补传统封装和 SoC 的缺点。

具体来看:

1、通过1级封装显著缩短线路传输距离,较传统封装大幅度提升效率。

2、 IP复用性高,能够降低设计成本,提升迭代灵活度。

Chiplet通过将大规模SoC分解为多个小芯粒,则部分芯粒就可以做到模块化设计,一方面IP可以复用、节省设计成本,另一方面无需整个Chiplet组合统一升级、只需部分性能升级即可达到整体效能升级的作用,提升了迭代的灵活度。

工艺灵活性提升,可有效降低制造难度和成本。

原本SoC上所有功能单元需要采用统一制程来制造,但Chiplet方案下,不同单元芯粒可以分别采用不同的工艺制程制造,可有利于极大地降低芯片方案的制造成本。

因此,研报认为在传统封装和 SoC方案瓶颈问题日益突出的当下,先进封装的方案已经成为了必然的发展方向。

先进封装发展契机已现,六年复合增速将达 9.8%:

尽管Chiplet优势明显,但过去一直受制于产业客观发展因素,其一是Chiplet互联标准不统一,其二是先进封装对封装行业提出了新的技术要求,良率和产能受限是产业规模化发展的关键问题。随着产业的发展,这两大问题已经逐渐得到解决。

由此可见,先进封装已经迎来了快速发展的契机。

根据Yole预测,先进封装市场在2021~2027年间复合增长率将达到9.81%,至2027年市场规模将达到591亿美元,其中受益于AI相关的高速通信领域的发展,2.5D/3D封装将成为成长最快的板块,复合增长率将达到13.73%,至2027年市场规模将达到180亿美元。

高端材料成关键,国产替代进行时

随着先进封装技术难度提升、新增多个环节,导致工艺过程中出现了新的材料需求,并且材料 性能对先进封装工艺的影响程度大幅提升,可以说先进封装材料成为了支撑先进封装产业链发展的关键。

考虑到先进封装材料的难度高、工艺影响大、国产化率低等特点,分析师认为先进封装材料是整个产业发展中重要的投资方向。

一、临时键合(Temporary Bonding):

在传统封装中,晶圆在后续划片、压焊和封装之前需要进行背面减薄加工以降低封装贴装高度,减小芯片封装体积,改善芯片的热扩散效率、电气性能、机械性能及减小划片的加工量。

而先进封装中晶圆减薄主要是为了满足TSV制造和多片晶圆堆叠键合总厚度受限的需求,有效提高芯片制造的效率和成本效益。

由于大尺寸薄化晶圆的柔性和易脆性使其很容易发生翘曲和破损,为了提高芯片制造的良率、加工精度和封装精度,需要一种支撑系统来满足苛刻的背面制程工艺。

在此背景下,临时键合与解键合技术应运而生。此外,当前在晶圆薄化趋势持续攀升背景下,临时键合技术普及率不断提升,进而带动临时键合胶需求持续增加。

临时键合胶(Temporary Bonding Adhesive,TBA):是把晶圆和临时载板粘结在一起的中间层材料,热稳定性、化学稳定性、粘接强度、机械稳定性、均一性等是临时键合胶的关键选择因素。

临时键合胶的材料性能主要是由基础黏料的性质决定的,可用作基础黏料的高分子聚合物材料包括热塑性树脂、热固性树脂、光刻胶等。

根据新思界产业研究中心发布的《2023-2028年临时键合胶(TBA)行业市场深度调研及投资前景预测分析报告》显示,2022年全球临时键合胶市场规模约为2.2亿美元,同比增长 8.6%。其中受技术发展影响,目前全球市场由美国3M与台湾达兴材料两家企业占据主导地位,合计市场占有率已超40%,行业集中度较高。

二、RDL(重新布线层,Redistributed layer)

RDL是实现芯片水平方向电气延伸和互连,面向3D/2.5D 封装集成以及FOWLP的关键技术。

它在芯片表面沉积金属层和相应的介电层,形成金属导线,并将IO端口重新设计到新的、更宽敞的区域,形成表面阵列布局,实现芯片与基板之间的连接。

在3D封装中,如果上下是不同类型的芯片进行堆叠,则需要通过RDL重布线层将上下层芯片的IO进行对准,从而完成电气互联。

简单来说,RDL技术使设计人员能够以紧凑、高效的方式放置芯片,从而减少器件的整体尺寸。

RDL生产制造中主要用到PSPI、光刻胶、抛光材料、靶材以及一些功能性湿化学品(电镀液、清洗液、光刻胶剥离液等)。其中大部分品类都是在前道晶圆制造过程中常用的材料。

先进封装的出现使得前道材料开始应用到后道封装中,这一高端材料下沉趋势为竞争追赶者带来弯道超车机会。

1、感光性聚酰亚胺(PSPI):RDL核心材料,PSPI因具有优异的力学性能、热学性能、电学性能等,在半导体封装中被应用为缓冲层材料及再布线层材料,是关键的制程材料和永久材料。

RDL和晶圆表面的钝化层中介质通常需要光敏绝缘材料来制造,传统聚酰亚胺需要配合光刻胶使用,采用PSPI工艺流程可大幅简化。随着国内集成电路、OLED 面板等产业需求的进一步扩大,国内 PSPI 的市场规模也将持续扩增。

由于 PSPI 行业技术壁垒较高,目前日本和美国企业仍占据全球 PSPI 市场的主导地位。国内方面,鼎龙股份、强力新材等已陆续实现PSPI的国产化突破。

2、光刻胶:先进封装用光刻胶与晶圆制造过程中使用的光刻胶不同,封装用光刻胶分辨率一般仅要求为微米级的厚胶、紫外光光源、436nm的g线与365nm的i线。

据集邦咨询,2022 年全球半导体光刻胶市场规模约26.4亿美元,2023年预计下滑6- 9%。目前全球高端半导体光刻胶市场主要被日本和美国公司垄断,日企全球市占率约 80%,处于绝对领先地位。目前主流厂商包括日本的东京应化、JSR、富士胶片、信越化学、住友化学,以及美国杜邦、欧洲 AZEM 等。

3、CMP材料:先进封装工艺流程中,化学机械抛光(Chemical Mechanical Polishing,CMP)是RDL、TSV工艺中的关键流程,用到的主要材料为抛光液和抛光垫。

根据SEMI数据,2022年全球半导体制造材料约447亿美元,抛光液和抛光垫分别占比4%、3%来计算,全球半导体用抛光液和抛光垫的市场空间分别为 18 亿美元和13亿美元。

抛光液市场中卡博特(Cabot)、Versum Materials、日立(Hitach)、富士美(Fujimi)、陶氏(Dow)等美日龙头厂商占据全球CMP抛光液市场近80%。

4、靶材:先进封装工艺流程中,靶材主要用于Bumping工艺中凸点下金属层及TSV工艺中电镀种子层的溅射,RDL的电镀铜中也会有工艺路线选择溅射镀Cu,从而用到靶材。

根据SEMI数据,2022年全球半导体制造材料约447亿美元,按靶材占比3%来计算,全球半导体用靶材市场空间约为13亿美元。其中日本日矿金属、东曹、美国霍尼韦尔、普莱克斯四家企业便占据了全球约80%的市场份额。

三、凸点制造(Bumping)

凸点制造(Bumping)是封装技术中关键的一环,是芯片能够实现堆叠的关键支撑。

近几年随着先进封装快速发展,从球栅阵列焊球(BGA Ball)到倒装凸点(FC Bump),再到微凸点(μBump),凸点尺寸也在不断缩小,技术难度也在不断升级。

从当前主流的高端新进封装方案中,我们可以看到 HBM、XPU以及芯片组合整个封装体对外互连时均需要用到Bumping工艺,可见Bumping在先进封装工艺中起到关键作用。

1、电镀液:Bumping中重要耗材,国内多家公司开始抢位Bumping技术的核心在于创建微小的金属凸点(bumps),用于在晶圆和封装间形成关键的电连接。而凸点间距(pitch)的精准控制在Bumping技术中至关重要,因为它直接影响到芯片内部电气信号的传输效率以及整体封装的密度,是实现高性能和高密度集成电路的关键。因此电镀液在bumping 流程中起到了关键作用。

高品质的电镀液保证了金属凸点的均匀性和可靠性。特别是在RDL(重布线层)工艺中,Bumping技术用于实现芯片与封装基板间的精确电连接。同样地,RDL技术要求高精度的凸点布局以及优异的电气性能,这些都离不开高性能的电镀液。

因此,电镀液不仅决定凸点的形成,也是确保最终产品性能和稳定性的关键。

随着半导体封装技术的发展,电镀液在传统封装到先进封装的应用中经历了显著变化。在传统封装中,电镀液主要用于形成较大的凸点(通常大于 100μm),以满足低互连密度(少于1000/mm²)和单层或少层数的封装要求,这些应用对电镀液的要求相对较低。

相比之下, 先进封装技术如3D封装和系统级封装(SiP)引入了更加复杂和细致的设计。这些技术要求电镀液支持更高的精细度,以形成更小(小于20μm)且更密集的金属凸点(超过 5000/mm²),以适应更高的互连密度和多层(多于单层)的封装需求。

这些要求不仅提升了电镀液的技术标准,包括精准的沉积控制和化学稳定性,还增加了电镀液的整体用量。

因此,在半导体行业向更高性能和更小封装尺寸的追求下,电镀液的角色在先进封装领域变得愈发重要。

在先进封装的用量及性能需求的带动下,电镀液市场有望继续成长。为满足高性能和高密度的要求,先进封装技术向更多层次的封装和互连层发展。这导致了电子器件内部更多的电镀涂层需求,从而增加了电镀液的使用。

先进封装通常涉及多层堆叠,包括多个互连层和封装层。每层都需要电镀工艺来确保良好的电连接和信号传输,增加了电镀液的用量。

同时,先进封装技术追求更高的互连密度,以实现更小的封装尺寸和更高的性能。其要求更复杂的电镀工艺以适应更多的互连通道,进一步增加了电镀液的需求。

根据Techcet 2023年8月预测数据显示,2023年全球电镀化学品市场规模将达9.92亿美元,2027 年全球电镀化学品市场规模有望达 10.47 亿美元。

目前主要玩家仍以海外为主,国内多家公司开始布局。

2、封装基板:Bumping是广义先进封装区别于传统封装的显著特征,该技术方法的推出使得芯片外延引脚数得以大幅提升,键合间距也向着更小的方向发展,这也就对作为过渡层的载板的线宽线距提出更高的要求。

对比传统封装和先进封装中形态最接近的两种封装形式WB BGA和FC BGA 可以看到,FC BGA的线宽线距能够达到 8~12um,而WB GBA最低仅能够达到25um,可见随着先进封装市场的铺开,封装基板作为关键的支撑材料也将迎来升级机会。

封装基板是封装材料中重要的组成部分,先进封装带动快速增长。封装基板作为1级封装和2级封装之间的连接层,其是整个封装制造中成本耗用最高的材料。

根据yole数据,FC BGA的成本结构中有50%来自封装基板,可见该材料的重要性。也正因如此,先进封装的发展带动了封装基板显著增长,从2017年以来封装基板的成长速度显著高于其他 PCB板类型,并且代表广义先进封装的FC类型基板的增速也相较传统封装所用的封装基板要高,预计未来封装基板市场能够保持 8%以上的复合增速,至 2026 年全球封装基板市场空间将达到214亿美元。

先进封装对封装基板的技术要求提高体现在线宽线距持续15/15um以下演进,原用于普通多层PCB的减成法工艺将不再适用,当前先进封装所用的高端封装基板普遍采用半加成法工艺制造,半加成法这种工艺和传统减成法最大的不同点就在于,不再通过现成铜箔叠层蚀刻的方式去做出线路,而是通过选择性化学沉铜/镀铜形成目标线路。

这样的工艺方式虽然省去蚀刻所带来的侧蚀问题,但对于沉铜/镀铜工艺的要求却急剧上升,在制造过程中需要解决的问题包括但不限于铜线路与低粗糙度的树脂层的结合力问题、镀铜的均匀性问题、叠孔之前的连通性问题、精细电路闪蚀等问题,技术上的挑战陡升。

在这样的技术壁垒压力下,全球封装基板主要由海外厂商垄断,特别是技术难度较高的半加成法/改进型半加成法难见国内厂商身影,我们按照2022年国内已上市的两大封装基板厂商营收数据测算,全球封装基板市场国产化率仅个位数,可见国产化率低、国产替代空间大。

四、硅通孔技术(Through Silicon Via,TSV)

硅通孔技术(Through Silicon Via,TSV)是通过导穿硅晶圆或芯片实现多层垂直互连的技术。目前TSV技术主要应用于3个方向,即垂直背面连接、2.5D封装、3D封装。

其中,垂直背面连接主要应用在CIS、SiGe 功率放大器,技术难度相对较低;

2.5D中TSV的应用体现在中介层(interposer)的硅通孔制作,服务于用作多芯片间(例如GPU与存储之间)水平连接的载体,技术难度较高;

3D封装中TSV技术的应用体现在芯片上直接进行硅通孔制作,目前常见于高带宽存储芯片(如 HBM),技术难度高。

从当前主流的高端先进封装方案来看,中介层和芯片内部硅通孔技术都已经得到广泛的应用,特别是在解决高带宽存储(存储间通信)、存储与算力芯片间通信的问题上起到关键作用。

]]>
https://www.im2maker.com/news/20240131/jxiz2r8dht6bi9al.html/feed 0
被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱 https://www.im2maker.com/news/20240131/ybul2j1vlipwxq8e.html https://www.im2maker.com/news/20240131/ybul2j1vlipwxq8e.html#respond Wed, 31 Jan 2024 09:29:22 +0000 https://www.im2maker.com/?p=87642 寒假作业,大概是每个年代的孩子都逃不过的宿命。

而自从“双减”政策开始落实,教育回归家庭后,家长们也开始迎来了他们的“酷刑”——为孩子们辅导作业。

相信不少人都能在网上刷到被作业整崩溃的家长,有的因为孩子心不在焉苦口婆心,有的因为孩子怎么也听不懂气到捶桌,而更多家长则因为孩子课程知识点越来越丰富,未必能很好地为孩子答疑解惑。

可以说,寒假作业让家长和孩子们都犯了难。

不过,面对这个难题,家长们可以借助当下最火的AI大模型。

目前不少国产大模型都号称自带教育功能,最关键的是,这些国产工具都可以通过网页或App免费体验,对于大部分家长们来说,使用门槛足够低

为此,笔者挑选了国内三款主流对话式大模型(讯飞星火、文心一言、通义千问)进行了多次提问,并且将他们与目前公认最强的GPT4大模型进行对比,看看他们在真实场景下辅导作业时,都有哪些表现?

国产大模型 VS GPT4

寒假说长不长,说短不短,由于中间夹杂着春节假期,大多数学生很难完整安排学习计划。

那如果我们以20天来计算,AI大模型会给孩子们安排什么样的学习计划呢?

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

(注:全文截图均按照:讯飞星火、通义千问、文心一言、GPT4进行排序)

总结:从篇幅来看,讯飞星火给出的计划非常详细(因为长度原因并未截全),并且详细到每个学科;GPT4与文心一言给出的方案内容大致相似,但前者在内容上更加丰富,而通义千问则具体到每个时间段。但总体来说,AI大模型生成的计划都过于笼统。

安排好学习计划后,下一步就是开始辅导作业了。

语数外题目实测

论语数外三门中最难的学科,大部分人可能首先会在数学上犯了难。

那么今天我们就看看AI大模型的解题能力如何?

(1)第一道是个小学数学应用题,涉及未知数和方程式。

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

总结:在使用截图时,通义千问给出了正确的方程式,但奇怪的是在计算时翻车。而其他三家大模型都因为识别数字原因列错了公式。

而在手动输入题目后,四家大模型都给出了正确答案,不过文心一言“别出心裁”使用用T代表未知数,这可能不太符合一般的教学习惯。

(2)有了应用题,几何题自然也不能错过。

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

结论:由于文心一言需要多次步骤,因此笔者并未继续操作,其他三家均给出了解题步骤。其中在观感上,还是国产大模型更胜一筹,而GPT4文字描述过多,总体来说这三家的表现都很不错。

做完数学题,让我们来几道英语题。

对于大部分家长来说,由于长期远离英语环境,词汇掌握量逐年下降,当孩子升入中学后,辅导英语就变得十分困难。

其中,长难句又是英语学习中最难的一部分,无法理解句子自然也很难选择正确答案。

就翻译来说,大部分AI大模型都可以给出准确的答案,但要做到“信达雅”,还是有一定的难度的。

(3)让我们先用一句经典的英文名句试试:

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

结论不得不说,每家英翻中都很有诗意,其中GPT4和讯飞星火给出的翻译最为对仗,不过GPT4还附带了对原句的解释,通义千问则找出了原句的出处。

(4)那么换成考试真题的长难句后,表现又如何呢?

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

结论:在这句话的翻译上,之前表现平平的文心一言这一次翻译地最为出色。而其他三家则更加贴近直译。对于学生们来说,通俗易懂的翻译或许更适合应试。

比起数学和英语,语文学科更加考验中文能力,也正是在这一部分,GPT4遇到了难题。

(5)首先来一段文言文的翻译:

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

结论或许是因为大模型在理解“白话文”和“文言文”时出现错误,目前均不支持全文翻译。在改为短句子后,翻译的准确性明显高了许多,笔者个人更偏好讯飞星火的翻译。

最后,让我们拿出“作者都觉得离谱”的现代文阅读,看看大模型们能不能读懂出题人的心。

这是一篇来自2023年全国高考的散文《给儿子》,原作者陈村,该文不仅篇幅较长,并且蕴含非常多的寓意。

(6)首先让大模型总结一下文章的内容:

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

(7)接着我们让大模型们来尝试下高考真题,看看他们是否可以理解段落背后的含义。

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

被寒假作业逼疯?实测三款主流国产大模型,哪家辅导作业最靠谱

总结:从个人主观判断,三款国产大模型在中文理解能力还是强于GPT4,不过后在理解段落的回答上,表现也称得上超出预期。

结语

从以上的实测来看,对于家长们来说,国产大模型已经足够应对孩子们的日常作业。

而国产厂商们针对中文语境的持续优化,也让 AI 在教育领域的应用场景更加多元,让更多人享受到AI带来的价值。

例如今天下午举行的星火认知大模型发布会上,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5,多个核心能力得到全面提升,其中在数学、语言理解、语音交互能力上已经超越GPT-4 Turbo。

在发布会上,刘庆峰着重介绍了通用人工智能对教育领域的赋能,他表示:“教育是人类进步的根本,关乎每一位个体,是真正的全民刚需。”

随着大模型的全新提升,新版本在视觉问答、联想推理等方面实现了高分应对,理解更加精确,表述也更好。

除了教育领域以外,国产厂商正利用大模型赋能千行百业,把大模型技术的创造力转化为促进产业高质量发展的新质生产力,正在成为行业的共同选择。

]]>
https://www.im2maker.com/news/20240131/ybul2j1vlipwxq8e.html/feed 0
回顾 | 2023年的AI:突破之年 https://www.im2maker.com/news/20231229/rua3vfwy2jupnh0z.html https://www.im2maker.com/news/20231229/rua3vfwy2jupnh0z.html#respond Thu, 11 Jan 2024 03:42:47 +0000 https://www.im2maker.com/?p=87405

2023年见证了人工智能(AI)的非凡进步。在这一年里,我们看到了突破性的技术飞跃,深刻的伦理争论,也目睹了AI在意想不到的领域展示出前所未有的影响力:例如在娱乐领域,留下的一些不可磨灭的印记。

从前沿的大型语言模型(LLMs)的首次亮相,到创新性的Humane AI-Pin硬件,再到令人惊叹的全新披头士歌曲创作,今年的AI展示了快速发展和广泛影响。最终,AI融入我们的生活结构,塑造我们的技术,并深刻影响我们的文化和艺术。

以下是2023年AI领域最重要发展的回顾。

开源AI、许可争论和生成式人工智能

今年AI的深刻变革,以“开源AI的进步、许可争论和强大的生成式人工智能(AIGC)模型的出现”为标志。

· 开源AI的开发,飙升至前所未有的高度,重塑了AI的框架和模型格局。

PyTorch 2.0的发布树立了新的行业标准,为研究人员和开发人员提供了强大的工具。

其中,英伟达的Modulus以及基于PyTorch的Colossal-AI框架,进一步丰富并增强了开源生态系统,促进了协同创新。

而微软和谷歌等科技巨头,也为这一势头做出了卓越里程碑式的贡献——微软将ChatGPT整合到Bing中,而谷歌推出了Bard。

· 但开源AI并非没有争议。Meta以开源的方式发布了Llama 2,这引发了各方关于AI中“开源”定义的激烈辩论。虽然称作重大行业贡献,但Llama 2在规模上的局限性,引发了外界对其真实开放性的质疑,并最终引发了“关于需要重新定义许可模型,以解决人工智能所呈现的独特复杂性”的讨论。

· 同时,2023年出现的先进AIGC模型,彻底改变了自然语言处理和创意内容生成。

· OpenAI的GPT-4是一种开创性的语言模型,它重新定义了AI能力。GPT-4在基于文本的应用程序中非常出色,在创造性写作、编程和解决复杂问题方面,表现出非凡的熟练度。

· Jina AI的8K文本嵌入模型,和Mistral AI的Mistral 7B,展示了AI社区在处理大量文本数据方面日益增强的能力。这些模型突显了更强大、更细致的AI模型趋势,而这些模型在多个领域都具有广泛的应用。

尽管取得了这些令人印象深刻的进步,但AIGC模型的激增同样在今年引发了伦理担忧,这当中包括AI生成内容的偏见、AI开发对于透明度的迫切需求等等,这些尖锐问题已经日益凸显。

随着AI继续深入各个领域,行业从业者必须努力确保AI的使用符合伦理和责任。

未来就业问题

· AI与就业之间的相互作用,让就业市场产生了重大变化,其最大特征是随着自动化程度的提高,让就业市场出现了一些微妙的动态平衡。

在一些行业的日常工作里,如果使用AI(工具),可以有效地提高工作效率,但这也引发了员工对工作岗位流失的担忧,尤其是一些涉及重复性任务的岗位。

· 作为回应,政府、企业启动了技能提升和再培训计划,为劳动者们提供与AI相关的技能。教育机构也调整了他们的课程,提供包括AI、数据科学在内的相关课程,为后来者在进入受AI影响的就业市场之前,提前做好准备。

· 而随着AI在工作场所监控和绩效评估中开始大范围部署,工人权利和隐私引起了外界担忧,此时道德就变得至关重要。特别是零工经济,由于见证了AI驱动平台带来的激增,更是引发了零工工人工作稳定性和保护的监管框架的必要性的辩论。

在经济上,AI现在被视为增长动力,创造了新的产业,但这需要公平地分配AI的利益。而未来的就业格局预计将再次发生变化,重点体现在人类与AI的协作、战略和创造力。

政策、监管和地缘政治

AI政策、监管和地缘政治之间的相互作用,成为当下全球AI格局的定义特征。今年,各国在建立AI治理框架方面取得了重大进展,同时行业见证了主要国家(尤其是中国和美国)之间的激烈竞争和战略定位。

中国和美国:中国和美国在AI研发方面,都投入了大量资源,其中美国主要创新性AI技术方面保持领先地位,而中国在AI基础设施和大规模部署方面取得了重大进展。而两国都将AI视为国家安全的关键要素。

欧洲国家英国、法国以及德国,都推进了AI监管工作,他们认识到在AI技术研发中,技术必须与伦理原则相一致的重要性。

欧盟:欧盟通过审议《人工智能法案》,在AI监管方面发挥了主导作用,旨在为人AI伦理建立全球基准。这其中包括关注透明度、问责制和道德问题。然而,人们担心这些法规可能会影响开源AI的开发,特别是大模型和相关框架。

虽然没有直接参与到中美之间的AI竞赛,但欧盟对于全球AI标准的建议产生了重大影响,努力在技术创新与保护隐私之间取得平衡。

目前,欧盟正在进行的讨论,重点强调了AI伦理和监管,重点关注权利和责任。通过对《人工智能法案》进行修订,欧盟正以更全面的法规解决这些道德问题。

此外,联合国等国际实体通过成立一个新的咨询机构,就AI的全球伦理影响进行了对话。

垂直行业

AI与医疗保健:这一年,医疗行业取得了重大进展,AI推动了诊断和药物发现的改进。AI驱动的诊断工具,如PathAI的系统,大大提高了癌症的检出率。此外,AI驱动的药物发现平台(如Atomwise)加速了潜在疗法的识别。

AI与金融:金融行业继续进行AI驱动的转型。像Virtu Financial这样的高频交易公司采用人工智能算法来做出更精确的交易决策。与此同时,以Forter为例的人工智能欺诈检测解决方案提高了金融机构打击欺诈交易的能力。

AI与自动驾驶汽车:特斯拉和Waymo等公司凭借在自动驾驶汽车领域的进步正成为汽车领域的焦点。今年,特斯拉的全自动驾驶(FSD)系统实现了关键性的更新,使其更接近自动驾驶能力。与此同时,Waymo将其自动驾驶叫车业务扩展到更多城市,推动了自动驾驶技术的发展。

AI与教育:教育部门开始将AI用于个性化学习体验。例如Coursera和edX等平台利用AI技术推荐课程,并能根据使用者实际情况调整内容,从而增强学习的体验感。此外,以Proctorio为例,这种由AI驱动的评估工具,可以很好维护在线考试的学术诚信。

AI与气候变化:AI在2023年应对气候变化方面发挥了关键作用。例如ClimateAI等气候建模平台,正利用AI改进气候预测,以缓解气候变化。而类似Verdigris这样的能源管理系统,优化了建筑物的能源消耗,为实现可持续发展目标做出了贡献。

AI和网络安全:随着来自网络的威胁日益严峻,人工智能驱动的网络安全解决方案开始备受关注。Darktrace是一种基于人工智能的平台,它提供了实时威胁检测和响应,可以加强网络安全态势。

AI与研究和资助:研究机构和组织在2023年取得了重大的AI突破。美国国防部高级研究计划局(DARPA)在AI领域的投资旨在使AI系统更易于理解和透明化,增强信任和问责制。OpenAI与学术机构的合作,促进了双方在AI领域的研究与合作。

AI与艺术和创意:AI创造的艺术和音乐,同样引起了广泛关注。由Aiva和Artbreeder等公司提供的AI生成的NFT(非同质代币)颠覆了艺术界,引发了对艺术和作者身份定义的思考。而在一项美国法官的联邦裁决中,确定了AI生成的艺术作品,不能被授予版权。

人性化的AI Pin:技术奇迹,广泛影响

售价 699 美元的Humane AI Pin,标志着可穿戴技术的重大发展。这款具有1300万像素超广角摄像头和激光投影功能的设备,将时尚与科技融合在一起,标志着服装和配饰开始向“科技感”转变。

它能够将先进的AI功能集成到日常穿着中,代表了“智能时尚”的出现。而这一趋势将涵盖更多可穿戴设备。这些设备提供的不仅仅是健身健康跟踪功能,还能提供包括交互式和增强现实体验。苹果、谷歌和亚马逊等大型科技公司可能都会开发类似的创新,进一步将时尚与技术融合在一起。

然而,考虑到Humane AI Pin 具有捕获和投影图像的能力,这款设备引发了外界对于隐私和数据安全的新担忧。

随着时尚与技术融合的进步,围绕负责任的数据处理和用户同意进行讨论的重要性预计将增加。

OpenAI 领导力危机

2023年11月,OpenAI经历了重大的领导层变动,首席执行官Sam Altman的离职在人工智能社区中造成了动荡的氛围。

最初,OpenAI董事会宣布Altman将辞去首席执行官一职并离开董事会,由该公司首席技术官Mira Murati担任临时首席执行官。领导层的这一意外变化给整个行业带来了冲击波,反映了公司治理在快速发展的人工智能领域中错综复杂且有时不稳定的性质。

然而,戏剧性的是,Sam Altman在最初被罢免后不到五天,就恢复了OpenAI的首席执行官一职。OpenAI还同意重组董事会,新的董事会成员将发挥作用。决策的快速转变强调了将人工智能发展与公司治理和道德要求相协调的挑战。

OpenAI的领导层危机凸显了人工智能行业公司治理、道德和创新之间的复杂关系。这场危机也突显了负责任的人工智能治理的重要性,以及在追求人工智能进步时优先考虑道德考量的必要性。领导层问题的迅速解决,最终导致奥特曼的回归,也证明了在人工智能研究和开发前沿的科技公司中,领导层的动态和往往不可预测的性质。

人工智能的一年还没有结束

当我们回顾人工智能领域2023年的变革时,很明显,这项技术带来的机遇既广泛又复杂。

展望未来,我们的主要挑战在于负责任地利用人工智能的力量,确保它成为一股向善的力量,并以造福全人类的方式继续推动创新。

本文编译自ZDNET,内容有所删改,原作者: Jason Perlow

原文链接:https://www.zdnet.com/article/ai-in-2023-a-year-of-breakthroughs-that-left-no-human-thing-unchanged/

]]>
https://www.im2maker.com/news/20231229/rua3vfwy2jupnh0z.html/feed 0
这届CES2024,芯片巨头要把AI塞进汽车里 https://www.im2maker.com/news/20240110/gqvk6olfa8z3tx7r.html https://www.im2maker.com/news/20240110/gqvk6olfa8z3tx7r.html#respond Thu, 11 Jan 2024 02:46:34 +0000 https://www.im2maker.com/?p=87483

又是一年一度的CES国际消费电子展,在这场全球最大的科技盛会上,汇集了来自世界各地的顶尖科技企业。

在过去几届CES上,智能汽车是最吸引人们关注的领域之一,今年还要再加上AI这个主题。

英伟达高通相继在CES上公布了汽车领域最新的进度后,英特尔也加入到这场巨头乱战里,他们在收购一家芯片初创公司后,计划将AI带上汽车。

收购芯片公司,将AI PC体验带入汽车

当地时间1月9日,英特尔在CES上宣布,将推出基于AI PC技术的汽车芯片,首批芯片将于今年年底推出。

除此以外,英特尔还计划收购一家汽车芯片设计和软件公司,借此将其“AI Everywhere”的战略推进至汽车市场。

这里先简单介绍一下被英特尔收购的神秘企业。虽然成立时间不长,但这家名为Sillicon Mobility SAS的法国初创公司早在2016年就已经推出一款成熟的FPCU产品OLEA T222。

所谓FPCU,全称为Field Programable Control Unit,该系统里集成了CPU、灵活逻辑单元 (FLU)、数字信号处理 (DSP) 加速器以及数学协处理器,可以对不同的功能进行分配任务。

在Silicon Mobility看来,传统的汽车微控制器已经无法适应不断变化的环境,随着电动智能车辆的控制系统越来越复杂,必须设计出一套全新的平台在同一个模型下进行设计开发,这样才能实现实时、安全且可靠的控制应用、功能分组等需求。

说到这里,FPCU芯片似乎与AI毫无关联,但芯片巨头英特尔有自己的想法。

在活动期间,英特尔的一项演示里,展示了12种高级工作负载,其中包括生成式 AI、电子反光镜、高清视频会议通话和PC游戏。它们在多个操作系统上同时运行。该演示展示了汽车制造商如何整合传统电子控制单元(ECU)架构,集成其专有定制解决方案和AI应用程序,以提高效率、可管理性和可扩展性。

在英特尔看来,汽车的未来是由软件定义的,也就是不少车企会提到的软件定义汽车(SDV)。

从概念上来看,SDV体系结构是将汽车的特性和功能作为软件工作负载进行操作,并在一个高性能计算平台上进行整合,从而实现车辆的各种功能。

既然FPCU芯片可以实现不同应用、功能的分组控制,那自然可以将生成式AI在内的功能塞入其中。

不过要注意的是,英特尔发布的是专用的SDV芯片,并非FPCU芯片。

它的形态更接近的酷睿Ultra处理器,采用Meteor Lake架构,用3D封装的方式将都多个单元封装在一起,其中就包括了AIGC模型,也包括了FPCU芯片功能。此外FPCU芯片更多突出在提升汽车效能方面。

据外媒相关报道,英特尔汽车副总裁兼总经理Jack West在接受采访时表示:“英特尔正在采取‘整车’方法来解决行业面临的最大挑战”。

“在整个车辆平台上推动创新的人工智能解决方案将有助于行业向电动汽车转型。收购Silicon Mobility符合我们的可持续发展目标,同时满足了行业的关键能源管理需求。”

为什么要急着让AI上车?

即使在PC业务持续反弹的背景下,英特尔在2023年的成绩单依然不够理想。

2023年的第三财季,英特尔营收142亿美元,虽高于分析师预期,可仍就同比下滑,这也是英特尔连续第七个季度出现下滑。

具体到细分业务,英特尔几个核心业务的表现均不理想,仅有自动驾驶部门Mobileye以及代工服务(IFS)实现了增长。

当然,Mobileye的日子也不好过。随着越来越多的车企开始采用英伟达、高通、AMD等芯片企业的产品,Mobileye逐渐开始丢掉了市场,英特尔也计划将其再次分拆并单独上市。

既然Mobileye靠不住,而英特尔又不愿放弃汽车芯片这块大蛋糕,好在英特尔还手握AI这个杀手锏。

2023年9月,英特尔CEO帕特·基辛格开创性地提出了AI PC的概念,时隔三个月后,帕特·基辛格又在年底的新品发布会上谈到了“AI Everywhere”战略,并推出两款面向AI的处理器平台——酷睿Ultra移动处理器以及第五代至强可扩展处理器。

有了桌面级和移动级,汽车SoC自然也不会错过。在英特尔看来,随着汽车SoC集成了先进的AI PC技术以及数据中心技术,就可以满足真正软件定义车辆架构的需求。换句话说,车企们可以在AI芯片的加持下实现更加先进自动驾驶功能以及AI功能。

但问题来了,生成式AI究竟能给智能座舱带来多少有趣的功能,英特尔并没有给太多具体的案例。

不过在活动期间,吉利旗下高端品牌极氪汽车CEO安聪慧透露了一点信息。

安聪慧表示,极氪将成为首家采用英特尔全新软件定义汽车SoC系列的整车厂,同时,极氪将与英特尔共同打造“移动生活空间”,实现“最理想的车载AI功能”。

将智能座舱打造成“移动客厅”,其实已经有不少车企提出相关的概念,但很少与AI有关,希望极氪和英特尔能给我们带来一点惊喜。

除极氪之外,英特尔暂时并未透露任何其他客户,只是表示保持在与多家OEM进行谈判。

有趣的是,极氪同时也是英伟达Orin芯片以及骁龙座舱平台的用户。

一般来说,车企并不会局限于某一家自动驾驶芯片公司或者座舱系统平台,上游汽车芯片厂商们也尽力为车企们打造差异化、品牌化的创新性功能,从而抢下更多客户。

而在本次CES上,英伟达与高通同样展示了他们的AI能力,携手多家合作伙伴展示了“汽车朋友圈”。

相比之下,缺少客户的英特尔,还有很长一段路要走。想要开始智能座舱新一轮内卷,就必须吸引更多合作伙伴。

]]>
https://www.im2maker.com/news/20240110/gqvk6olfa8z3tx7r.html/feed 0
2024年了,“钻石芯片”还要多久造出来? https://www.im2maker.com/news/20240103/ffuzvr2w6niwbsgy.html https://www.im2maker.com/news/20240103/ffuzvr2w6niwbsgy.html#respond Wed, 03 Jan 2024 12:26:50 +0000 https://www.im2maker.com/?p=87406

金刚石,被称作自然界中最硬的物质。在经过打磨后,这种“普通”的碳晶体就化身为宝石级的钻石,身价随之倍增。

而除了装饰外,很少有人知道金刚石其实也能用于半导体行业,在加工后变身为价格昂贵的“高端芯片”。

材料类期刊Small近期发布的一篇文章里,提到了大阪公立大学研究小组利用金刚石为衬底,制作出了氮化镓(GaN)晶体管。而该晶体管的散热能力,要比传统晶体管提高了2倍以上。

这篇文章表示,这种由晶体管不仅可以用于5G通信基站、气象雷达、卫星通信等领域,还可以用于微波加热、等离子体处理等领域。

但笔者在查阅相关信息后发现,早在二十年前,科学界就曾掀起研究金刚石半导体的热潮。包括刚刚过去的2023年,有不少企业和研究机构推出类似的技术,这其实就包括华为与哈尔滨工业大学共同合作的金刚石芯片专利。

但时至今日,钻石芯片仍未掀起多大的水花。

用钻石造芯片,究竟有何魅力?

想制作电子元器件,就需要半导体材料。

虽然可以用作半导体的材料种类繁多,但在历经数次材料革命后,真正做到成本与性能同时兼顾的,只有硅元素——在此基石上目前最常见的硅基半导体

不过随着工艺技术不断进步,硅材料的潜力基本已被挖掘到极致,想要继续推进半导体行业发展,就需要用特性更好的材料接续。

近些年出镜率颇高的氮化镓(GaN)和碳化硅(SiC),属于第三代半导体材料。再往后,氧化镓、氮化铝等第四代半导体材料,他们对比硅材料都有各自独特的优势

除此以外,我们还能在看到石墨烯、碳纳米管等材料被用于生产晶体管。

既然它们都属于碳的同素异形体,那么同样是碳元素单质同素异构体之一的金刚石,理应可以用作生产半导体。

从物理化学特性来看,金刚石确实如此。

该材料不仅硬度最高,而具有最高的热导率、透过光谱最宽、耐磨抗辐射抗腐蚀等优秀特性。

金刚石强在哪里?

先说金刚石的高热导率

在大阪公立大学的研究里,提到了“由金刚石为衬底制作的氮化镓晶体管,其散热能力提高两倍之多”。

目前而言,芯片制造面临的最大基本挑战之一便是温度控制。对于大部分硅制的芯片来说,一旦温度过高,那么芯片就会变得不可靠。

而金刚石恰好是一种完美的“散热器”。在热导率数值上,它比碳化硅大4倍,比硅大13倍,可以有效降低半导体器件运行时产生的热量。

图 | 热量情况对比

在华为的金刚石专利里,提到了利用金刚石极高的发展潜力,为三维集成的硅基器件(硅基与金刚石衬底)提供散热通道。

除了出色的散热性能以外,金刚石拥有高达5.5eV的禁带宽度,更适合应用于高温、高辐射、高电压等极端环境。

在2023年初,日本佐贺大学与日本精密零部件公司Orbray共同合作开发了一个金刚石制成的功率半导体。

他们在蓝宝石衬底上生长金刚石晶片,制成2英寸的单晶圆,以此制成的功率半导体能以每平方厘米875兆瓦的功率运行,输出功率值为全球最高,且电力损耗可减少到硅基半导体的五万分之一。

图 | Namiki于2022年4月制作的2英寸晶圆

除了日本公司以外,美国公司也在积极推动钻石芯片的产业化。目前比较出名的一家美国公司名叫Diamond Foundry,他们是全球“人造钻石”领域的明星企业。

在Diamond Foundry官方计划里,他们开发出一套技术,可以将硅芯片与金刚石半导体衬底结合,以消除限制其性能的散热瓶颈。

这项技术与上文提到的华为专利非常类似,不过Diamond Foundry的动作更加迅速,目前已经在云计算和AI计算等芯片上进行尝试,可以让数据中心芯片使用一半的空间即可实现相同的性能。

让金刚石变成芯片,比想像地难得多

随着近些年投入“人造钻石”的企业越来越多,人工培育钻石已经在电信、光学、医疗保健等领域中得以广泛应用。

在这么多有利条件下,行业仍然没有拿得出手的芯片产品,那么问题到底出现在哪里?

原因很多,但归根究底还是供给问题——纯度高的天然金刚石供不应求,而人造金刚石又会因为工艺问题,并不适合制造半导体

前面提到,金刚石芯片的长期的方向是作为“高端芯片”的突破口,而不是普通芯片的替代,这就要求晶圆更大。

以目前人造金刚石企业的技术水平,显然是造不出大尺寸晶圆,更不要说达到商业化的要求。

以Diamond Foundry为例,该公司目前生产的晶圆尺寸大约为4英寸长宽、小于3毫米厚度。日本企业的晶圆尺寸更小,只有大约2英寸。

尺寸小是一方面,想要造出一颗能用的芯片,还得考虑如何提高金刚石的生长反应速度、有效切割这种坚硬的材料,并对晶圆的表面进行处理。

直到最后一步,才是将金刚石晶圆与半导体芯片结合,这中间有太多的步骤等待突破了。

因此,虽然我们能看到非常多的专利与研究,但金刚石芯片离半导体产业还有很长的道路要走,不仅仅需要降成本、扩大规模,尺寸和金刚石纯度都需要考虑到位。

如果只是让金刚石企业独自来做这件事,那确实很有难度。

]]>
https://www.im2maker.com/news/20240103/ffuzvr2w6niwbsgy.html/feed 0
除了ChatGPT,《自然》年度十大人物还有哪些看点? https://www.im2maker.com/news/20231214/0qhuyibrvei9ms5h.html https://www.im2maker.com/news/20231214/0qhuyibrvei9ms5h.html#respond Thu, 14 Dec 2023 10:05:01 +0000 https://www.im2maker.com/?p=87228 除了ChatGPT,《自然》年度十大人物还有哪些看点?

《Nature》(下称《自然》)杂志在14日公布了2023年度十大人物榜单(Nature's 10),作为科学界普遍关注的、国际性、跨学科的周刊类科学杂志,甚至要比评奖相对滞后的诺贝尔奖更能反应每年的重大科学事件。

今年的十大人物主要围绕生态环境、人工智能、生物化学、物理学展开。

有些特殊的是,今年在十大科学人物之外,还有一位“非人类”上榜——ChatGPT,当然,它并没有占用十人的名额。

人工智能:改变科学的发展进程

关于ChatGPT的入选,Nature特写部主编理Richard Monastersky表示:“ChatGPT占领了今年的各种新闻头条,科学界乃至整个社会都切身体会到其影响,虽然这个工具并不算人物,也不完全满足 Nature 十大人物的评选条件,但我们将其破例纳入榜单,以承认生成式人工智能给科学发展和进步带来的巨大改变。

从2022年11月正式公开以来,ChatGPT就一跃成为了科技圈最热门的话题,此前从未想象过一个智能工具,能够发展到一定程度上取代部分人类工作的程度。

除了ChatGPT,《自然》年度十大人物还有哪些看点?

(图源:OpenAI

《自然》肯定了ChatGPT的强大能力,同时也认为“这项技术很危险”,作为一个事实上的“黑盒”,在未知代码和训练素材的结合下,人们无法知道大语言模型究竟发展到了什么程度。

作为创建ChatGPT的核心人物,OpenAI首席科学家伊尔亚·苏茨克维Ilya Sutskever也在此次的“十人”榜单当中。

在今年11月发生的OpenAI“宫斗大剧”当中,Ilya作为可能的主导人,解雇了CEO萨姆·奥尔特曼Sam Altman,其主要矛盾点就在于担忧“AI安全性”。

除了ChatGPT,《自然》年度十大人物还有哪些看点?

(图源:OpenAI)

在此前的几个月里,Ilya就曾频繁表露过对AI安全的担忧。7月时,OpenAI组建了一个新的团队——“超对齐”。Ilya作为该团队的领导,计划未来4年投入OpenAI 20%的算力,用AI监督AI,实现“AI对齐”,就是要求AI系统的目标要和人类的价值观与利益相对齐

《自然》认为生成式人工智能革命已经开始,而且没有回头路。

“骗局”和“侦探”

不知道各位是否还记得,今年7月底闹得沸沸扬扬的“室温超导”事件?

当时,韩国的一个科学家团队发表了两篇论文,声称他们已经发现了全球首个室温常压超导材料,名为“改性铅磷灰石晶体结构(LK-99)”。

虽然LK-99最后被证实并非超导,但由于室温超导的实现意义实在太大,当时确实吸引了全世界的关注。不过似乎很少有人注意到,类似的“骗局”总要有一个揭秘者。

詹姆斯·哈姆林(James Hamlin)就是这样一个“侦探”。

除了ChatGPT,《自然》年度十大人物还有哪些看点?

(图源:《Nature》)

早在今年3月,美国纽约罗切斯特大学的物理学家兰加·迪亚斯(Ranga Dias)及其团队就宣称,他们在1GPa(约等于1万个大气压)的压强下,在镥-氮-氢体系中材料中实现了室温(约21℃)超导,他们将结果论文发在了《自然》期刊上,但在11月就被撤回了。

这是Dias在一年多时间里被第三次撤回论文了,完成最多调查工作的就是Hamlin。

他先是发现Dias团队2020年的论文中有与自己2009年的论文测量结果相似之处;后来又发现,Dias在《物理评论快报》上的一篇论文重复使用了他的论文数据;而在今年这次事件中,没等Hamlin出手,南京大学的团队就推翻了Dias的研究结果。

“十人”榜单上的另一位物理学家安妮·克里奇(Annie Kritcher)则是核聚变点火相关的。

新型“减肥药”GLP-1上榜

“十人”榜单中,生物化学方向占了四席,除了疟疾斗士、膀胱癌治疗、单性生殖之外,今年很值得关注的,应该是领导了胰高血糖素样肽-1(GLP-1)早期研究的生物化学家斯韦特兰娜·莫伊索夫(Svetlana Mojsov)

除了ChatGPT,《自然》年度十大人物还有哪些看点?

(图源:《Nature》)

很多读者也许不知道GLP-1是什么,但如果说“一针瘦”“网红减肥针”这样的描述,应该就有不少人听过了。

作为近一年时间里燃起的“新星”,司美格鲁肽等GLP-1类药物几乎席卷了全球的社交媒体,就连马斯克等名人也在使用并且成功减重。

司美格鲁肽主要作用于胰岛,原本是用于2型糖尿病患者治疗的药物,但因为能够作用在下丘脑以抑制食欲,因此被研发出减肥相关的应用方向。

虽然科学研究表明其确实能起到减肥作用,但需要注意的是,这类药物并不适合所有人,请务必在医生指导下使用。

《自然》杂志的故事中没有提及这类药物的作用,主要是肯定了Mojsov在发现GLP-1的研究中的突出贡献。现年已经70岁的Mojsov在此前并没有得到人们的认可,也没有分享到相关研究成果的科学奖项。

写在最后

完整的榜单奉上:

印度空间研究组织“月船 3 号”项目副主管卡尔帕纳・卡拉哈斯蒂(Kalpana・Kalahasti);

美国国家点火装置首席设计师安妮・克利切(Annie・Kritcher);

日本大阪大学的发育生物学家林克彦(Katsuhiko Hayashi);

OpenAI 首席科学家伊尔亚・苏茨克维(Ilya・Sutskever);

巴西环境部长玛丽娜・席尔瓦(Marina・Silva);

联合国首位全球首席高温官埃莱尼・米尔维利(Eleni・Myrivili);

寄生虫学专家哈利杜・廷托(Halidou・Tinto);

伦敦圣巴多罗买医院癌症研究员托马斯・波尔斯(Thomas・Powles);

生物化学家斯韦特兰娜・莫伊索夫(Svetlana・Mojsov);

美国佛罗里达大学物理学家詹姆斯・哈姆林(James・Hamlin)。

对他们的故事感兴趣的观众可以访问《自然》官方网站

本文作者:Visssom,观点仅代表个人,题图源《Nature》

]]>
https://www.im2maker.com/news/20231214/0qhuyibrvei9ms5h.html/feed 0
突发 | 大结局?Sam Altman回归OpenAI重新担任首席执行官! https://www.im2maker.com/news/20231122/0vjsw9boxeyvksoa.html https://www.im2maker.com/news/20231122/0vjsw9boxeyvksoa.html#respond Wed, 22 Nov 2023 06:42:08 +0000 https://www.im2maker.com/?p=86853 突发 | 大结局?Sam Altman回归OpenAI重新担任首席执行官!

神剧情!兜兜转转,Sam Altman又回归OpenAI

突发 | 大结局?Sam Altman回归OpenAI重新担任首席执行官!

在昨天的文章《OpenAI内斗闹剧,究竟是不是微软设下的“阴谋”?》里,笔者预测Altman并不会加入微软,而是在Ilya Sutskever的剧本下,重新回归OpenAI并重组董事会。

突发 | 大结局?Sam Altman回归OpenAI重新担任首席执行官!

从最新消息来看,临时CEO Emmett Shear以及Greg Brockman并不属于新董事会成员,取而代之的是Bret Taylor(主席)、Larry Summers和Adam D'Angelo。

其中,Bret Taylor是Salesforce前联合首席执行官,Larry Summers是前美国财政部长,而Adam D'Angelo是前三位外部董事之一(Quora首席执行官),这次依然保留席位。

有意思的是,Adam D'Angelo被爆出是此次内斗大戏的真正主角之一,一直在推进自己的人工智能项目Poe。

突发 | 大结局?Sam Altman回归OpenAI重新担任首席执行官!

而另一位“幕后黑手”,同时也是外部董事之一的Helen Toner,则被排除在外——她被爆出与Altman发生激烈争执。

剧情真真假假,总之这场年度大戏离大结局应该不远了。

有网友戏称“奥特曼用4天走过乔布斯12 年走完的路”。

这么看,本该是大赢家的微软,这下算是白折腾了。

]]>
https://www.im2maker.com/news/20231122/0vjsw9boxeyvksoa.html/feed 0
OpenAI内斗闹剧,究竟是不是微软设下的“阴谋”? https://www.im2maker.com/news/20231121/h6ra4egvugykvhl9.html https://www.im2maker.com/news/20231121/h6ra4egvugykvhl9.html#respond Tue, 21 Nov 2023 12:34:59 +0000 https://www.im2maker.com/?p=86850

随着OpenAI高管及员工在X上集体刷屏“OpenAI is nothing without its people.(没有员工,OpenAI一无是处)”逼宫董事会,这场科技圈世纪大瓜又朝着一个奇怪的方向发展。

在一份针对OpenAI董事会的联名信里,几乎所有的OpenAI员工们都签上大名,要求剩下4位董事会成员辞职

此外,他们还拒绝了董事会找来的临时CEO Emmett Shear发起的紧急全员大会,团结一致地支持Altman以及Greg Brockman筹备的“新OpenAI”。

按照微软的说法,如果OpenAI员工想要加入这家新公司,他们将为所有员工提供职位

这就意味着,一旦董事会没有达到联名信的要求,OpenAI全团队有可能集体离职,转而投奔微软,而微软将以极小代价收购这只“全明星团队”,成为最大赢家。

那么故事就这么结束了吗?大概率依然是未完待续……

而这样一场内斗大戏,颇有当年微软收购诺基亚的影子。

一次蓄谋已久的恶意收购?

Altman前脚刚被OpenAI董事会开除,转头就投入了微软的怀抱。

这很难不让人怀疑,这场内斗大戏其实是一场蓄谋已久的“表演”。

毕竟从周六凌晨(11月18日)故事开端至今,所有人的目光都集中在Altman以及OpenAI董事会身上。

而作为OpenAI背后的最大金主,微软的存在感并不强直到周日(11月19日)才算真正登场,但一出来就是一个“王炸”

有意思的是,在OpenAI董事会刚发布罢免后,微软股价迅速暴跌,公司市值减少了数百亿美元。

而两天后,微软股价完成暴涨,差价刚好“买下”整下OpenAI团队。

不仅时间点很凑巧,微软CEO纳德拉的发言也颇具内涵

在X上,纳德拉表示,该公司仍然对OpenAI及其新的领导团队充满信心,但与此同时,微软也正在组建一个由Altman领导的“新的高级AI研究团队”。

他还补充说,Greg Brockman以及未透露姓名的“同事”也在这条船上。

如果说Altman和Greg Brockman的突然加入还算正常,那么其他人的身份就耐人寻味,大概率也是OpenAI的高管。

如果有人留意前几天的新闻,就可以注意到微软与OpenAI之间其实早就出现了裂痕。

11月10日,微软将不再允许员工使用OpenAI的ChatGPT服务。

微软称,因安全和数据问题,多种AI工具不再可供员工使用,此外,微软建议员工使用自己的Bing Chat工具。

微软,真金白银为OpenAI投资近数百亿美元,让这家充满梦想的AI创企一夜腾飞,成为AI领域最大的明星。

但很少有人注意到,微软其实没有OpenAI的控制权——包括Altman在内,每位董事会成员其实都不持有任何OpenAI的股权

如果我们从OpenAI成立起开始追溯,这家公司的的控制权应当归属于一个独立的非营利性董事会,名为OpenAI Nonprofit。

因为非营利性的缘故,该董事会成员完全凭借自己的理念对公司发展进行管理,而非追随投资者的意见,也无需负责。

假设微软也算董事会的成员之一的话,虽然涉及了大量投资,并且与OpenAI建立了战略合作伙伴关系,但微软的地位与其他董事会成员其实是一样的,并不能决策。

更不要说微软其实没有OpenAI的董事会席位,而该董事会由三位OpenAI高管以及三位外部人士组成。

在这个离谱的架构下,花了重金的微软其实没有一点话语权,全凭OpenAI董事会自己努力

从OpenAI的角度来说,不被巨头控制,算得上一条红线,也符合OpenAI成立的初衷——彼时,马斯克、Altman等人为了防止谷歌与DeepMind垄断人工智能,因此成立了OpenAI这家”组织”。

然而AI是个非常烧钱的行业,光靠“用爱发电”显然做不久。

因此在Altman的牵头下,OpenAI开始改制,其中就包括开放成立营利部门OpenAI LP,吸引财大气粗的金主,最终微软成为OpenAI的投资人之一,整个公司开始快速发展。

而从微软角度来看,他们除了没有话语权外,还曾与OpenAI签订了一条不寻常的授权条款:OpenAI的AGI系统将“被排除在与微软签订的IP许可及其他商业条款之外”,即“此类条款仅适用于AGI之前的技术成果”

通俗点理解,就是OpenAI实现了AGI技术后,将不对微软开放。

有意思的是,刚好在11月17号,罢免事件的前一天,OpenAI六人董事会曾就“何时实现AGI”曾展开过讨论

一旦OpenAI董事会一直判断达成了其提出的AGI使命,微软就将被剔除出局

那么想要顺利在AGI时代继续保持AI优势,同时抢下OpenAI的话语权,改组OpenAI董事会或是全资收购OpenAI,都是微软可以出现的动作。

巧的是,在这个周末的连续剧里,这些操作居然神奇般同时出现。

作为与微软关系最紧密的那个人,随着Altman加入微软,既不耽误自己的投资生意,又能保证OpenAI完美融入微软

此刻,Altman仿佛化身10年前加入诺基亚的Stephen Elop。

Stephen Elop在职诺基亚期间,诺基亚手机部门由盛而衰,最终导致在2013年被微软收购,他也一直被认为是微软安插在诺基亚的“木马”。

如果的Altman,是否也是微软阴谋的一枚棋子呢?

微软是大赢家吗?

微软真的赢了吗?是的,但又不完全是。

除了Altman以外,Ilya Sutskever或许也是一位“演员”。

在前面提到那个要求董事会辞职的联名信里,Ilya Sutskever的签名赫然在列。

在Altman即将加入微软的关键时刻,Ilya Sutskever突然站了出来,为了保全OpenAI选择再次“演戏”。

虽然是他领导了这次罢免Alman的最初行动,但在最后一刻,他选择了背叛董事会。

要知道剩下三人全部为外部独立董事,完全没有必要为了自己的名声站出来与员工死磕。

如果按现在的剧本发展的话,在Altman一呼百应的影响力面前,Ilya Sutskever以及三个外部独立董事会“被迫”辞职。

只有这样,Altman才会重新回归OpenAI,而不是加入微软,微软吞并“旧OpenAI”的计划也会被打乱

至于Altman、临时CEO Emmett Shear以及Greg Brockman将如何重组OpenAI,目前还不得而知。

或许我们可以设想一下,罢免Altman其实是避免微软强行收购的“主动出击”呢

有外媒报道称,纳德拉曾详细讨论了OpenAI新的董事会结构,包括Marisa Mayer、Brian Chesky和Sheryl Sandberg等硅谷巨头高管的名字浮出水面。

然而OpenAI抢先一步让Emmett Shear当上了CEO,提前占好坑。

从网上公开的消息来看,Emmett Shear是人工智能“安全”的坚定支持者,如果能继续带领OpenAI,非常符合发展长期发展AGI技术的理念。

当然在真真假假面前,以上都只是猜测,但至少可以肯定的是,微软完全收购OpenAI的可能性,将大大降低。

不过即使不能完成收购,微软也实现了打破OpenAI架构的目的。

在财大气粗的微软面前,OpenAI还能坚持几次呢?

]]>
https://www.im2maker.com/news/20231121/h6ra4egvugykvhl9.html/feed 0
站在AGI的大门前,为何我们开始感到恐惧? https://www.im2maker.com/news/20231124/hw3jsdlq0anegrt4.html https://www.im2maker.com/news/20231124/hw3jsdlq0anegrt4.html#respond Tue, 21 Nov 2023 10:44:16 +0000 https://www.im2maker.com/?p=86884

谁曾想到,一场惊动整个科技圈的内斗大戏,起因竟是一封信。

据路透社透露,在Sam Altman遭解雇之前,曾有OpenAI的研究人员向该公司董事会发出举报信,警告一种强大的人工智能可能会威胁到人类

这是一个名为Q*(读:Q-stard)的AI模型,知情人士表示这可能是OpenAI在AGI方向上的最新突破。

长期以来,硅谷大佬们针对“AI安全”的争论一直没有罢休。

或许正因如此,这项可能是下一个革命性技术的直接最新发现,才能被内部人士提前曝光。

关于新模型究竟是什么,目前能知道的信息还很少,但从OpenAI的社区留言可以看出来,大多数人对于Q*的到来并不欢迎

什么是Q*

根据外媒的曝光,我们先来简单介绍一下Q*。

Q*的前身是由Ilya Sutskever团队在2021年发起的GPT-zero项目,目的是解决了合成数据的问题。

如果说此前训练大模型的数据大多源于网络个人数据,而GPT-zero项目可以用计算机生成的数据训练,一下子就解决了数据来源的瓶颈。

对于AI公司们而言,数据也是一种资源。尤其是高质量的语言数据,更是直接决定大模型的质量。

在大模型混战面前,AI公司都是将数十亿参数起步,以TB为单位的数据集进行喂养。不仅数据集可能被耗尽,价格也是水涨船高。

因此当合成数据出现后,就能像永动机一样可以无限生成高质量的数据,从而解决数据问题

在谈到GPT-zero项目,马斯克也评论称:“Synthetic data will exceed that by a zillion.(合成数据可以超过1ZB)”。

对比目前已有的数据,一个硬盘就能装下(lt's a little sad that you can fit the text of every book ever written byhumans on one hard drive )。

GPT-zero的研究成果下,OpenAI两位高级研究人员Jakub Pachocki 和 Szymon Sidor构建了Q*模型,

虽然目前可能水平并不高(小学生数学能力),但专业人士认为该模型能够解决此前从未见过的数学问题。

而这又牵涉另一个技术——Q-learning算法

这是一个经典的强化学习算法,有很强的规划能力但不通用、不可泛化;而大模型的优势就是近乎大模型具备了人类水平的泛化能力,又称举一反三。

那么将两者合二为一后,这种既有规划能力,又有泛化能力的大模型,已经非常接近人脑,可以自主学习和自我改进,而最终的结果:大概率可以出现自主决策,并具备轻微自我意识,成为接近超越人类的AGI

如果报道内容属实,我们可以设想一下,在商业化和安全性观念分歧下,保守派代表Ilya Sutskever高调主导这次罢免Altman事件。

就在今年7月时,Ilya Sutskever就从组建了一个团队,致力于限制AI潜在的安全威胁。

 而在Altman回归OpenAI后,Ilya Sutskever没能留在董事会。

图 | Ilya Sutskever在Ted上谈论AI安全

目前,OpenAI并未对Q*的报道发表回应,OpenAI究竟是不是实现了AGI,我们也只能等后续的报道。

人们在担忧什么?

在报道发出后,OpenAI 开发者论坛的网友们开始了激烈的讨论。

从几个高赞评论可以看出来,大多人对于Q*的到来还是表现地担忧。

不少人表示,AGI到来的速度比想象得太快,由此带来的负面影响,甚至大于大模型本身

这不免让人联想到此前硅谷大佬们针对“AI安全”的争论——为何在新时代到来前,恐惧、不安也会开始涌现?

让我们以最近DeepMind公布的论文作为参照。

评估一个系统是否符合AGI 的定义,需要从六个维度考虑:广泛性和性能、自主性、持久性、递归性自我改进、任务自主选择、目标驱动。

其中,单就广泛性和性能来说,AGI的最高等级是超越人类(Superhuman AGI),即在所有任务上都能超过100%的人类。也只有这样,才算达到了真正的AGI。

如果再对应其他维度,又可以发现AGI的发展其实会引发许多伦理和安全问题

最终在机遇面前,风险也无法避免:在一些特定领域,AGI可能会超越人类,在关键角色中取代人类,或进行递归性自我改进。一旦这样的AGI最终实现,将彻底改变我们的社会、经济和文化

有意思的是,网友们对于AGI的恐怖,其实更多出于AI公司垄断的担忧

从前文可以看出来,想定义AGI是一件非常复杂的事情。如果询问不同的AI专家,或许会给出不同但有联系的答案。

在这种情况下,想要决定某件事是否是AGI,完全是取决于AI公司的领导人。

一旦人工智能在商业化取得可行性方面,同时又能既得利益,这样一款产品很有可能成为一种“垄断”。

我们都知道,Sam Altman其实是一位对AI商业化特别执着的人。作为激进派的代表,Sam Altman对于AGI一直都是最积极的态度。

然而在非营利治理结构下,无论是Sam Altman,甚至微软,一旦开始做出危险的或违背人类利益的行为,董事会都可以直接驱逐。

这也与这次事件的前期发展十分相似。

不过随着Sam Altman回归OpenAI并重组董事会,目前已有的三人均未独立董事。换句话说,董事会其实无法驱逐。甚至自己都被颠覆了。

在缺少了监管后,OpenAI只剩下政府监管机构这一限制。

然而作为OpenAI背后的大金主,微软在美国政府的AI监管对局里,一直扮演积极推进AI的角色,最终政府的监管对于OpenAI的影响也会越来越小。

在利益面前,关于Q*乃至AGI技术本身,似乎也很少有人讨论了。

]]>
https://www.im2maker.com/news/20231124/hw3jsdlq0anegrt4.html/feed 0
高估值还是大模型,麻烦缠身的阿里云,只能二选一 https://www.im2maker.com/news/20231212/pwhkmu2za6vgvb8b.html https://www.im2maker.com/news/20231212/pwhkmu2za6vgvb8b.html#respond Fri, 17 Nov 2023 09:52:14 +0000 https://www.im2maker.com/?p=87165

一夜之间,阿里又变了天。

11月16日晚间,阿里巴巴集团发布了截至9月30日的季度财报。

财报显示,今年7-9月,阿里整体收入同比增长9%,其主要业务都取得了不错的成绩。

然而在财报发布后的分析师电话会上,上任两个月的阿里集团CEO吴泳铭抛出多个重磅决定,引来市场热议。

其中最让人费解的一点,莫过于被市场寄予最大关注和期望的阿里云,宣布暂停分拆。

此时,距离阿里“1+6+N”分拆计划仅仅过去半年。这场涉及重组的大转向,为何突然刹车?

估值容易,赚钱难

作为中国互联网行业当之无愧的巨头,阿里旗下各类业务种类繁多,但在多元化业务下,底层逻辑依然围绕着“电商”这个属性进行布局。

那么当阿里触及到增长天花板时,电商之外的多业务就需要交给资本市场,而不是一味由集团输血。

这就是年初阿里进行“1+6+N”分拆计划的目的之一。

在此之前,热衷“求变”的阿里在多次分拆业务后,陆续培养出支付宝、天猫、蚂蚁等多个体量庞大的巨无霸项目,为后续的商业帝国打下了牢固基础。

既然如此,阿里云智能业务作为经营多年的老牌业务,在逐渐成为电商之外又一个稳定的“收入引擎”后,自然有成为下一个巨无霸的潜能

当然,因为涉及到组织变革,这次的分拆计划的其实多少有点“被动”因素,阿里云真的有能力独立吗?

在中国乃至全球市场上,其实还没有大规模的公有云业务单独分拆上市的先例。

2月初,中信证券在考虑增速和盈利能力后,参考亚马逊AWS等全球巨头的估值,给阿里云业报出了约2000亿人民币的估值。

然而这个数字低过了部分投资人的预期,他们以8-10倍市销率进行估值,最终按照去年772亿的营收,将阿里云的最终估值拉到8000亿元。

但财报数据证明,阿里云的赚钱能力完全撑不起如此高的估值

在2021年之前,阿里云收入始终保持在50%以上的速度逐年增长。而从2021年一季度开始,阿里云的收入增速开始持续下降,到今年年初更是跌到负数。

图源 | 电子发烧友网

虽然在上一财季再次反弹实现正增长4%,仅仅过去一季度又跌到2%。

相比之下,亚马逊AWS、微软Azure、以及谷歌云依然保持两位数的增速,身后又有华为云、天翼云、移动云等国产云厂商的追赶,阿里云的优势已经越来越小

另一件大事是在今年9月,准备全身心投入阿里云的张勇,突然选择退休。

在张勇接手阿里集团后,阿里云逐渐与钉钉割席,更加注重B端,并且陆续推出AI大模型“通义千问”、生成式AI文生图模型“通义万相”等产品。

凭借AI热潮,大模型似乎是阿里云下一步增长点

大模型时代,阿里云急需求稳

在全面投入大模型之前,阿里云的麻烦,其实远比想象要多

今年双十一,各大电商平台静悄悄。然而,阿里云经历了一次“史诗级”的崩盘,包括淘宝、支付宝、饿了么、闲鱼、钉钉在内的应用均出现故障,此事迅速登上热搜。

据公告,当天阿里云监控发现云产品控制台访问及API调用出现异常,阿里云工程师紧急介入排查,崩盘发生三个多小时后,所有产品就恢复了正常。

此次重大事故,引发了外界对于阿里云稳定性的质疑。且不说企业用户,即便是个人用户,也难以忍受数小时的服务中断。

这也从侧面说明,阿里云在技术层面还是被疏忽的漏洞,这一次的事故无疑为整个集团敲响了警钟

在刚刚过去的2023云栖大会上,阿里云多次强调了AI大模型的重要性。不仅要为创业公司提供AI基础设施,并且自己也要下场做大模型,为客户做好“打样”。

目前,阿里云依然是中国大模型公司的首选。

据阿里云CTO周靖人介绍,包括百川智能、智谱AI、零一万物、昆仑万维等一众耳熟能详的头部企业及机构均在阿里云上训练大模型。

但在其他云厂商的追赶下,阿里云并非唯一选择,一旦不确定性因素,势必会面临云计算行业的大洗牌。

在财报会上,吴泳铭也透露出这个重要隐患:“美国近期扩大对先进计算芯片出口的限制,给云智能集团的前景带来不确定性。”

虽然以阿里集团的财力,并不缺少AI芯片储备,同时自身又具备研发AI芯片的实力,不过提前为投资人打上一针“预防针”,也好为后续长期的烧钱以及可能出现的算力不足做好准备。

众所周知,云业务的支出大头本身带有带宽成本以及机架成本。国内云厂商每年需要缴纳巨额的带宽使用费。而海外云厂商却可以自建网络,这也是国内厂商长期亏损的原因之一。

如今再加上AI算力的投入后,更是一笔庞大的开销

若是阿里云真的选择了独立运营,以目前麻烦缠身的现状,以及过于离谱的高估值,势必会留下新的“爆点”隐患。

因此将阿里云留在集团的资源下,算是一个明智的选择。

结语

拿阿里云与亚马逊微软谷歌三巨头进行比较,本身就是一种错误。在缺少算力的前提,过高的估值反倒给阿里云带来了压力。

我们或许看到微软Azure靠着AI大模型大赚一笔,却忽视了微软背后强大的关键基础设施储备。

相比之下,国产云厂商都或多或少受到算力的影响

长期方向来说,AI大模型肯定没有错,但短期来说,国内的云厂商需要增长,业务实力以及资源,每一项都缺一不可。

]]>
https://www.im2maker.com/news/20231212/pwhkmu2za6vgvb8b.html/feed 0
英伟达H200发布,性能很强,奈何买不到 https://www.im2maker.com/news/20231114/hrkz6xbskfbidpis.html https://www.im2maker.com/news/20231114/hrkz6xbskfbidpis.html#respond Tue, 14 Nov 2023 11:47:50 +0000 https://www.im2maker.com/?p=86713 英伟达H200发布,性能很强,奈何买不到

前几天,OpenAI一场开发者大会,让整个AI人工智能行业的从业者几乎彻夜难眠。而今天,NVIDIA英伟达同样带来了一个重磅消息——几乎可以说是目前最快的AI算力芯片H200正式发布。

距离上一次英伟达发布“新品”还没过去多久,皮衣刀客的步伐可以说是又快又稳。根据官方透露的信息,H200相比于此前的旗舰H100,直接性能提升有60%到90%,参数可以说是拉满了。

算力GPU作为当下“地球上最稀缺的工程资源之一”,一度引来科技大厂们的“疯抢”。在H200发布之后,相信已经有AI公司开始订货了。

不过仔细看H200的规格就能发现,H200的升级可能并没有那么夸张,值得期待的,也许还是后来者。

只是一个“小”升级

对比H200与前代H100的规格,主要负责计算能力的核心单元部分规格并没有改变,算力规模完全一致,所带来的提升只是显存容量从80GB提高到了141GB,显存的规格从原本的HBM3升级到了HBM3e。

英伟达H200发布,性能很强,奈何买不到

(图源:anandtech)

由于本身算力部分并没有变化,因此换用H200并不会对AI大模型的训练速度产生更好的影响,以训练175B大小的GPT-3举例,同规模的H200大概只比H100快10%左右。

而它主要的提升之处在于“推理”。

一般而言,推理对于算力的需求并不高,限制反而在于单芯片的显存大小以及显存带宽,如果应用到多GPU的互联,那么信息通信的带宽反而会不够。即便如NV Link提供的900GB/s的数据通信速度,也无法媲美单卡内部超过3TB/s的速度,更不用说换了HBM3e显存后高达4.8TB/s的性能了。

英伟达H200发布,性能很强,奈何买不到

(图源:NVIDIA)

同样,更大的单卡显存容量也能有效减少跨卡访问的次数,算是一种变相的效率提升。

随着当前AI大语言模型逐步迈向应用化,计算任务的重心已经由早期的训练模型转变为应用端的推理行为。

此前OpenAI就曾苦于AI太过火爆,挤占了大量的推理资源,国内比如此前曾红极一时的“妙鸭相机”也因为用户太多,没有足够的推理资源而需要等待很长时间才能出片。

而H200对比H100的推理能耗直接减半,极大降低了使用成本,真应了那句话——「买的越多,省的越多」

英伟达H200发布,性能很强,奈何买不到

(图源:NVIDIA)

有业内人士推测,后续消费级GPU可能也会出现类似的转变,即在算力一定的情况下,通过提升显存容量和带宽以获得更好的模型推理体验,毕竟在“全民AI”的时代,客户端的性能也需要跟上。

英伟达大规模与高性能计算副总裁Ian Buck表示:要利用生成式人工智能和高性能计算应用创造智能,必须使用大型、快速的GPU显存,来高速高效地处理海量数据。借助H200,业界领先的端到端人工智能超算平台的速度会变得更快,一些世界上最重要的挑战,都可以被解决。

显存是关键

自从近两年AI爆火后就迅速带动了AI服务器的需求爆发,AI大模型的数据参数庞大,除了需要算力支撑模型训练,同样需要数据的传递和处理。

过去20年间,算力硬件的性能提升了90000倍,但是内存、存储的互联带宽只提升了30倍,二者已然有所脱节,数据传递的速度可能远低于数据处理的效率。因此,如英伟达这样的GPU厂商,就引入了HBM代替原本的GDDR内存,通过硅中介层与计算核心紧密互联,加快数据传输速度。

据SK海力士介绍,HBM3e不仅满足了用于AI的存储器速度规格,也在发热控制和客户使用便利性等所有方面有所提升。在速度方面,其最高每秒可以处理1.15TB的数据。

早在今年8月,NVIDIA就已经计划发布配备HBM3e显存的 Grace Hopper GH200 超级芯片版本。

英伟达H200发布,性能很强,奈何买不到

(图源:NVIDIA)

根据anandtech的描述,H200差不多就是GH200的GPU部分,从前面也可以看到,H200的HBM3e显存的容量有些奇怪,是141GB,HBM3e的物理容量应该是144GB,这是由于产量和良率而保留了部分容量。另一方面,H200的显存频率应该是6.5Gbps,虽然比H100提升了25%,但依旧没有达到美光希望中的9.2Gbps。

所以,此次发布的H200可能依旧算不上“满血版”,只能算是加上了HBM3e显存的H100小更新,也正因此两者是互相兼容的,已经在使用H100进行模型训练的可以直接更换成H200。

需要注意的是,H200的实际出货时间是2024年第二季度,也是由于海力士的HBM3e显存需要到今年年底才能产出,最快量产得到明年初。由此可见显存其实才是整个AI发展的重中之重。

英伟达H200发布,性能很强,奈何买不到

(图源:NVIDIA)

不过,在发布中还提到了一些细节,比如2024年的B100,似乎在性能上又能有接近两倍的提升?推测未来的新架构可能会带来一些不同,说不定就是那个真正的“满血版”。

写在最后

当然,受制于美国的出口禁令,H200再强,也卖不到国内。

前两天有消息称,英伟达专为中国市场又开发了新的HGX H20、L20 PCle和L2 PCle GPU,几乎卡在了管制的算力极限上。

英伟达H200发布,性能很强,奈何买不到

(图源:知乎)

只可惜这个规格,嗨……希望国产替代尽快到来吧。

本文作者:Visssom,观点仅代表个人,图源:NVIDIA

]]>
https://www.im2maker.com/news/20231114/hrkz6xbskfbidpis.html/feed 0
长江存储vs美光:一场中美芯片战的“反围剿” https://www.im2maker.com/news/20231113/6a34criossbcybq5.html https://www.im2maker.com/news/20231113/6a34criossbcybq5.html#respond Mon, 13 Nov 2023 09:44:05 +0000 https://www.im2maker.com/?p=87157

11月9日,国内存储厂商长江存储在美国加州北区地方法院正式起诉美系存储大厂美光,指控其侵犯了8项3D NAND相关的美国专利

长江存储在专利侵权起诉书中表示,诉讼是为了终止美光广泛且未经授权使用长江存储专利创新。

一直以来,国内半导体厂商在海外大厂面前都扮演着“弱者”形象,而这一次长江存储选择主动出击。

在这背后,长江存储的硬实力是一方面。更重要的是,中国半导体厂商已经重视到专利这把“武器”。

国产厂商,挑战存储巨头

NAND,又叫闪存,是一种非易失性存储器(ROM),断电后仍能保存数据,通常应用于外部存储器

用通俗的语言,其实就是我们熟知的“硬盘”。

包括SSD固态硬盘、U盘等等在内,其实都是NAND。但一般来说,存储大厂之间的比拼,都围绕在大容量数据存储上。

想要提升NAND的性能,主要有两个技术路径。

其一,是和手机芯片类似,提升制程节点;而当传统2D NAND技术走到瓶颈后,只能通过纵向叠加层数的方式获取高密度和大容量,这就是3D NAND技术。

长江存储之所以能在近些年搅局NAND市场,正是在国际存储巨头集体转向3D NAND的重要转折点,抢先一步量产232层闪存颗粒,并交付给第三方企业进行封装流入市场。

这一切,得益于长江存储在2018年发布的名为“Xtacking架构”的新技术。

该技术简单来说是可以实现并行、模块化产品设计及制造,缩短开发时间和生产周期的同时,还能实现比传统3D NAND技术更高的存储密度与性能。

在这个buff的加持下,长江存储一路开挂。

不仅快速追上与海力士、三星等大厂的距离,并且在同行刚开启商业化时,率先实现量产。

目前,Xtacking技术已经发展到3.0,不少存储国际大厂都对技术非常感兴趣,甚至传出不排除以技术交叉授权的方式来彼此合作,足以看出长江存储在专利层面的储备

在指控书里,长江存储表示,美光侵犯了美国专利号为“10,950,623”、“11,501,822”、“10,658,378”、“10,937,806”、“10,861,872”、“11,468,957”、“11,600,342”和“10,868,031",涉及侵权的产品包括96层、128层、176层、232层的3D NAND。

半导体知识产权专家表示,这些专利的申请日都在2018年之后,并不是长江存储早期成立时的专利,而是与Xtacking技术关系紧密,因此大概率会与美光技术产生重复,且技术成熟度可能会更好。

此外,根据IFI Claims的统计显示,长江存储在2020年之后在美国陆续有获得专利授权,并且在近两年呈现出稳定和增长的态势,目前已经有近400项专利,足以看出长江存储在美国布局专利的力度

值得一提的是,在长江存储成立之初,中科院微电子所向其授权了1000多项闪存专利,更直接派出了工程师团队现场支援。也正是这些积累多年的专利,为长江存储的快速成长奠定了基础。

专利战,虚虚实实

虽然长江存储在美国本土专利储备上做足了准备,但相比于美光近13100项有效的美国专利,前者还是有种“蚍蜉撼大树”的感觉。

而在今年1月份,有一家名为BeSang的美国初创公司,同样因为3D NAND技术起诉了美光和英特尔,但因其体量过小,目前也没有太大进展。

另一方面,在长江存储指控的176层3D NAND技术上,美光其实是全球首个实现量产的厂商,在其专有的CuA(CMOS-under-array)架构下,美光的进度算是最快的。

既然有这么多不利因素,那么长江存储为何还要死磕美光呢?

据《 问芯Voice》的报道,专利战真正目的,是为了在美国的出口管制封锁下,为公司争取公平谈判的机会,是为公司的生存而战

在过去几十年间,西方科技巨头之间的专利大战屡见不鲜,而中国厂商在近些年才开始涉及到专利纠纷,多少有些“不适应。

对于科技公司而言,知识产权其实是公司的竞争力之一,而专利则是知识产权的核心构成。

因此科技巨头之间的专利大战,金钱利益永远不是第一位,市场竞争才是背后更重要的一环

就长江存储而言,目前虽然在NAND市场有了一席之地,但依然受到了不少打压。

为了打开更大的市场,竞争是躲不了的一环。

图源 | 长桥海豚投研

比起三星、海力士等韩系大厂,美光自带“美国半导体企业”的身份,更容易受到市场的关注。

尤其是在中美半导体行业持续对抗、中国企业长期受到出口管制的不公平对待的大背景下,“长江存储vs美光”的对抗更有机会提升中国企业的信息。

另一方面,目前美光在国内被限制,自身发展又受到半导体“周期性”影响,仍处在低谷,对于长江存储而言,这正是难得的机会。

这或许印证了那句,“进攻就是最好的防守”。

专利战的虚虚实实背后,长江存储足够吸引全行业的目光

胜算虽大,国产存储依然很难

去年年底,长江存储被美国商务部列入实体清单,限制了先进设备材料的进出口。这恰好是长江存储公开宣布232层颗粒量产的时间。

在失去领先的“窗口期”之后,美光、SK海力士、三星等厂商逐渐追了上来,在技术上还反超了长江存储。

目前,SK海力士已经公布了其最新的321层堆叠4D NAND Flash闪存样品,三星、美光也陆续曝光300+层NAND闪存。

显然,长江存储在300+层时代开始走向了落后。

不过在价格、以及产品优势面前,长江存储还是能在短时间内搅动市场。

同时,国家集成电路产业投资基金继续为长江进行投资,保证其产能以及研发进度。

希望这次专利诉讼,能为长江存储再次争取到下一个“窗口”,同时也为更多中国半导体企业带来信心

]]>
https://www.im2maker.com/news/20231113/6a34criossbcybq5.html/feed 0
号称“可穿在身上”的ChatGPT,爆火的Ai Pin是创新还是又一次概念炒作? https://www.im2maker.com/news/20231110/wqtuusj7rgwovjck.html https://www.im2maker.com/news/20231110/wqtuusj7rgwovjck.html#respond Fri, 10 Nov 2023 11:53:01 +0000 https://www.im2maker.com/?p=86708

一块没有屏幕、如同玩具一般大小的“小方块”,还没上市就被《时代》杂志评选为“2023年度发明”。

美东时间11月9日,初创公司Humane发布了这款名为“Ai Pin”的AI硬件,售价为699美元,下周预定,明年发货。

没听说过Humane不要紧,这家公司背后最大的投资人,是大名鼎鼎的OpenAI创始人Sam Altman

同时,Humane还获得了来自微软、LG、沃尔沃、高通等知名公司的投资,手握数亿美元的资金。

而作为主角,Ai Pin来头不小,号称要“替代手机”。

其最大的特点,是内置了OpenAI的GPT系列大模型,每个月只需花费24美元,就可以享受到AI的强大功能。

有人称,AI Pin的出现,将革了iPhone的命,真有这么神奇?

没有屏幕的AI硬件,长什么样

你能想象的“下一代手机”,会是什么样子?

Humane的Ai Pin给出了一个方案——它无屏幕,可穿戴,不需要任何唤醒词,光靠语音和手势,就能操作

据介绍,Ai Pin可以实现绝大多数智能手机的功能,通过内置的投影仪,可将画面投影到手掌,并进行交互。

这个依靠手指的交互形式非常有趣,轻轻一动即可切换应用,或是做出其它操作指令。

相比于目前智能手机上的滑屏操作,在省去屏幕这个载体后,Ai Pin的可玩性更高。

操作之外,Ai Pin另一大特点是其强大的AI功能

Ai Pin并没有app,而是直接运行内置的GPT 4大模型,并实时理解使用者需要什么,然后给出当下最合适的操作进行反馈。

在发布会上,Ai Pin展示了多个例子,包括切换歌曲、发送信息、翻译和语音模拟,甚至可以借助摄像头识别物体并给出信息。

光从演示来看,Ai Pin的AI功能确实是非常强大。

至于其他参数方面,Ai Pin采用了一颗主频为2.1GHz的八核高通处理器,内存为4+32GB,支持蜂窝网络、Wi-Fi、蓝牙等各种连接方式,并配备用于服装固定的磁性扣具。

简单来说,除了没有屏幕以外,手机该有的功能,Ai Pin都有。

创新,还是又一次炒作?

Ai Pin的目标,是要打造一款超越iPhone的产品。

事实上Humane与苹果的缘分也非常深

Humane的创始人,是在苹果供职多年的Imran Chaudhri 和 Bethany Bongiorno。

而Humane全公司近200多名员工里,有近百人都是前苹果员工。

在Ai Pin上面,我们可以看到不少与iPhone类似的设计理念,包括强调交互、减少信息压力,同时还非常注重无障碍。

而这些标签,又与可穿戴设备非常贴合。

因此选择一种与手机不同的形式,反倒是一种差异化优势

此外,通过投影的手段,即增加了互动性,也提高了可玩性。类似科幻电影里的“全息投影”那般,充满了未来感。

当然,不只是Ai Pin,不少围绕号称取代手机的智能硬件,其实都在主打“便携性”,强调用AI解放双手

相比之下,Ai Pin做得更加简化,价格也更加亲民——只需699美元就可以得到一款强大的AI助手,这听上去就非常吸引人。

当然,说完了优势,Ai Pin的缺点其实更加明显。

首先从介绍来看,Ai Pin本质上还是没有脱离智能手机的“功能性”,在此基础上,AI功能才是加分项

因此在AI功能还非智能手机的首选项时,Ai Pin其实并非那么容易被接受。

抛弃AI功能以外,我们在演示里可以看到Ai Pin 的投影功能其实非常“简陋”,只有以单一颜色展示信息。

或许作为初代产品,Ai Pin并没有将太关注投影的显示效果,但这种“功能机时代”的显示效果,恰好与智能手机不断进步的屏幕技术形成了对比。

而在硬件层面,笔者对于Ai Pin给出的参数表示一点质疑

特别是这颗2.1GHz主频的高通处理器,是否可以支持GPT4的端侧AI功能?

要知道,前不久高通刚发布支持端侧AI能力的骁龙8 Gen 3,其Cortex-X4超大核心的主频达到了3.3GHz。

相比之下,Ai Pin这颗处理器就显得过于孱弱了。

当然我们也要考虑到可穿戴设备对于功耗的要求。

或许Humane真的是藏了一手黑科技,那么是否会阉割一部分AI功能呢

另一方面,Humane 抛去屏幕这一形式之后,获取信息的方面基本依靠摄像头以及名为Ai Mic的双麦克风阵列,同时以信任灯指示表示工作状态。

而前面提到,Ai Pin的一大特色是可以实时使用AI功能,这就意味着Ai Pin其实是在无间断地采集外界信息,使用者却不一定实时知晓。

这种涉及隐私的行为其实还是非常可怕的,在AI缺乏监管的情况下,Ai Pin的一些功能值得讨论。

值得一提的是,将AI融入硬件的方式,手机厂商们也在探索。

包括三星将在S24上加入AI功能,可实现语音实时翻译。

包括小米、vivo在内,都已经在自家发布会上展示了系统融合大模型的最新成果。

就消费者来说,通过手机上手AI模型的门槛更低,Ai Pin看似简化了学习步骤,其实也提高了上手门槛。

Ai Pin,早有中国公司做出来了

抛去AI功能,Ai Pin其实就是一款便携式的激光投影仪。

早在2016年,一家名为一数科技的中国公司就在美国拉斯维加斯正式发布全球首款可穿戴投影产品—— Cast One。

据介绍,这是世界上正式面世的第一款投影可穿戴产品,采用全球最小的镭射激光投影仪模组,可在手背上、桌面上、墙上等区域形成“屏幕”

有趣的是,这款激光投影仪被做成了手表的形式,内置Android系统,可以支持查看时间和天气,支持许多软件应用。

最重要的是,Cast One同样支持手势切换。

除了没有内置AI模型,以及不可拆卸以外,Cast One基本就是Ai Pin的“祖先”。

只可惜,Cast One很快就在可穿戴市场销声匿迹,而一数科技也转型其他赛道。

当然,市场的变化瞬息万变,在AI的加持下,Ai Pin或许真的可以带领可穿戴硬件的新潮流

但在这之前,Ai Pin取代手机的说法还是过于夸张。

至少这第一代产品,还得再观望一阵。

]]>
https://www.im2maker.com/news/20231110/wqtuusj7rgwovjck.html/feed 0
不做大模型的AI芯片,清华大学“ACCEL”有何不同? https://www.im2maker.com/news/20231109/jivojnqihsywbget.html https://www.im2maker.com/news/20231109/jivojnqihsywbget.html#respond Thu, 09 Nov 2023 10:35:58 +0000 https://www.im2maker.com/?p=86696

提及人工智能AI相关的算力芯片,现在绝大多数人的第一反应都是英伟达NVIDIA的GPU,作为AI模型搭建的基础,英伟达的A100/H100几乎成为了一块块“金砖”,深受业界喜爱。

然而,一方面,外部管制在上月又一次收紧,国内人工智能行业很难再获取高端算力的支持;另一方面,以GPU为首的传统数字逻辑电路芯片在处理复杂的人工智能算法时,也存在速度有限、功耗较大的困境。

面对这一挑战,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种全新的计算架构——“全模拟光电智能计算芯片”(ACCEL)。

这颗芯片的理论算力性能可以达到目前高性能商用芯片的3000余倍,成果发表在了《自然》杂志上。

用光计算,更迅速

今年10月的2023诺贝尔物理学奖,授予了阿秒激光技术,光速作为人类已知的宇宙中最快速度拥有着很多独特的特性,在物理学中有很多应用。

“如何用光做计算”是业界、学界的重要课题之一。

根据清华大学发表的项目论文所述,“全模拟光电计算芯片”(all-analog chip combining electronic and light computing,ACCEL)主要是针对人工智能领域计算机视觉相关任务的芯片。

传统的计算机视觉处理方案,是外界光线投射到如相机CMOS这样的芯片上,经过光电转换后输出的数字电信号,再加以处理。

而ACCEL的处理方式完全不同,其输入的图像并非是一个以数字形式存在的“图片”,而是物理意义上的“光”,相当于给计算机加了一双人眼,而非摄像头

(图源:清华大学)

输入的图像从光学计算部分(optical analog computing,OAC)进入,经过数据压缩处理之后,投射到光电二极管阵列上(论文中称为电子模拟计算electronic analog computing,EAC),EAC通过OAC反馈的信息产生相应的输出,表现为“有或无”的“1或0”,从而实现从模拟信号到数字信号的转变,达成结果。

从技术层面看,光线在OAC部分仅仅是照射通过了一块类似光刻机掩膜版的组件,就完成了信号压缩和处理,省略了光信号到电信号的转换,理论上没有功耗,而且处理速度为光速。加上后续EAC的信号转换输出一共需要约4.4nJ能量和2ns时间,即可实现一次计算。

由于光子的高速特性,在处理信息时具有极高的速度和效率,同时功耗很低。根据论文提供的实验数据,在相同计算精度下以串行方式处理图像时,ACCEL在实验中实现了每帧72纳秒的计算延迟和每帧4.38纳焦耳的能耗,远小于英伟达A100 GPU的每帧0.26毫秒延迟和每帧18.5毫焦能耗数据。

(图源:《自然》)

ACCEL的等效算力4600TOP/s能效比74800TOP/s/W是英伟达A100 GPU的3000倍以上

摩尔定律已致极限

传统的集成电路技术进步在近些年开始逐步陷入瓶颈。影响了半导体行业半个多世纪的“摩尔定律”已经逐渐放缓,甚至有些失效的预兆。从近两年消费电子领域的困境可以窥见一二。

(图源:Freeimages)

近几年,手机、PC类处理器的性能提升速度已经放缓,现今最为先进的3nm工艺产量与良率都面临困境,即便是已经发布的产品,性能提升也比较有限,并且,随着晶体管尺寸一再逼近物理极限,密度大增的芯片带来了功耗与发热的双重考验。

用光替代电作为信息传输的新载体,是其中一条探索道路。

清华大学此次发布的这颗ACCEL只是一颗32×32阵列的小型芯片,工艺上用的是可以称之为“落后”的180nm工艺,更多是为了概念验证。如果换用相对成熟的28nm,甚至是7nm这样的先进工艺,都有望实现更高的处理速度,以及更大的神经网络以支持更复杂的任务。

另一方面,传统的集成电路芯片处理AI这样的复杂任务时,除了需要芯片本身的算力以外,还需要配合存储器来实现数据存取,比如现在的GPU一般都会搭配高带宽的HBM内存,这会造成能量的极大消耗。

清华大学电子工程系副教授方璐表示:除算力优势外,在智能视觉目标识别任务和无人系统(如自动驾驶)场景计算中,ACCEL的系统级能效(单位能量可进行的运算数)经实测是现有高性能芯片的400万余倍,这一超低功耗的优势将有助于改善限制芯片集成的芯片发热问题,有望为未来芯片设计带来突破。

有什么用?

恰如前文所说,ACCEL主要是针对人工智能领域计算机视觉相关任务的芯片,应用场景也是集中在如图像识别、高通量筛选、自动驾驶等。尤其在自动驾驶这种需要低延迟和低功耗的应用中可能会有优秀的表现。

在终端上,主要应用可能会是超低功耗的生物识别等等。

必须说明的是,ACCEL对目前发展火热的“大模型”训练几乎没有帮助,无法取代通用AI算力芯片。

但伴随着AI芯片竞争日趋激烈,如Intel、AMD、微软、谷歌等厂商都在积极布局,清华大学的研究者们也在努力将光电芯片向着通用计算应用的方向发展,算是为国产AI算力芯片的设计提供了一个新思路。

本文作者:Visssom,观点仅代表个人,题图源:清华大学

]]>
https://www.im2maker.com/news/20231109/jivojnqihsywbget.html/feed 0