微软 AI 部门推出首款内部模型

jh 5天前

当地时间本周四,微软旗下人工智能研究机构微软AI(Microsoft AI,简称MAI)宣布推出其首款全自研AI模型组合——MA...

当地时间本周四,微软旗下人工智能研究机构微软AI(Microsoft AI,简称MAI)宣布推出其首款全自研AI模型组合——MAI-Voice-1语音生成模型与MAI-1-preview通用指令模型。

尽管作为技术突破的起点,这两款模型在功能完整性与应用成熟度上尚与OpenAI的旗舰产品存在差距,但其发布标志着微软在核心AI技术领域迈出关键自主化步伐,也标志着这家科技巨头正加速构建不依赖外部技术支撑的AI能力体系。

微软官方披露,其全新研发的MAI-Voice-1语音模型通过架构创新,实现了"单卡GPU秒级成音"的突破性进展——仅需1秒即可生成长达1分钟的高保真语音内容。这一技术跨越将传统语音合成的渲染时长压缩了三个数量级,标志着实时语音生成时代正式来临。目前该模型已规模化部署于两大核心场景:一是为Copilot Daily提供AI新闻主播服务,实现新闻资讯的7×24小时自动化播报;二是构建交互式播客生产系统,通过对话式AI解析科技、商业等专业领域内容。用户现可通过Copilot Labs平台体验个性化语音定制服务,自由调节语速、音色、情感参数,甚至模拟特定人物的讲话风格。

同步亮相的MAI-1-preview模型则展现出惊人的算力规模,其训练基于由15,000张NVIDIA H100 GPU组成的超级计算集群。借助H100芯片特有的Transformer Engine引擎和FP8高精度计算支持,该模型的训练效率达到传统方案的30倍以上。这种史无前例的算力投入并非偶然——微软今年已累计采购超过30万枚H100芯片,其数据中心GPU总量直逼百万级规模。

业内人士指出,如此规模的算力部署不仅为模型性能提供硬核保障,更从侧面印证了微软全面押注消费级AI市场的战略决心。

目前,MAI-1-preview已登陆AI基准评测平台LMarena开启公测。该平台采用独特的"用户投票+指标评分"复合评价机制,虽因被质疑存在头部厂商模型隐性加权的问题引发争议,但仍被视为衡量模型综合能力的行业风向标。

值得注意的是,微软选择在此节点启动公测,恰逢其加速摆脱技术依赖的关键窗口期。此次双模型联袂发布,标志着微软正式吹响"去OpenAI化"战略号角。

过去三年间,Copilot系列产品对OpenAI技术的深度依赖导致运营成本居高不下——据知情人士透露,仅Copilot单日运行成本就突破500万美元,其中模型推理支出占比超过60%。这种被动局面促使微软加速技术自主进程,通过构建端到端的AI能力闭环重构成本结构。

微软AI掌门人Mustafa Suleyman在近期访谈中重申:"我们的技术路线图始终围绕消费者需求展开。"正如其技术白皮书所披露,MAI系列模型的核心训练数据中,消费端信号占比已达82%,远高于行业平均平的45%。

未来微软计划将 MAI-1-preview 逐步应用于 Copilot 助手的特定文本场景,与现有 OpenAI 模型形成互补。这种多模型协调策略符合 AI 行业专业化细分趋势 —— 不同场景由专用模型各司其职,而非依赖单一通用模型。正如微软在博客中所言:"通过协调多种服务于不同用户意图和场景的专用模型,将释放出巨大的价值。"​

业内分析认为,微软自研模型的落地将重塑 AI 行业竞争格局。一方面,H100 GPU 集群支撑的高效训练能力,使微软具备快速迭代模型的技术基础;另一方面,消费场景的深度优化让 AI 技术更贴近普通用户需求。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到