「不完美」的百度文心一言，背水一战

jh 2年前 (2023-03-17)

国产ChatGPT应用，仍待市场检验。

大概百度CEO李彦宏自己也没有想到，GPT-4会突然“抢跑”。

因此在今日下午的文心一言发布会现场，李彦宏的话语之间少了些从容，多了几分紧张，开场白中也多次提及GPT-4。

在随后的展示环节中，李彦宏亲自展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解以及多模态生成。

不过由于现场采用录播的形式进行演示，因此不少观众对评论中纷纷表达出失望。

而资本市场更是直接用股价“表达”不满，在李彦宏台上讲话的同时，百度股价在港股市场上直接跳水，一度暴跌10%。

那么文心一言真的如网友所评价的一样“不堪”吗？

中国版ChatGPT，能力如何？

“十月怀胎，一朝分娩”。

每个人都在期待这个预热多时的AI大模型文心一言长什么样？

在进行简单的开场白后，李彦宏直接展示了文心一言的五大能力：

· 文学创作

在这一环节，李彦宏拿出了知名科幻小说《三体》和文心一言进行了六轮对话，主要体现文心一言所具有的总结能力、推理能力等等。

作为大模型的最基本能力，文心一言采用了5500亿知识图谱的事实的训练数据，来保证事实性问题回答准确。

从回答来看，文心一言的准确性相当不错。

“不完美”的百度文心一言，是否还有惊喜？

· 商业文案创作

李彦宏以一家科技服务创业公司为例，要求文心一言从取名、Slogan等方面提出建议。

文心一言表现出的能力也符合预期，还为生成的5个公司名称进行了解释。

“不完美”的百度文心一言，是否还有惊喜？

· 数理逻辑推算

用大模型做题，是ChatGPT的亮点之一，文心一言也具备这一能力。

这一环节，李彦宏提出了“鸡兔同笼”这一中国古代典型数学题。

一开始，题目中给出一个错误的数据，文心一言及时给出了提示。

在修改数据后，文心一言不仅给出了正确答案，同时也给出了解题步骤。

“不完美”的百度文心一言，是否还有惊喜？

· 中文理解

毫无疑问，这是国产大模型与英文大模型最大的区别之一。

据李彦宏表示，文心一言使用了大量中文数据集来进行训练。

在现场展示的有关“洛阳纸贵”的一系列问题时，文心一言合理解释了这个带有内涵的成语，同时秀了一首藏头诗。

不过李彦宏也坦言，文心一言在处理英文问题时还存在差距，部分原因是因为在训练数据样本还不够大。

由此可见，文心一言还是更贴近中文语境。

“不完美”的百度文心一言，是否还有惊喜？

· 多模态生成

对比上一代产品，GPT-4最大的特点是支持多模态生成。而这一次，文心一言也展示了自身多模态生成能力。

在现场，文心一言现场秀了一段四川话，还展示了一段文字转视频的能力。

“不完美”的百度文心一言，是否还有惊喜？

有趣的是，李彦宏在展示这一环节时，百度的股价一度有回升的态势，但李彦宏随后表示视频暂时还没有对外开放后，上涨的势头突然就被“扑灭”……

从上述五大能力来看，文心一言已经具备了ChatGPT拥有的能力，甚至在“鸡兔同笼”、“洛阳纸贵”等表现上更胜一筹。

但奈何GPT-4直接降维打击，冲击感更大，能力也更强。

当文心一言抛出这些“新功能”时，很难再称得上是一种惊喜。

“不完美”的文心一言，没有退路

在发布会上，李彦宏提出一个问题，百度是不是真的Ready了？

这一问题上，李彦宏并没有给出直接答复，而是从侧面指出，百度是全球大厂中第一个发布对标ChatGPT的产品，甚至超过了微软和谷歌（注：李彦宏指出，微软是直接调用GPT）。

同时他指出，选择于此时发布，主要是基于市场需求。

众所周知，随着GPT-4的震撼发布，OpenAI在产品力上又向前迈进一步，这对于国内厂商来说并不是什么好消息。

目前国内追赶OpenAI的阵营中，百度在大模型上的研发投入属于第一梯队，从发布会上的演示来看，文心一言的表现其实表现的非常出色，在多个环节表示完全不输ChatGPT。

但众所周知，发布多时的ChatGPT是基于GPT-3.5架构开发，而GPT-4已经是新一代的升级版本。

随着GPT-4以狂飙之势涌入主流视野，百度的进度一瞬间就被甩开了一大截。

作为百度的带路人，李彦宏自然深知行业的一举一动，如果此时再不上马“文心一言”，后面的压力可想而言。

因此在进退两难面前，李彦宏还是选择迎头直面OpenAI。

或许文心一言的demo演示或多或少让人感到失望，但当下目前最重要的任务还是抢占市场还是。

值得一提的是，在百度 CTO 王海峰上台分享了背后的技术与百度多年的技术积累后，百度的股价再次“抬头”。

“不完美”的百度文心一言，是否还有惊喜？

多年沉淀，文心一言仍有机会颠覆

不可否认的是，文心一言在一些细节上仍显得不足，李彦宏也正视了文心一言与顶尖模型GPT-4的差距。

不过，中文大模型与英文大模型从背后逻辑来看存在差异。多数业内人士指出，中文与英文的互联网环境互相不同，训练的难度也有所不同。

即便是ChatGPT，在一些中文问题上也会有水土不服的现象，例如“藏头诗”，GPT-4就很难理解。

而这一点，在中文环境中沉淀多时的文心一言就表现的更好。

事实上，文心一言并不是一个新事物，该大模型从2019年诞生的预训练模型ERNIE1.0开始，历经多年的迭代，最终构成了如今的文心大模型。

而在发布会上，王海峰也介绍道，文心一言是新一代知识增强大语言模型，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

“不完美”的百度文心一言，是否还有惊喜？

换句话说，文心一言更像是百度多年以来AI能力的大合集。

除了AI对话以外，文心大模型涉及的应用非常多，包括搜索、智能云、自动驾驶、绘画等多个领域。涉及的行业也涵盖了金融、能源、媒体、政务等千行百业。另外在会上，百度表示已有超过650家企业宣布接入文心一言生态。

因此，在实际应用面前，文心一言的商业能力还是远超其他公司。这也验证了李彦宏所说的：“此时发布，主要是基于市场需求。”

随着后期越来越多的用户接入文心一言，该大模型的能力也会不断提升。

最后，记得关注微信公众号：镁客网（im2maker），更多干货在等你！

镁客网

科技 | 人文 | 行业

微信ID：im2maker

长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

「不完美」的百度文心一言，背水一战

中国版ChatGPT，能力如何？

“不完美”的文心一言，没有退路

多年沉淀，文心一言仍有机会颠覆

最新文章

注册

「不完美」的百度文心一言，背水一战

中国版ChatGPT，能力如何？

“不完美”的文心一言，没有退路

多年沉淀，文心一言仍有机会颠覆

最新文章

登录

注册