「不完美」的百度文心一言,背水一战

jh 12个月前 (03-17)

国产ChatGPT应用,仍待市场检验。

大概百度CEO李彦宏自己也没有想到,GPT-4会突然“抢跑”。

因此在今日下午的文心一言发布会现场,李彦宏的话语之间少了些从容,多了几分紧张,开场白中也多次提及GPT-4。

在随后的展示环节中,李彦宏亲自展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解以及多模态生成

不过由于现场采用录播的形式进行演示,因此不少观众对评论中纷纷表达出失望。

资本市场更是直接用股价“表达”不满,在李彦宏台上讲话的同时,百度股价在港股市场上直接跳水,一度暴跌10%。

那么文心一言真的如网友所评价的一样“不堪”吗?

中国版ChatGPT,能力如何?

十月怀胎,一朝分娩”。

每个人都在期待这个预热多时的AI大模型文心一言长什么样?

在进行简单的开场白后,李彦宏直接展示了文心一言的五大能力:

· 文学创作

在这一环节,李彦宏拿出了知名科幻小说《三体》和文心一言进行了六轮对话,主要体现文心一言所具有的总结能力、推理能力等等。

作为大模型的最基本能力,文心一言采用了5500亿知识图谱的事实的训练数据,来保证事实性问题回答准确。

从回答来看,文心一言的准确性相当不错。

“不完美”的百度文心一言,是否还有惊喜?

· 商业文案创作

李彦宏以一家科技服务创业公司为例,要求文心一言从取名、Slogan等方面提出建议。

文心一言表现出的能力也符合预期,还为生成的5个公司名称进行了解释。

“不完美”的百度文心一言,是否还有惊喜?

· 数理逻辑推算

用大模型做题,是ChatGPT的亮点之一,文心一言也具备这一能力。

这一环节,李彦宏提出了“鸡兔同笼”这一中国古代典型数学题。

一开始,题目中给出一个错误的数据,文心一言及时给出了提示。

在修改数据后,文心一言不仅给出了正确答案,同时也给出了解题步骤。

“不完美”的百度文心一言,是否还有惊喜?

· 中文理解

毫无疑问,这是国产大模型与英文大模型最大的区别之一。

据李彦宏表示,文心一言使用了大量中文数据集来进行训练。

在现场展示的有关“洛阳纸贵”的一系列问题时,文心一言合理解释了这个带有内涵的成语,同时秀了一首藏头诗。

不过李彦宏也坦言,文心一言在处理英文问题时还存在差距,部分原因是因为在训练数据样本还不够大。

由此可见,文心一言还是更贴近中文语境。

“不完美”的百度文心一言,是否还有惊喜?

· 多模态生成

对比上一代产品,GPT-4最大的特点是支持多模态生成。而这一次,文心一言也展示了自身多模态生成能力。

在现场,文心一言现场秀了一段四川话,还展示了一段文字转视频的能力。

“不完美”的百度文心一言,是否还有惊喜?

有趣的是,李彦宏在展示这一环节时,百度的股价一度有回升的态势,但李彦宏随后表示视频暂时还没有对外开放后,上涨的势头突然就被“扑灭”……

从上述五大能力来看,文心一言已经具备了ChatGPT拥有的能力,甚至在“鸡兔同笼”、“洛阳纸贵”等表现上更胜一筹。

但奈何GPT-4直接降维打击,冲击感更大,能力也更强。

当文心一言抛出这些“新功能”时,很难再称得上是一种惊喜。

“不完美”的文心一言,没有退路

在发布会上,李彦宏提出一个问题,百度是不是真的Ready了

这一问题上,李彦宏并没有给出直接答复,而是从侧面指出,百度是全球大厂中第一个发布对标ChatGPT的产品,甚至超过了微软和谷歌(注:李彦宏指出,微软是直接调用GPT)。

同时他指出,选择于此时发布,主要是基于市场需求

众所周知,随着GPT-4的震撼发布,OpenAI在产品力上又向前迈进一步,这对于国内厂商来说并不是什么好消息。

目前国内追赶OpenAI的阵营中,百度在大模型上的研发投入属于第一梯队,从发布会上的演示来看,文心一言的表现其实表现的非常出色,在多个环节表示完全不输ChatGPT。

但众所周知,发布多时的ChatGPT是基于GPT-3.5架构开发,而GPT-4已经是新一代的升级版本。

随着GPT-4以狂飙之势涌入主流视野,百度的进度一瞬间就被甩开了一大截。

作为百度的带路人,李彦宏自然深知行业的一举一动,如果此时再不上马“文心一言”,后面的压力可想而言。

因此在进退两难面前,李彦宏还是选择迎头直面OpenAI。

或许文心一言的demo演示或多或少让人感到失望,但当下目前最重要的任务还是抢占市场还是。

值得一提的是,在百度 CTO 王海峰上台分享了背后的技术与百度多年的技术积累后,百度的股价再次“抬头”。

“不完美”的百度文心一言,是否还有惊喜?

多年沉淀,文心一言仍有机会颠覆

不可否认的是,文心一言在一些细节上仍显得不足,李彦宏也正视了文心一言与顶尖模型GPT-4的差距。

不过,中文大模型与英文大模型从背后逻辑来看存在差异。多数业内人士指出,中文与英文的互联网环境互相不同,训练的难度也有所不同。

即便是ChatGPT,在一些中文问题上也会有水土不服的现象,例如“藏头诗”,GPT-4就很难理解。

而这一点,在中文环境中沉淀多时的文心一言就表现的更好。

事实上,文心一言并不是一个新事物,该大模型从2019年诞生的预训练模型ERNIE1.0开始,历经多年的迭代,最终构成了如今的文心大模型。

而在发布会上,王海峰也介绍道,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

“不完美”的百度文心一言,是否还有惊喜?

换句话说,文心一言更像是百度多年以来AI能力的大合集

除了AI对话以外,文心大模型涉及的应用非常多,包括搜索、智能云、自动驾驶、绘画等多个领域。涉及的行业也涵盖了金融、能源、媒体、政务等千行百业。另外在会上,百度表示已有超过650家企业宣布接入文心一言生态

因此,在实际应用面前,文心一言的商业能力还是远超其他公司。这也验证了李彦宏所说的:“此时发布,主要是基于市场需求。”

随着后期越来越多的用户接入文心一言,该大模型的能力也会不断提升。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到