当「快递小哥」用上AIGC:垂域大模型如何撬动生产力?| 专访顺丰科技

jh 3周前 (09-11)

在经过一系列调优,并做到成本和效果的平衡后,丰语大模型最终正式发布。

历经一年多时间的狂飙,以ChatGPT为代表的大语言模型(Large Language Model,LLM)在能力上已经无限逼近人类智能,各项“花活”无所不能。

但对于大多数普通用户来说,他们使用ChatGPT的场景仍局限在“闲聊”,并没有融入进日常生活中。

我们可以从ChatGPT网站月访问量以及月活跃率(MAR)等关键数据里观察到几个趋势:据研究机构统计,在ChatGPT月活跃用户不断增长的前提下,网站的月访问量在近期出现了明显下滑,而月活跃率更是与常见的超级应用差距甚远。这说明ChatGPT的用户粘性还有很大的提升空间。

不仅是ChatGPT,在行业火热表象之下,各种大模型产品已经开始让人感到“视觉疲劳”——人们已经不再惊叹于大模型的参数规模,而是好奇这些无所不能的大模型产品究竟能解决哪些实质性的问题。

对于企业来说,这个问题更是值得深思。

在9月8日开幕的第五届深圳国际人工智能展(GAIE)上,有近百家人工智能领域的顶尖企业参加本次展会,涵盖大模型、AI芯片、AI软件等多个领域,而参展的大模型厂商们都在产品上释放出一个共识点:大模型转化为生产力的关键,在于垂域领域

作为物流行业数智化转型与实践的领跑企业,顺丰科技在本届深圳国际人工智能展上发布了“丰语大语言模型”,该模型在垂直领域的表现上优于GPT-4o、Gemini 1.5 Pro等最领先的商用模型5%以上。

开幕式结束后,镁客网与顺丰科技AIoT领域副总裁宋翔、大模型技术总监江生沛进行了一次深度对话。围绕着顺丰科技在探索大模型落地上思考与探索,两位嘉宾多次提到垂域能力的重要性。

物流大模型,长什么样?

据顺丰控股公布的2023年财报,目前顺丰大约有15万名在职员工以及数量庞大的基层小哥。在2023年,共有119.7亿票件通过业务员送到了天南海北的用户手里,这当中还不包括国际货运、代理以及供应链快递。

如此庞大的快递量,在中国大地上构建起惊人的物流体系,人们已经习惯了顺丰“第一天下单,第二天收货”的模式。

那么如何让几十万基层员工有条不紊地工作,除了要求企业有极强的管理能力以外,科技穿针引线的作用同样重要。

从顺丰的角度来讲,顺丰在科技板块的投入一直处在高位。尤其在数智化的探索上,顺丰科技一直走在行业前列。

可即使有科技的加持,由于人员整体素质水平层次不齐,并不是每位基层员工都有丰富的行业经验掌握这些技术。

宋翔指出:“行业的知识与经验碎片化,散布在规章制度和信息系统里。而物流行业作为服务业,从业人员的知识和经验会直接影响服务质量和运营效率。

那么如果能降低不同岗位的员工对知识进行理解、推理并转化的难度,自然可以大幅提高工作效率。

而大模型的出现,从技术端帮助人深入参与到AI任务中,同时降低了AI的使用门槛,对于不同岗位的人来说都能轻松上手。

据宋翔介绍,丰语大模型主要有三大特点

1、首先是性能与效果。对比通用模型或是商业模型,丰语大模型在物流场景上实现了全面超越,并且模型参数量仅有7B,属于当下流行的“小模型”,这得益于大量的垂域知识的注入。

2、其次是计算成本。除了效果好以外,丰语大模型充分考虑了物流行业的实际情况,实现了效果与使用成本的均衡,做到了让每个业务都用得起大模型,并进行赋能,成本上实现了可控。

3、最后是业务价值。目前丰语大模型已经在市场营销、客服、收派、国际关务等二十多个业务场景中得到了广泛应用,真正做到嵌入各个环节中并发挥出效益。


图 | 丰语大语言模型通用能力测评对比

从发布会上展示的AIGC应用全景图来看,丰语大模型可以进行知识问答、总结摘要、指导问题、自动生成结构化规则、以及办公提效等多项功能,基本覆盖了物流行业大部分工作需求。

宋翔告诉镁客网,丰语大模型最终的落脚点在“知识和推理”。它处理的是文字、语音、图片和视频等非结构化数据,目的是帮助每个不同岗位的人成为经验丰富的岗位专家。

例如,它能告诉你某个物品能不能运往海外、有哪些要求,汇总分析全网客户反馈了哪些未被满足的共性需求等。”

值得一提的是,物流行业对大模型的准确性和可靠性的要求很高,当通用大模型遇到物流专业知识时,数据的缺少往往会造成严重的幻觉问题。

对此江生沛表示,丰语大模型在物流垂域意图分类上可以做到99%以上的准确率。除了垂域外,丰语大模型针对通用能力也做了针对性的优化,即使和通用大模型比较通用能力,丰语大模型也能持平,甚至在一些数据集上效果更优。


图 | 丰语大语言模型物流垂域能力测评对比

垂域大模型,如何降本增效

通用大模型在垂类领域的数据样本量较少、数据分布不均、导致大模型在部分专业领域输出的精度并不高。

这样的结果除了会影响准确性以外,关键还会影响“生产力”这个关键维度——如果大模型产品不能解决降本、投产比等实质性的问题,那么企业用户很难为其买单

相比之下,行业大模型从垂域应用出发,其需要处理的问题比较单一、可以更加聚焦在特定场景上,为实际业务服务。

更好的业务产出才能促使更多的技术投入,形成正向的循环。顺丰是一个强调实现价值的公司,降本增效是丰语大模型落地的核心导向。”江生沛告诉镁客网。

正如前文所说,目前丰语大模型应用在实际业务价值上已经得到了有效的验证。

宋翔向镁客网列出几个案例:比如当销售、快递员使用大模型推荐产品与服务后,已实现增收数千万元;比如通过大模型优化国内&国际收寄标准、扩大可收寄口径时光,目前转化增收数千万元;再比如多模态审核用于电商退货一张图下单等业务时,已实现增收上亿元。

这些都是实实在在的增收。

至于提效方面,丰语大模型所构建的丰语摘要、丰语知道、丰语助理等产品,极大提高了全网各岗位人员获取知识、加工信息的能力,并带来非常显著的效率提升。

在此基础上,江生沛透露,顺丰科技未来计划大力推动Agent(智能体)在集团内部的应用,面向特定岗位工作流程深化AI应用

江生沛表示,随着更加全能的数字员工加入,集团的运营效率将进一步提升。

值得一提的是,大模型庞大参数的背后,也是对算力等资源的额外消耗。当前期投资成本很高时,往往需要足够的回报才能支撑大模型的持续运营。相比之下,像丰语大模型这种专注垂域应用的“小模型”,可以保证模型性能的前提下,降低前期投入门槛,而这同样也算是降本的方式之一。

在发布会上,宋翔表示,希望将丰语大模型的技术应用到更多领域,同时表示愿意将丰语大模型的成果分享给更多物流行业企业,以此促进行业的共同进步

结语:顺丰对于大模型的思考

物流行业是经济运行的“晴雨表”。身为该行业数智化转型与实践的佼佼者,顺丰科技推动智慧物流的脚步从未放缓。

就丰语大模型来说,其发布的时间节点并不算太早。但当“百模大战”的潮水退去,AI行业逐渐进入理智期,牌桌上剩下的大模型玩家们开始更加注重“实用主义”后,丰语大模型在垂域的表现更值得关注

宋翔告诉镁客网,顺丰科技其实很早就在布局大模型应用,前期主要从业务需求出发,采用商用大模型和开源大模型解决实际业务问题。在此基础上,持续积累高质量的用户反馈数据、提炼功能特性与应用范式,为垂直领域大模型的发布做好数据与能力上的准备。

在ChatGPT横空出世的时候,我们没有盲目跟风,而是在仔细思考,如何让每一个业务、每一个人都能用得起、用得好大模型,我们应该怎么布局大模型整体的战略。

在经过一系列调优,并做到成本和效果的平衡后,丰语大模型最终正式发布。在未来,顺丰科技也会继续将最好的、有落地效果的行业实践经验与感受分享给整个行业,为其他物流企业带来实实在在的参考与借鉴,更好地为整个物流行业服务。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到