当「快递小哥」用上AIGC：垂域大模型如何撬动生产力？| 专访顺丰科技

jh 1年前 (2024-09-11)

在经过一系列调优，并做到成本和效果的平衡后，丰语大模型最终正式发布。

历经一年多时间的狂飙，以ChatGPT为代表的大语言模型（Large Language Model，LLM）在能力上已经无限逼近人类智能，各项“花活”无所不能。

但对于大多数普通用户来说，他们使用ChatGPT的场景仍局限在“闲聊”，并没有融入进日常生活中。

我们可以从ChatGPT网站月访问量以及月活跃率（MAR）等关键数据里观察到几个趋势：据研究机构统计，在ChatGPT月活跃用户不断增长的前提下，网站的月访问量在近期出现了明显下滑，而月活跃率更是与常见的超级应用差距甚远。这说明ChatGPT的用户粘性还有很大的提升空间。

不仅是ChatGPT，在行业火热表象之下，各种大模型产品已经开始让人感到“视觉疲劳”——人们已经不再惊叹于大模型的参数规模，而是好奇这些无所不能的大模型产品究竟能解决哪些实质性的问题。

对于企业来说，这个问题更是值得深思。

在9月8日开幕的第五届深圳国际人工智能展（GAIE）上，有近百家人工智能领域的顶尖企业参加本次展会，涵盖大模型、AI芯片、AI软件等多个领域，而参展的大模型厂商们都在产品上释放出一个共识点：大模型转化为生产力的关键，在于垂域领域。

作为物流行业数智化转型与实践的领跑企业，顺丰科技在本届深圳国际人工智能展上发布了“丰语大语言模型”，该模型在垂直领域的表现上优于GPT-4o、Gemini 1.5 Pro等最领先的商用模型5%以上。

开幕式结束后，镁客网与顺丰科技AIoT领域副总裁宋翔、大模型技术总监江生沛进行了一次深度对话。围绕着顺丰科技在探索大模型落地上思考与探索，两位嘉宾多次提到垂域能力的重要性。

物流大模型，长什么样？

据顺丰控股公布的2023年财报，目前顺丰大约有15万名在职员工以及数量庞大的基层小哥。在2023年，共有119.7亿票件通过业务员送到了天南海北的用户手里，这当中还不包括国际货运、代理以及供应链快递。

如此庞大的快递量，在中国大地上构建起惊人的物流体系，人们已经习惯了顺丰“第一天下单，第二天收货”的模式。

那么如何让几十万基层员工有条不紊地工作，除了要求企业有极强的管理能力以外，科技穿针引线的作用同样重要。

从顺丰的角度来讲，顺丰在科技板块的投入一直处在高位。尤其在数智化的探索上，顺丰科技一直走在行业前列。

可即使有科技的加持，由于人员整体素质水平层次不齐，并不是每位基层员工都有丰富的行业经验掌握这些技术。

宋翔指出：“行业的知识与经验碎片化，散布在规章制度和信息系统里。而物流行业作为服务业，从业人员的知识和经验会直接影响服务质量和运营效率。”

那么如果能降低不同岗位的员工对知识进行理解、推理并转化的难度，自然可以大幅提高工作效率。

而大模型的出现，从技术端帮助人深入参与到AI任务中，同时降低了AI的使用门槛，对于不同岗位的人来说都能轻松上手。

据宋翔介绍，丰语大模型主要有三大特点：

1、首先是性能与效果。对比通用模型或是商业模型，丰语大模型在物流场景上实现了全面超越，并且模型参数量仅有7B，属于当下流行的“小模型”，这得益于大量的垂域知识的注入。

2、其次是计算成本。除了效果好以外，丰语大模型充分考虑了物流行业的实际情况，实现了效果与使用成本的均衡，做到了让每个业务都用得起大模型，并进行赋能，成本上实现了可控。

3、最后是业务价值。目前丰语大模型已经在市场营销、客服、收派、国际关务等二十多个业务场景中得到了广泛应用，真正做到嵌入各个环节中并发挥出效益。

图 | 丰语大语言模型通用能力测评对比

从发布会上展示的AIGC应用全景图来看，丰语大模型可以进行知识问答、总结摘要、指导问题、自动生成结构化规则、以及办公提效等多项功能，基本覆盖了物流行业大部分工作需求。

宋翔告诉镁客网，丰语大模型最终的落脚点在“知识和推理”。它处理的是文字、语音、图片和视频等非结构化数据，目的是帮助每个不同岗位的人成为经验丰富的岗位专家。

“例如，它能告诉你某个物品能不能运往海外、有哪些要求，汇总分析全网客户反馈了哪些未被满足的共性需求等。”

值得一提的是，物流行业对大模型的准确性和可靠性的要求很高，当通用大模型遇到物流专业知识时，数据的缺少往往会造成严重的幻觉问题。

对此江生沛表示，丰语大模型在物流垂域意图分类上可以做到99%以上的准确率。除了垂域外，丰语大模型针对通用能力也做了针对性的优化，即使和通用大模型比较通用能力，丰语大模型也能持平，甚至在一些数据集上效果更优。

图 | 丰语大语言模型物流垂域能力测评对比

垂域大模型，如何降本增效

通用大模型在垂类领域的数据样本量较少、数据分布不均、导致大模型在部分专业领域输出的精度并不高。

这样的结果除了会影响准确性以外，关键还会影响“生产力”这个关键维度——如果大模型产品不能解决降本、投产比等实质性的问题，那么企业用户很难为其买单。

相比之下，行业大模型从垂域应用出发，其需要处理的问题比较单一、可以更加聚焦在特定场景上，为实际业务服务。

“更好的业务产出才能促使更多的技术投入，形成正向的循环。顺丰是一个强调实现价值的公司，降本增效是丰语大模型落地的核心导向。”江生沛告诉镁客网。

正如前文所说，目前丰语大模型应用在实际业务价值上已经得到了有效的验证。

宋翔向镁客网列出几个案例：比如当销售、快递员使用大模型推荐产品与服务后，已实现增收数千万元；比如通过大模型优化国内&国际收寄标准、扩大可收寄口径时光，目前转化增收数千万元；再比如多模态审核用于电商退货一张图下单等业务时，已实现增收上亿元。

“这些都是实实在在的增收。”

至于提效方面，丰语大模型所构建的丰语摘要、丰语知道、丰语助理等产品，极大提高了全网各岗位人员获取知识、加工信息的能力，并带来非常显著的效率提升。

在此基础上，江生沛透露，顺丰科技未来计划大力推动Agent（智能体）在集团内部的应用，面向特定岗位工作流程深化AI应用。

江生沛表示，随着更加全能的数字员工加入，集团的运营效率将进一步提升。

值得一提的是，大模型庞大参数的背后，也是对算力等资源的额外消耗。当前期投资成本很高时，往往需要足够的回报才能支撑大模型的持续运营。相比之下，像丰语大模型这种专注垂域应用的“小模型”，可以保证模型性能的前提下，降低前期投入门槛，而这同样也算是降本的方式之一。

在发布会上，宋翔表示，希望将丰语大模型的技术应用到更多领域，同时表示愿意将丰语大模型的成果分享给更多物流行业企业，以此促进行业的共同进步。

结语：顺丰对于大模型的思考

物流行业是经济运行的“晴雨表”。身为该行业数智化转型与实践的佼佼者，顺丰科技推动智慧物流的脚步从未放缓。

就丰语大模型来说，其发布的时间节点并不算太早。但当“百模大战”的潮水退去，AI行业逐渐进入理智期，牌桌上剩下的大模型玩家们开始更加注重“实用主义”后，丰语大模型在垂域的表现更值得关注。

宋翔告诉镁客网，顺丰科技其实很早就在布局大模型应用，前期主要从业务需求出发，采用商用大模型和开源大模型解决实际业务问题。在此基础上，持续积累高质量的用户反馈数据、提炼功能特性与应用范式，为垂直领域大模型的发布做好数据与能力上的准备。

“在ChatGPT横空出世的时候，我们没有盲目跟风，而是在仔细思考，如何让每一个业务、每一个人都能用得起、用得好大模型，我们应该怎么布局大模型整体的战略。”

在经过一系列调优，并做到成本和效果的平衡后，丰语大模型最终正式发布。在未来，顺丰科技也会继续将最好的、有落地效果的行业实践经验与感受分享给整个行业，为其他物流企业带来实实在在的参考与借鉴，更好地为整个物流行业服务。

最后，记得关注微信公众号：镁客网（im2maker），更多干货在等你！

镁客网

科技 | 人文 | 行业

微信ID：im2maker

长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

当「快递小哥」用上AIGC：垂域大模型如何撬动生产力？| 专访顺丰科技

物流大模型，长什么样？

垂域大模型，如何降本增效

结语：顺丰对于大模型的思考

最新文章

注册

当「快递小哥」用上AIGC：垂域大模型如何撬动生产力？| 专访顺丰科技

物流大模型，长什么样？

垂域大模型，如何降本增效

结语：顺丰对于大模型的思考

最新文章

登录

注册