[新闻] 破局产业化——AI大模型“新赛季”怎么玩?| 数博会官网

破局产业化——AI大模型“新赛季”怎么玩?

作者: 杨子怡    来源: 人民邮电报   编辑: 蔺弦弦  时间:2023-08-18 13:53:47  

  开源、免费、支持商用。这几个关键词成为当前大模型产业的焦点。

  7月19日凌晨,Meta宣布将大语言模型Llama2有条件地开源给商业使用(月活用户超过7亿需要单独申请)。此次Meta一共发布70亿、130亿和700亿三种参数规模的模型,业内人士称Llama2是任何人都可以拿到模型权重的最强大语言模型。

  8月7日,国产百亿参数高性能通用大模型XVERSE-13B也宣布开源,在多个测评中,其性能超越了Llama-2-13B。

  突然“杀出重围”的商用开源大模型,在业内产生了怎样的影响?“新赛季”到来,国内行业大模型拐点已出现?如何破局产业化形成大模型“中国派”?

  商用开源大模型

  “杀出重围”引轰动

  Llama2免费商用开源的消息一出便引起业内轰动。那么,这匹“黑马”会真如许多人期待的那样,将引发新一轮风潮?

  Meta称,开源是当今AI模型开发的正确途径,负责任的开放式创新将让每个人都能参与到AI的开发过程中,为AI带来更高的可靠度、信任度和可监督性。

  不过,Llama2虽然开源,但在其社区许可协议中,规定月活用户达7亿以上的使用者必须征得Meta的许可,而Meta将自行决定是否授权。

  对行业来说,Llama2带来的是关于技术进步和场景深入的思考。

  国内大模型新锐公司衔远科技市场负责人石晓锐向《人民邮电》报记者表示,Llama2的发布对于扎根领域创新创业的企业而言,挑战是如何在开源的框架中挖掘出自身更领先的垂直应用创新能力,并快速实现变现。“这也验证了大模型下一个趋势是垂类商业化、高价值场景的落地使用。”

  在国内,阿里云牵头发起的AI模型社区魔搭ModelScope,第一时间上架了Llama2系列模型。近日,百度智能云的千帆大模型的模型库也上线了Llama2系列模型。

  但据财联社消息,Meta首席执行官马克·扎克伯格在当地时间7月26日的业绩电话会上表示,Llama2是开放的,但除了将技术开源外,Meta还包含了一个条款,即主要云计算公司不会获得免费使用许可,它们必须与Meta达成商业协议。

  大模型开源将更有效地推动技术进步,其可信任度、可监督性将更有保障,未来大模型开源或成大趋势,Llama2只是一个开头。

  Llama2发布后仅两天,来自Stability AI和CarperAI lab的两个用于研究目的的开源大模型FreeWilly 1和Free-Willy 2发布,并在多项基准中超越GPT-3.5。据报道,Open AI也将布局开源大模型,未来即将开源的大模型代号为“G3PO”。

1_副本.jpg

Llama2规定月活用户达7亿以上的使用者需经Meta许可。

2_副本.jpg

魔搭社区上线Llama2系列模型。

  国内行业大模型拐点出现?

  反观国内,今年以来以“文心一言、通义千问”为代表的古书队,“盘古、轩辕、二郎神”等历史人物代表队和“GPT+各种”队展开了一轮轮的攻坚战。《中国人工智能大模型地图研究报告》显示,中国10亿级参数规模以上的大模型已发布了79个。

  跟随ChatGPT的脚步,通用大模型首先吸足了企业和投资者的目光。但不是所有通用大模型都能成为GPT。训练通用大模型,需要强大的算力和数据支持,以及资金和人才储备。

  行业大模型紧随其后。

  华为发布盘古矿山大模型,正式在能源领域商用。与此同时,京东医疗大模型、携程旅游大模型等也已上线试水。阿里云也在推动大模型在油气、电力、交通、金融等不同行业落地应用。腾讯上线行业大模型精选商店,提供涵盖模型训练/精调、智能应用开发等一站式解决方案等。互联网大厂正在积极推动大模型进入各行业注智赋能。

  石晓锐认为:“未来那些定义明确、高价值的工作流程将由专业AI模型完成。”

  运营商也正在利用其算网及客户优势布局行业大模型。

  中国移动大模型业务瞄准国民经济骨干行业及社会民生,包括通信、政务、客服、司法、医疗、能源、制造等。

  基于自研大模型底座,中国移动也于近期发布了九天·海算政务大模型和九天·客服大模型。之前,中国电信也发布大语言模型TeleChat,推出数据中台、智能政务及客服服务。

  中国移动集团级首席科学家、人工智能与智慧运营中心总经理冯俊兰在接受《人民邮电》报记者采访时表示,基础大模型最鲜明的特色是泛理解能力、生成多样性和知识无边界。而行业大模型是更为复杂、准确性要求更高、能够嵌入复杂生产系统、可自适应闭环升级的高强度密集型研发的大模型。“如果我们把基础模型看作大学通识教育,行业模型就是研究生加工作经验锤炼的专业训练。”

  冯俊兰还提到,行业大模型不是“外挂式”的大脑,而是以通用智能大模型为基础,利用行业场景的专业知识、专家经验和生产数据,以完成行业生产任务为目标,在高动态生产环境中不断自适应优化和持续学习,性能与结果达到行业标准的专用智能大模型。

3_副本.jpg

中国移动发布“九天”大模型。

  底座+原生应用

  形成大模型产业“中国派”?

  麦肯锡发布的2022年全球AI调查显示,只有9%的中国企业可借助AI实现10%以上的收入增长,而领先国家受访企业中有19%的公司能实现该增长,AI尚未帮助中国企业普遍实现大规模的营收增长与利润贡献。

  大模型如何顺利地嵌入企业,帮助其实现可观的增长?如何让大模型在数实融合中迎来更多创新?

  在采访中,业内人士向记者透露,在对接企业数字化转型需求的过程中,他们发现数据线上化以及数据结构化是一大难题。“其次是信息化产品的对接,企业现有的软件应用不是基于大模型开发的,如何与大模型打通,这涉及系统对接及架构对接的问题。”

  冯俊兰也持相似观点。她提到,以通信网智能化为例,在现有模式下,智能化技术以外挂模式嵌入生产流程中,通过局部的智能化来提升业务运行成效。“而在以大模型为内核的AI赋能模式中,企业系统架构、工作流程、用户体验、业务价值将被重新设计,这是从‘X+AI’向‘AI+X’的根本性变革。”

  未来的市场上或许只有几个通用大模型,而企业将以大模型为基础打造原生应用,这也将成为大模型能力的真正体现。

  除此之外,大模型产业化的算力、数据需求也引发业内人士担忧。

  石晓锐在接受《人民邮电》报记者采访时表示,大模型产业化面临数据规模大、质量参差不齐,模型的体积大、训练难度高,算力规模大、性能要求高等诸多挑战。商业模式方面,石晓锐提到,大模型的成本壁垒非常高,大公司和小企业都有各自的负担。“从端到端做起,慢慢迭代出更大的商业模型,或许是更适合的做法。”

  瑞莱智慧(RealAI)合伙人、高级副总裁朱萌也对《人民邮电》报记者提到,高质量训练数据集是决定大模型性能的关键因素,“我国拥有丰富的数据资源,但高质量的数据集目前占比过小,导致大模型训练的低质化、同质化,形成性能瓶颈”。她也提到,如何最大化利用好算力资源、尽可能降低企业成本,也是当前迫切需要解决的问题。

  以制造业数字化转型升级为入口,从打好大模型底座入手,深入理解用户需求,挖掘数据价值,以具体场景为切入口创造原生应用并进行快速迭代,这或将成为未来一个时期内大模型产业的发展路径。

  石晓锐认为:“应利用AI帮助垂类企业敏锐捕捉行业市场机遇、精准定位创新发展方向,垂直整合从自有基础大模型到应用、到终端用户的全场景闭环,以实现生成式AI与产业价值的‘双落地’。”

  据介绍,衔远科技正在研发具备通用能力的大模型,尤其在连接商品和消费者方面具备专长,通过预测消费者和商品在体验上的依存关系等,重新定义消费者在什么样的场景和体验下会被什么打动。

  “中国企业想必会设计出中国特色的大模型,如每个功能都做到更加自主可控,比如To B落地方面走在ChatGPT前面等,To C方面基于过往国内互联网以及移动互联网领域大数据的积累可以给消费者更加极致的体验,甚至形成所谓武林派别中的‘中国派’,将中国特色发挥到极致。”石晓锐说。