大模型泡沫退去,谁能活到下半场?

1.jpeg

不难预见,未来诸多行业将要经受大模型洗礼,变革正在悄然发生。

  从今年3月开始,国内企业纷纷下场大模型,铆足劲秀肌肉,如今转向垂直行业淘金,试图争霸行业大模型。我们的心态也逐渐从看乐子,到严肃讨论。

  在人工智能的世界,我们经历了众多的概念游戏,在繁荣与衰退之间,只有对产业有价值的技术,才在最后阶段活了下来。

  事实上,大模型就好比是卖给企业的科技大铲,只有让人买得起,用得顺手,才能创造更多价值。

  不难预见,未来诸多行业将要经受大模型洗礼,变革正在悄然发生。

  泡沫消失前穿上泳衣

  机会来临之际,市场从不缺乏炒作。闻风而动的人一面不想错过天降的蛋糕,一面又忌惮大模型的高投入与薄利润。话虽如此,但更多人会选择先排个队,即便自己完全不知道会走向哪个终点。

  商业的游戏从来都不是稳赚不赔,短短七个月,国内已有超过80个大模型公开测试,热闹异常的市场背后,有着残酷现实:以ChatGPT为代表的通用大模型,或许已经涨到头了。

  第三方网站SimilarWeb监测数据显示,今年6月,ChatGPT网站与移动客户端的全球流量(PV)环比下降了9.7%,美国地区的流量环比下降了10.3%。与此同时,ChatGPT的独立访客数量(UV)下降了5.7%,访客在网站上花费的时间也下降了8.5%。

  不止如此,投资人也开始谨慎评估大模型,一是他们看到了模型层与应用层巨大的鸿沟,二是他们看清大模型趋于同质化的现象,三是他们的算盘,不会为缺乏行业数据的人而拨动。

  大模型的喧嚣正在远去,种种迹象表明,国内大模型正在退去泡沫。走向产业,成为数智创新者和数智实干家,思考的方向。

  2023京东全球科技探索者大会暨京东云峰会,推出了京东言犀大模型。这个源于产业,服务产业的大模型,以数智供应链为着手点,切开了大模型的应用瓶颈。言犀大模型训练时融合70%的通用数据与30%数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。

  硬科技的提出者米磊曾说过,必须在泡沫退去之前,把泡沫变成自己的能力,这样才能在泡沫退去之后还能挣到钱,否则泡沫退去就只是裸泳了。大模型正是需要这样的过程。

  历经数月洗牌,大模型逐渐找到了要去的方向。

  此时,与通用大模型相比,为医疗、工业、消费等领域带来红利的行业大模型,开始变得更受追捧。

  大模型重估京东产业厚度

  大模型的竞争,关键不在技术,而在产业场景落地。

  在产业中扎根并不容易,企业对模型容忍度低,对精度和效率要求更高。95%的精度,是行业门槛,而在toC场景,60%的准确度,就足以娱乐大众。

  这验证了京东云的判断:智能化,不会一蹴而就,它将优先在数字化领先的行业落地。

  基于公有数据的通用大模型是“全才”,很难满足产业场景专业需求,同时还会耗费巨大算力、数据、算法资源,导致成本攀升,即便企业想用也可望而不可及。灌入产业数据的大模型是“专才”,聚焦某个产业场景的具体问题。

  想在垂直行业中有一席之地,两大能力不可或缺:一是,拥有更强大的数据平台,保证知识的维度。二是,拥有更强的智能交互能力,让知识永远不过时,进而实现高质量行业数据积累。只有在自己的场景,才能培养出适合自己的大模型应用。

  如今,百模之战中不乏迎着热气而来的新晋玩家,但京东的布局比想象中要早。2021年,京东便推出十亿级模型K-PLUG,那时,大模型的概念还未普及;2022年,模型量级来到百亿级,Vega以平均分91.3的成绩登顶SuperGLUE榜首;2023年,京东言犀大模型参数达到千亿级。从十亿级到百亿级的全覆盖,使得京东能更灵活地打造适合垂直应用场景的大模型。

  算力是实现大模型的根基,早在2021年,京东便在重庆落地了算力总规模达到135TFLOPS的超大规模计算集群——天琴α,可为推理提速6.2倍,推理成本节省90%。加之沉淀100多种训练和推理优化工具的言犀大模型开放计算平台和2019年开始自主研发的向量数据库,为造大模型奠定了夯实基础。

  如今,京东言犀大模型已在内部场景中得以深度实践:

  AI增长营销平台是京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索。通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

  在医疗行业,由于医疗资源有限,医疗服务不可能同时实现高质量、高覆盖、低成本。与之相悖的是,病情从来不会等人。大模型则帮助京东健康实现多应用场景升级,提升诊疗有效性、专业安全。目前,健康助手及辅助诊疗已涵盖超千种疾病专业性服务,20种评价标准保障医疗安全。未来,和它对对话,就能帮助我们快速辅助诊疗,防止延误病情。

  我们总会希望物流又快又便宜,背后其实是对供应链效率的考验。以往物流网络建设多是基于物理世界运营自动化。多模态大模型则让京东物流超脑实现实时交互、根因分析和智能决策。比如说,只需输入“请分析今年双11大促的布局堵点”,系统就会自动分析并建议增加一排货架,极大地实现降本增效。

  又如在京东上选购商品时,通过商品主图就能快速知悉商品基础信息。但运营这些内容对商家来说是无形的成本,加之商家运营能力参差不齐,最终可能都会影响消费者选购商品的体验。京东云AIGC内容营销平台,可以更好地理解商品特征,从而帮助商家自动化生成商品图片、卖点等营销素材,只需简单的操作就能自动生成电商运营所需商品主图,每套图成本降低90%,周期从7天缩短到半天。

  正因京东在零售、物流、健康、金融、城市等行业有着深厚积累,京东言犀大模型也首先在这些行业落地。

  最底层的言犀AI开发计算平台,则沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,集成超100种场景的AI算法和工具,实现真正的MaaS(模型即服务),这让过去10余人科学家团队的工作,只需1-2位算法人员即可完成,训练效率提升2倍,推理提效6.2倍,成本节约近90%。

  这些积累构成了京东在大模型发展的三步走:第一步,2022年7月基于内部实践,产业原生模型上线;第二步,2023年下半年在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,融合行业解决方案对外输出;第三步,2024年起,针对严肃商业场景将大模型能力对外开放,服务产业,不断在更多行业中释放商业化价值。

  大模型在供应链上落地开花

  现阶段,很多大模型企业都在苦于找应用、找场景,没有产业支撑的大模型宛如空中楼阁,垂直行业成为他们的目标。但想在垂直行业实现智能涌现,并非一件易事。

  大模型优先围绕供应链落地产业。供应链是产业中数据最集中、协同最复杂的场景,通过数据实现管理优化即可提升供应链效率。通过落地大模型能够快速释放供应链效能,相比其他场景能最快发挥智能的优势。

  京东言犀大模型正是这样的路径。作为拥有全行业完整的产业链和落地场景的企业,京东以数智供应链,作为言犀大模型在行业应用的着力点。

  数智供应链长链路、复杂协同的原生数据,更适合产业大模型的训练,言犀大模型训练时融合30%数智供应链原生数据。这些数据来源于京东服务千万自营商品SKU,5000万工业品SKU,超800万家活跃企业客户,全国超2000个产业带的真实需求。围绕这些场景训练的大模型更适合产业应用。

  可以说,供应链训练了产业大模型,而大模型也会在供应链上落地开花。

  “做实做好大模型,深入产业,是现阶段最为重要的任务。” 在京东集团技术委员会主席、京东云事业部总裁曹鹏看来,每个企业都有自己的行业大模型,是大模型的未来趋势,谁用得好,谁就能在行业中占据优势。而京东现在也正致力于在具体场景中100%解决问题,而不需要在100个场景中解决10%问题。

  泡沫在现代经济扩张中在所难免,但也没必要畏惧泡沫。历史上,6000多个手机品牌超过9成都消失了,留下的都是硬实力强大的企业,也是懂得消费者需求的企业。

  行业变革才刚刚开始,大模型的进化之路还很长。正如京东CEO许冉所言,“从产业端切入大模型,如同是从北坡攀爬技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景。”

  当泡沫消去,留下的一定也是能够走进产业,并在产业中持续做厚做深的企业,而未来每个人也都将会是大模型的参与者和受益者。


产品图.jpg

赞 (0)
上一篇 2024年11月01日 12:37
下一篇 2024年11月01日 12:37