“生成式搜索”扛旗,百度拓宽搜索的想象空间
(本文系紫金财经原创稿件,转载请注明来源)经济周期本就是人类社会的底层运行逻辑,衰退与繁荣,增长与下降互为因果。特别有意思的是,在每个周期的低谷往往会出现重大的技术创新,为我们叩开新周期纪元,从而实现
(本文系紫金财经原创稿件,转载请注明来源)
经济周期本就是人类社会的底层运行逻辑,衰退与繁荣,增长与下降互为因果。特别有意思的是,在每个周期的低谷往往会出现重大的技术创新,为我们叩开新周期纪元,从而实现螺旋式的上升。历史上,从蒸汽机,到电力,再到计算机互联网,乃至后来的AI智能,莫不如是。
时钟回到跨世纪的千禧年——2000年,百度推出独立搜索门户baidu.com,并于2001年推出独立搜索引擎,直接服务懵懂的互联网用户,由此,百度为自己的未来,也为互联网的发展打下坚实基础。
弹指一挥间,新的世纪已经走过23年。23年前,你是否依然记得如何在互联网上查找信息:打开浏览器,打开百度,在搜索框中输入你想要的。23年后的今天,我们在手机里,打开百度应用,在搜索框中输入你想要的。
从2000年到2023年,同样还是那个搜索框,但对于百度来说,隐藏在搜索框后边的世界一直在变。围绕着“搜索”这个入口,百度不断拓展着自己的业务边界,从最初简单的索引信息,到用户与用户间的社交、问答,再到个性化、跨模态、AI等等,百度搜索的内涵逐渐丰富,乃至多元。
百度所做的这些努力,一直在支撑着百度向前发展。2022年三季报显示,9月份,百度App MAU达到6.34亿,同比增长5%。第三季度,百度移动端搜索查询次数同比实现两位数的增长,百度App信息流内容分发量同比增长23%。
23年间,百度的搜索业务,始终扮演着稳健的基本盘角色,从搜索到智能搜索,从多模态到生成式搜索,百度在搜索领域倾听用户、不断创新,从未停下向前的脚步。
从搜索到智能搜索
实际上,自搜索诞生之初,就是最大的人工智能项目:你在搜索框中提出问题,机器通过自带的逻辑找出答案并提供给用户。作为人工智能的第一块试验田,不论是搜索技术,还是机器都在不断进化,搜索与人工智能技术互为融合。
今天,信息的获取方式非常便捷,特别是移动互联网出现之后,用户除了寻找信息,越来越多内容会通过推送触达用户。海量的信息固然缩短了人们获取信息的途径,提高了效率,但也带来了越来越多的无效信息。这时候,人们需要搜索引擎更加懂他(她),对他(她)有用的信息能够实现更加精准的推送。人们希望搜索能够读懂他(她)的意图,以便更加节省时间,更加高效的解决问题。
实际上,为了让搜索结果更快、更精准、更个性化,不管是国际上的谷歌,必应,还是国内的百度,都已经将机器学习的方法引入到搜索引擎中。
经过多年积累,百度实际上已经出现了一批成果。在过去的十多年间,百度以搜索引擎技术为核心,演化出了语音、图像、知识图谱、自然语言处理等人工智能技术。
此前百度创始人、董事长兼首席执行官李彦宏曾说过,搜索本身就是AI。是的,AI技术为搜索提供了持续进化的动力。今天,搜索引擎不仅仅能按照你输入的文字进行搜索,甚至用户直接给出一张图、一段音乐,AI也能理解你想要获取什么样的信息。
而人工智能在过去的几年中,确实取得了重大进展,无论是在技术层面,还是商业层面,人工智能都更加smart,更加懂用户。而李彦宏也更能抓住发展的内涵:发展的本质是增长,而创新才能驱动增长。
创新不是凭空想象的,百度能持续实现科技创新的心法是“反馈驱动创新”。目前,百度搜索、百度App是AI规模最大的应用场景,随着AI预训练大模型、AIGC、数字人等新技术的规模化落地,其AI所带来的创新优势将更加凸显。
长坡才能厚雪,从量变到质变是必然的过程。作为互联网基础设施,从搜索到应用AI达成智能搜索,百度一直在持续不断的推进创新。百度坚持长情的投入,坚持跑创新的马拉松,坚持把冷板凳坐热。今天的百度,已经开始逐步走到收获期。
生成式搜索,百度先发先至
自创立迄今的二十多年里,百度持续投入研发,其在人工智能领域已摸爬滚打超过10年,为AIGC提供底层技术支撑的人工智能芯片、深度学习平台、预训练大模型等是其重点投入方向,其在智能搜索领域遥遥领先。早在2015年,百度就提出了多模搜索概念,探索从文本搜索向语音、视觉、视频等多模态搜索延伸。
由此发展到现在,智能化搜索在用户层面有了不一样的体验,比如在百度App中,你可以进行语音搜索、拍照搜索、实时翻译、植物识别、视频搜索等操作,这样,搜索的形式和结果,都变得丰富起来。
比如在语音搜索上,百度搜索集成了语音识别、语音合成等多项AI技术,让搜索引擎能“听”会“说”,不仅能够听清、听懂,还能深入理解语义,给出绘“声”绘“色”的最佳搜索答案,让搜索引擎与用户之间的交互方式变得更加自然、流畅、便捷。
在视觉搜索上,百度搜索综合了图像识别、人脸识别、OCR、物体检测、实体匹配等多项视觉技术,并依托于搜索系统对全网图像、视频内容的索引以及用户行为,得以细颗粒度的识别用户实时录制的视频流、拍照及上传图片中的实体和文字,进而围绕实体在用户视觉场景下的需求,链接并组织相关内容及服务提供给用户,实现诸如拍题搜索、商品搜索、实时翻译、植物识别等智能视觉搜索能力。
在视频搜索上,视频已经可以直接用来搜索,并且结合百度超大规模的知识图谱,实现精准的搜索、定位。随着用户视频消费需求增多,为理解、检索出更多优质的视频内容,更高效地满足用户需求。近年来,百度视频理解和检索技术、深度视觉问答技术以及视频智能摘要等技术不断突破。技术升级为用户带去了丰富的搜索体验,也带动着视频消费需求释放,过去一年,百度搜索视频分发量增长了179%。
百度不仅可以搜索视频,还可以自主的生成视频。如今百度APP里一些视频内容,是AI把百家号的图文内容自动转换成视频的结果。当用户搜索台北故宫红烧肉石,仅借助网络上的一段视频,百度便可以自动生成其3D影像,让用户足不出户也能观赏到文物的风采。这些都是AIGC,即人工智能自动生成的内容。
这也是目前百度智能搜索中,最为亮眼的技术之一,基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”。这是全网首个“生成式搜索”,引领了搜索新一轮技术变革。
具体来看,针对用户无法直接获取的知识需求,依托AI技术,百度智能搜索可以对现有的数据、知识进行梳理、推理、加工和生产,从而实现从索引信息到生成知识的进化。例如,当用户搜索“北京和上海的GDP谁高”时,百度可将专业数据库中知识,直接生成可视化、结构化的答案。这种生成式的搜索结果,实际上已经颠覆了人们此前对于搜索的认知。
目前,百度知识加工组织和创意内容生产已在智能剪辑、智能作画、智能写诗等多个领域落地应用。未来,内容生成和智能组织技术,会赋能到更多的知识生产场景中,帮助百度不断 拓展搜索内容消费的边界。AIGC或将颠覆现有内容生产模式,实现以十分之一的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容。
以上在移动生态方面看到百度在智能搜索、生成式搜索上的进展,得益于两大杀手锏技术:跨模态大模型“知一”和新一代索引“千流”。 “知一”能够完成日均万亿次的超大规模在线预估,能够处理千亿综合语料和百亿视频语料,每天要进行万亿次的推理。“千流”具有“动态适应”和“准确高效”两大独特优势,依托大模型技术对内容深度理解,能够把不同维度的信息进行智能有序的组织,将传统索引升级成多领域、多维度表达的立体栅格索引。
通过这两项技术,百度搜索变得更加智能、更高效、更懂用户,正是这些核心技术的投入,让百度搜索能够快速进化,从而让百度搜索持续领跑行业。
百度实现的方向性的进步离不开在AI领域的长期投入,当前百度累计研发投入超过1000亿,每年研发占比都超过15%。这样压强式的投入,使得百度在智能搜索、生成式搜索、AI等各个方面都取得了重大进展,这些开创性技术的进步,使得百度在应用领域不断向前延展。
未来趋势:AIGC与搜索的深度融合
技术的发展没有精准的导航地图,只有大致方向的指南针。在保证大方向正确的前提下,一步步摸索反馈迭代,长期坚持,长情投入,才能得到让人欣慰的答案。
不久前,一款名为chatGPT的对话式聊天模型,因为“能说会道”备受关注,这让AIGC再次出圈,但也有专家表示担忧,受到当前技术效果的影响,chatGPT提供的信息会存在准确度不够、时效性不足等问题。如果能与搜索引擎进行融合互补,或将开启全新的技术革命。
实际上,百度搜索早已展开布局,AIGC与搜索的深度结合,将推动搜索引擎从“检索”到“检索+生成”的升级。
而2023年百度智能搜索技术上最为重要的工作之一,就是要把“检索+生成”系统升级,对于用户体验而言可以感知到三个变革:信息智能整合组织;内容创作;个性化的内容体验。
在百度搜索架构师辜斯缪看来,百度持续在AIGC领域深度布局,并早已将AIGC能力应用在搜索上。据介绍,此次“生成式搜索”将实现更深度应用,进一步释放百度搜索更多差异化功能和优势,更好地解决用户的开放式搜索问题,满足定制化信息和创造性内容的获取需求。
作为AI技术规模最大的应用场景,依托AI技术赋能,百度搜索实现全面升级,不仅更加智能,也更懂用户。“生成式搜索”升级背后,正是百度自研的国内顶尖中文生成式大模型文心大模型提供技术支撑。未来,依托AIGC赋能,百度搜索将开创更广阔的的发展空间,实现搜索能力的高速进化。
站在更高的维度来看,百度在人工智能领域是为数不多的进行全栈布局的公司。从芯片层、框架层到模型层和应用层,各个层面都有领先的自研技术。李彦宏在刚刚召开的Create AI开发者大会上表示“这个技术架构,越往下越通用,越往上越专用。更通用,意味着不断降低行业使用技术的门槛;更专用,则是深入产业去深化应用。”这样的技术架构,使得百度一旦遇到大的应用时,能够进行端到端的优化,实现效率地大幅提升。
李彦宏表示,“创新不是闭门造车。创新,是你有机会进入市场,不断获得用户和客户的反馈,摸着反馈过河才能实现的。”李彦宏强调,创新的本质是提升效率。“所以当大家把自己的具体业务和‘端到端’结合起来看的时候,一定要具体问题具体分析,最终还是落在‘创新的本质是效率提升’上,看是不是真的提升了效率。”
成立23年,百度把自己的边界成功从搜索拓展到了人工智能,从一家以搜索引擎为代表的企业,成长为拥有高端芯片昆仑、飞桨深度学习框架、预训练大模型等等人工智能自研领先技术的高科技公司。
总结:
随着AIGC不断与搜索融合,我们将越来越多地体验到搜索即生成、搜索即创作带来的智能搜索体验。作为搜索的引领者,通过前沿的AI新技术和海量的数据应用,未来百度将进一步实现用户需求和内容生态的高效连接,让智能搜索的场景无处不在。
创新本就是对未来贪婪的想象,更加智能,更懂用户一直是百度孜孜不倦的追求。基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”,这将是全网首个“生成式搜索”,引领了搜索新一轮技术变革。
未来,随着人工智能走入千行百业,百度依旧将锚定创新作为发展的关键词,立志成长为最懂用户,并能帮助人们成长的顶级高科技公司。