人形机器人全球竞赛提速:中国面临哪些优势和挑战
行业级突破何时到来?
随着特斯拉的加入,人形机器人产业的竞赛明显提速。
5月5日,特斯拉Optimus人形机器人公布最新进展——已在一家工厂部署数台机器人,通过完成4680电池的分拣等工作来进行测试;行走速度较去年底提高30%以上,目前约为0.6米/秒;甚至能在工作中纠正自己的错误。
特斯拉CEO埃隆·马斯克透露,在今年晚些时候,Optimus将会换上有22个自由度的新手臂,“执行器将几乎全部移动到前臂之中,就像人类的工作方式一样”。
特斯拉Optimus人形机器人在分拣电池
Optimus的进展可谓当下全球人形机器人竞赛的一个缩影。
此前的3月13日,OpenAI和Figure合作推出通用型机器人Figure 01;3月19日,英伟达公布人形机器人项目GR00T;4月18日,波士顿动力宣布自2013年发布的Atlas人形机器人推出电动版……
业界普遍认为,2024年将是具身智能的发展元年。具身智能是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。人形机器人便是具身智能的代表产品。
据工业和信息化部赛迪研究院数据显示,2026年中国人形机器人产业规模将突破200亿元。2024和2025年人形机器人产业将持续高速增长。
全球加速布局下的中国优势:供应链与场景落地
OpenAI和Figure合作推出通用型机器人Figure 01
硅谷人工智能研究院院长、《硅谷百年史》作者皮埃罗·斯加鲁菲近日在公开演讲中也提及人形机器人。他表示,自己长期以来并不愿意在演讲中放上人形机器人的图片,因为他见过很多人形机器人的演示,它可以跳,可以做很多其他事情,但他认为这并没有什么用途。而现在,人们已经让人形机器人变得更加真实。
“在人形机器人的智能方面,中美目前都在积极探索当中。”银河通用机器人创始人、智源具身智能研究中心负责人王鹤在2024中关村论坛期间接受澎湃新闻采访时表示,美国的声势更大,而中国包括银河通用在内的许多公司,技术也处于世界顶尖水平。
王鹤认为,制造业是中国最大的优势,以轮式人形机器人为例,银河通用的双臂轮式人形机器人,成本仅需谷歌单臂轮式机器人的约1/10;而在数据回收方面,中国也有巨大的人力成本优势。
“中国人形机器人产业在供应链、量产能力以及场景落地方面存在较大优势。”傅利叶智能创始人、CEO顾捷在2024中关村论坛期间接受澎湃新闻独家采访时表示,“特斯拉的很多硬件,甚至整个汽车的产业链都在中国,人形机器人和汽车的供应链还是比较接近的。”
顾捷认为,“我们有大量的场景,比如养老康复、巡检等场景,对人形机器人来说有巨大的落地应用可能性。”
顾捷说,人形机器人是新质生产力非常好的代表,能引领新的产业革命和未来趋势,“人形机器人可能会成为下一代智能终端,从原来的手机变成会走路的手机,变成会走路的大模型,在这个趋势下一定需要一个很好的载体。未来,人形机器人将能够满足大量的通用场景,在生产力方面带来比较大的突破。”
王鹤强调:“在这一波人形具身智能浪潮中,中国的科研机构和企业一定要脚踏实地,不做短线的博人眼球之事,要关注如何真正泛化,一旦走好了‘0’到‘1’的这一步,后面的制造业能力和源源不断的数据回流,能够让中国先发制人,在‘电人’上比‘电车’更成功。”
支持政策频频出台,企业剑指行业级突破
2023年,工业和信息化部印发《人形机器人创新发展指导意见》,提出到2025年初步建立人形机器人创新体系、整机产品达到国际先进水平、孕育开拓一批新业务、新模式、新业态,到2027年产业综合实力达到世界先进水平、成为重要的经济增长新引擎等发展目标。
不仅仅是国家层面,地方政府近年来也动作频频。
通用人形机器人母平台“天工”
4月27日, 在北京亦庄,由优必选联合小米机器人、京城机电等行业领军企业和机构共同成立的北京人形机器人创新中心,正式发布自主研发的通用人形机器人母平台“天工”,可实现6km/h的稳定奔跑。同一天,在中关村论坛,北京海淀区发布《关于打造全国具身智能创新高地三年行动方案(2024-2026年)》。
近期,上海也进一步明确支持通用大模型和垂直大模型研发,积极推进大模型和具身智能的融合发展。
顾捷表示,上海目前聚焦人工智能,叠加原先大模型和机器人优势,在人形机器人的发展上具有一定优势。
2023年5月,山东发布《山东省制造业创新能力提升三年行动计划(2023-2025年)》,湖北发布《湖北省数字经济高质量发展若干政策措施》;6月,北京发布《北京市机器人产业创新发展行动方案(2023-2025年)》;8月,北京发布《北京市促进机器人产业创新发展的若干措施》;10月,上海发布《上海市进一步推进新型基础设施建设行动方案(2023-2026年)》《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》以及《上海市促进医疗机器人产业发展行动方案(2023-2025年)》;12月,重庆发布《重庆市AI及服务机器人产业集群高质量发展行动计划(2023-2027年)》;2024年1月,广东发布《广东省培育智能机器人战略性新兴产业集群行动计划(2023-2025年)》;2月,安徽省发展和改革委员会发布《安徽省未来产业先导区建设方案(试行)》。
王鹤表示,国内对新兴行业的扶持力度很强,银河通用也得到了各级领导和管理单位的支持,建议未来在具身智能领域加大对头部的投入,在头部先进行行业级别的突破,然后再普惠到各行业链条供应商等,“目前看态势还是很好的,也非常期待在今年的下半年出台一系列扶持具身智能的政策,能够让真正头部的企业在这件事情上得到助力。”
通往AGI的关键里程碑,商业化落地仍存挑战
根据此前中国人工智能产业发展联盟(AIIA)发布的《2024具身智能全景图1.0》,具身智能行业涉及应用与投资孵化、技术开发与系统集成、基础设施与原材料三大板块,涵盖家庭服务、教育培训、娱乐休闲、医疗保健、特种作业、低空经济、物流运输、航天航空、基础模型与人工智能引擎、云平台与数据、传感器探测器、处理器芯片、无线通信设备等数十个细分领域,涉及企业超300家。
2024具身智能全景图1.0 来源:中国信通院
AIIA具身智能工作组也对产业链上、中、下游现状和趋势进行了总结和分析。
上游方面,传感器由高精度到高鲁棒转变;芯片将从云端向端侧迁移,当前云计算是人工智能芯片的主要应用场景,未来人工智能芯片将被集成到机器人本体中,使其具备端侧计算能力;算法将从模型驱动转变为数据驱动,数据收集和质量未来将成重中之重,驱动模型向多模态融合方向发展;软硬件领域,当前主要采用分立式设计,即软硬件分别设计再集成,而未来,软硬件一体化设计有望成为具身智能系统的主流趋势;开源方面,当前具身智能领域的开源力量还未得到充分的发挥,未来随着市场不断扩大,开源生态有望加速崛起。
中游方面,模块化设计未来将成为主流趋势,加速产业分工和专业化发展;3D打印技术有望重塑机器人制造流程,实现快速的产品迭代;仿生设计将成为机器人形态设计新方向,更加美观、的机器人产品将不断出现,提升用户体验和产品附加值;新材料的应用有望推动机器人性能的进一步提升,赋予其更强的能力;人机协作也有望成为机器人设计的核心理念,进而提高其智能水平。
下游方面,服务机器人或成市场主流,市场规模有望超过工业机器人,迎来爆发式增长;经济模式方面,租赁和共享或将兴起,用户可以以更低的成本获取机器人服务;随着技术的进步,个性化定制则将成为新的增长点;随着机器人在各领域的应用不断深入,科技伦理将日益受到重视;随着需求的多样化,跨界融合将成为机器人应用的新趋势。
智元机器人联合创始人、上海人工智能研究院院长宋海涛表示,具身智能是通向AGI(通用人工智能)的一个关键里程碑。而通向AGI的路非常漫长,需要全社会进行大模型语料库建设,需要进行千亿级甚至万亿级参数的大模型训练,通过把垂类的模型建立之后,逐步向AGI迈进。
智元机器人通用型具身智能机器人“智元远征A1”
宋海涛表示,人工智能10年内从视觉到图像、文本、语音,再到现在的多模态、具身,发展了很多路径,但距离大规模商用还存在很大距离,“具身智能行业在未来3-5年会逐步渗透,5-8年后会有一个快速上量的过程”。
“具身智能最早还会是在偏工业类的场景里落地,因为可以把人的因素抛开,人其实会带来最大的不确定性……工业类可以在一个相对受限的、结构化、可预知的场景里去发挥它的能力。”星动纪元创始人陈建宇表示。
陈建宇认为,具身智能未来3-5年可以在工业场景中达到一定规模化,而在与人比较密集接触的服务类或家庭场景中,可能还需要更长时间。
傅利叶通用人形机器人GR-1
中信证券研究在研报中指出,人形机器人的商业化落地需要同时解决移动能力和操作能力两大挑战。
移动能力方面预计将在未来2-3年内取得突破性进展,但要实现稳定性和量产还需要额外2-3年的时间,竞争的关键在于成本控制和量产能力。商业化角度,初期可以针对特定场景开发专用机器人,随着数据和场景的积累,逐步过渡到通用型机器人。
操作能力方面,具身智能的发展路径与当前大模型公司存在差异。由于机器人领域的数据极其有限,难以通过大规模数据训练模型来实现奇迹。因此,如何在商业落地的过程中高效收集高质量的数据,将成为决定公司长期竞争力的关键因素。
对此,宋海涛认为,目前高质量的标注数据集实际上存在缺失,大量一线科研人员已经在工业制造、3C等各种领域开始进行场景和数据的实测,这需要一些时间。
小米机器人团队负责人许多认为,短期内更大的挑战来源于硬件,“目前(人形机器人)上肢精度大约在厘米级,与0.01毫米的工业精度差距还非常大。如果达到工业精度,数据收集效率就会大大提升。”
王鹤同样认为,人形机器人不同于车,最大瓶颈是缺乏数据,“自动驾驶,以特斯拉FSD(智能驾驶软件)为代表,充分利用了百万车主上亿小时的驾驶数据进行模仿学习,而这样的数据对于人形机器人而言并不存在。因为不同于开车,不会有上百万群众自发买一个没什么功能的机器人,用遥控器去遥控它做事情……现在最实际的方式是通过物理仿真,制造一个能够模拟在真实世界训练的数字训练世界,具身智能0-1的突破也很可能会完全依靠仿真数据来驱动。”
宇树科技创始人、CEO王兴兴也表示,AI世界很多情况不是靠堆财力或堆人力就能做好,具身智能领域现在还没有突破临界点,虽然每天每月都有明显进步,但是距离临界点还有差距。
宋海涛表示:“市场空间足够大,我们能做的就是仰望星空,但是脚踏实地。未来已来,等待大家一起去携手创造。”