新知|“人形机器人”吹响集结号,它们如何走上“成人”之路
主笔、视频制作:于梅君
人形机器人正在从科幻电影走向现实世界。能跑能跳能“思考”,拿物取物自然灵动……目前,人形机器人成为科技界最炙手可热的赛道之一,“有望成为继计算机、智能手机、新能源汽车后的颠覆性产品”。什么是人形机器人?好用吗?我国人形机器人发展情况如何?
世界人工智能大会,人形机器人是“最靓的仔”
7月4日至7日,在上海举行的2024世界人工智能大会上,人形机器人是全场“最靓的仔”。特斯拉二代人形机器人“擎天柱”(Optimus)等首次亮相,“见证人形机器人的再进化”。
擎天柱(Optimus),是特斯拉在2021年8月推出的一款智能机器人,集成了特斯拉自主研发的神经网络和先进的计算机视觉技术。其设计初衷是为人类分担危险或枯燥的任务,比如搬运重物、采购杂货等,旨在提升工作效率与生活便利性。
擎天柱一代机器人已展现出强大的功能,配备有2.3kWh电池组,身高约172CM,体重73kg,不仅能耗控制得当,会自然行走,还具备超过200个身体自由度,其仿生手指更是拥有27个自由度,操作极为精细。
“擎天柱”二代人形机器人,在 AI 大模型的加持下,体重减轻约10千克,步行速度提高了30%;手部关节全新升级,活动更自然,手指搭载触觉传感器,能完成抓鸡蛋等精细动作。同时,它还能做多个深蹲动作,平衡感和身体控制力进一步优化。
特斯拉称,预计将于2025年开始限量生产人形机器人,将有超过1000个“擎天柱”在特斯拉工厂帮助人类完成生产任务。特斯拉目标年产10亿台,占据市场10%以上份额,其成本控制在1万美元左右,售价预计2万美元。
除了“擎天柱”,在2024世界人工智能大会上,国内首款全尺寸通用人形机器人开源公版机“青龙”首度公开亮相。
“青龙”身高185cm,体重80kg,拥有高度仿生的躯干和拟人化的运动控制。即使负重40公斤,也能以每秒1米的速度行走。它的手指灵活自如,能准确抓取桌子上随意摆放的面包,再放入篮子里。
“青龙”由人形机器人(上海)有限公司自主研发,全体系对标生物人功能指标,打通了“感知-决策-执行”链路。此后,它将每年发布一个新版本。
在人工智能大会上,达闼科技也首发首展最新一代人形机器人,拥有先进的感知、决策和执行系统,能听懂人类指令并完成具体任务。目前,这些人型机器人不仅能跳舞,还能进养老院当“护工”,做一些量体温、送药等简单的活儿。
机器人真的越来越“像”人了
“人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式。”此前,工信部发布《人形机器人创新发展指导意见》,开篇即这样写道。
随着技术不断成熟,人形机器人未来有望在多个领域取代人工,展现出巨大的市场潜力。
不久前,特斯拉发布其人形机器人擎天柱(Optimus)在自家工厂“打工”的视频。在此之前,今年2月,国内人形机器人Walker S已经进入新能源汽车工厂,开启了“打工生涯”。在流水线上,它能和人类协作,完成汽车装配及质检作业。
今年4月底,北京人形机器人创新中心,还发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”,它能以6公里/小时的速度稳定奔跑。
毋庸置疑,随着智能化程度越来越高,机器人越来越“像”人了,“它们”正向“他们”快速演变。人形机器人就像汽车行业中的“概念车”,虽然还未量产,但代表着未来。
近期,英伟达创始人黄仁勋表示,AI下一个浪潮将是“具身智能”。而“具身智能”人型机器人,则毫无疑问将成为“新贵”。
所谓“具身智能”,通俗来讲,就是要给人工智能这个聪明的“头脑”,装上一副“身体”。这个“身体”可以是一部手机、一台自动驾驶汽车,而人形机器人则是集各类核心尖端技术于一体的载体,是“具身智能”的代表产品。
那么,人形机器人和传统机器人有什么区别?宇树科技创始人王兴兴介绍,传统机器人基本上是按照人类编写的程序完成特定任务,具有专属性,也就是说,一种机器人只能干一件事。而人形机器人更加智能,能听懂人类指令,识别环境信息,并做出更合理的决策和行动。
比如,中科院自动化研究所设计研发的Q系列人形机器人,当你对它说,“请从桌子上拿起一个淀粉含量最高的蔬菜”,它能准确地从一堆菜中,挑选出土豆放进筐子。
人工智能如此聪明的大脑,为什么偏偏要做成人形?专家解释,现实世界已被打造成适合人类工作和生活的样子,所有工具也是为人类设计的。所以,只有把机器人设计成人的样子、拥有人的运动能力,才能更好地适应环境、驾驭更多工具,从而真正具备通用性。此外,这也涉及心理因素,毕竟人类天然对“人形”更感到亲切。
一个万亿元级产业新赛道呼之欲出
优必选Walker S、宇树H1、达闼XR—4、小鹏PX5、小米CyberOne……这些科技感十足的名字,都是国内企业推出的人形机器人。
业内人士表示,人形机器人正处于从实验室迈向产业化的关键节点,2024年有望成为人形机器人量产元年。
工业制造、商用服务和家庭陪伴,是人形机器人的三大应用场景。智能制造将是首个大规模应用的领域,工业人形机器人三年内有望大规模放量。
不过,家庭和商业场景更复杂的环境和灵活多元的人机交互需求,使得人形机器人大规模商业化尚有不确定性。
宇树科技创始人王兴兴认为,人形机器人的应用场景,可以分短期、中期和长期来看。短期内,主要是工厂里的生产装配;中期,会拓展到家庭、农业、建筑工地等场景;长期来看,可以理解为“多数事都可以由人形机器人来干”。
中国信通院专家介绍,我国人口老龄化问题正逐步显现,长期来看劳动力供给不足,需要人形机器人补充缺口。另一方面,环境恶劣或重复、繁重、危险的工作,都可以由人形机器人来替代。
功能有限、价格昂贵的人形机器人好用吗?看着目前动作缓慢、略显笨拙的人形机器人,不少人心里犯嘀咕。对此,宇树科技创始人王兴兴表示,在ChatGPT出现之前,大家也觉得AI不够智能,这和人形机器人目前的状态有些类似。
王兴兴说,实际上,人形机器人只差一点火候来点燃,就是机器人大模型AI技术突破临界点。快的话3到5年就会有非常明显的进步,慢的话也不会超过10年,“10年后,应该已经天翻地覆了。”
目前,人形机器人开始走进新能源汽车等工业场景生产线,预计明年将带来效益。未来五年,人形机器人或将走进家庭服务等场景。国内外人形机器人企业正在加速赛跑,今年国内头部企业将开启小批量交付,一个万亿元级别产业新赛道呼之欲出。
如果人形机器人广泛应用于生活,价格问题备受关注。马斯克曾表示,特斯拉的人形机器人售价可能低于2万美元。国内多家人形机器人企业也预计,未来市场成熟后,人形机器人售价可能在几万元到几十万元不等。
据《人形机器人产业研究报告》,到2024年,中国人形机器人市场规模将达到约27.6亿元;2029年达到750亿元,位居世界第一;到2035年,有望飙升至3000亿元。这表明人形机器人产业在未来十年内将迎来爆发式增长。
知多一点
机器人的成“人”之路,究竟有多难?
将一个真正的人培养至大学毕业,要花多少钱?由经济学家梁建章牵头、育娲人口发布的《中国生育成本报告2024版》指出,在国内,将一个孩子从0岁养育到大学本科毕业所需的平均成本为68万元。
而仅仅是为6岁的人形机器人WALKER进行4次迭代,“家长”优必选的代价是,近25亿元的投入。如此费钱的根源是,人形机器人需要集“运动健将、智多星、导航助手”三大“完美人设”于一身,即在运动模块、传感模块和人工智能模块,都要驾轻就熟。
其他机器人的“KPI”往往只有一项:工业机器人的能力,取决于 “肌肉个数”,即主要侧重于运动控制技术;扫地机器人的能力,取决于能否成功规避障碍物,把屋子打扫干净,即侧重于导航传感技术。
而人形机器人 “完美人设”背后,需要大把钱去维护:去年6月,天风证券的一份文件显示,目前国内单台人形机器人生产成本在70万-100万元。
如何降本?优必选的预测是,到2030年,人形机器人降本70%-80%,达到2万-3万美元。特斯拉的目标更为激进:3-5年内,降到2万美元。
据优必选透露,目前其产品Walker续航时间在两小时左右。机器人巨大的耗电量,主要来自关节部位。优必选给出的解决方案是:通过优化“机器人直立行走算法、手眼协调算法”等,大幅降低耗电量。
专家认为,人形机器人对制造商的考验,主要在以下三方面:整机集成能力、运动控制算法软件开发能力、AI布局。
AI布局,也就是大脑层面,成为现阶段最大的变数:先前在“大脑”层面,几乎没有什么水花,各家推出的模型,基本只能倒倒水、搬搬快递;而现阶段,ChatGPT来临之后,人形机器人的 “大脑”,终于迎来质变的可能性。
近日,已有开发人员将GPT-4与目标检测网络结合,分析并执行人类指令。
当询问GPT-4,开发人员手中是什么物体时,GPT-4能识别出是可口可乐,然后继续提问可乐的卡路里,GPT-4也能做出回答;GPT-4还能识别出摄像头中的牙刷,并按要求在网上找到牙刷的购买链接。
这也意味着,当ChatGPT强势入局之后,人形机器人的心智或许很快会脱离稚嫩,迈入“成年人”的赛道。