近年来,人形机器人的关注度显著提高,主要原因是该领域逐渐呈现出爆发的态势。黄仁勋在去年的多个场合都表示,机器人即将迎来“GPT时刻”。NVIDIA认为,在生成式AI之外,机器人将成为下一个爆点 。
行业内机器人开发者大会如ROSCon这般越来越受欢迎,宇树科技机器人登上春晚表演扭秧歌,特斯拉擎天柱机器人进行叠衣服等行为引发了极大关注,这些情形都让人觉得机器人正以从未有过的速度在发展,然而,4月初举办的一场人形机器人马拉松比赛却给火热的机器人发展态势泼了冷水 。
01
[id_1199502624]
最近,北京亦庄半程马拉松暨人形机器人半程马拉松于南海子公园南门开跑。这是全球首个关于人形机器人的半程马拉松。20支人形机器人赛队与跑步爱好者一同冲出起跑线。他们在长达21.0975公里的赛道上挑战极限。
然而,有多个在网络上传播的视频显示,此前被寄予很高期望的宇树科技G1人形机器人,在跑步的时候摔倒了,之后它站起身来继续进行比赛。
宇树科技发布声明表示,宇树近期未曾参与任何比赛,主要精力用于准备人形机器人的格斗直播。G1人形机器人自去年发货后,已售往全球众多客户,且被使用了较长时间。此次马拉松比赛中,有多个独立团队使用了宇树的机器人。例如,宇树的客户运用自身算法参与了比赛,因此在现场能看到不少宇树的机器人。有好几个独立团队在使用它,在不同人操作或开发的情况下,机器人的表现差别很大,请大家不要误解。机器人和其他电子产品相似,其表现性能与使用者密切相关,希望大家共同推动机器人行业的进步。
宇树科技相关负责人做了进一步解释,现场出现的G1机器人,是由客户团队自主改装算法及硬件的,比如城市之间科技队就为G1加装了道路感知系统,还优化了续航能力,它的表现反映的是客户团队的技术适配情况,并非产品本身存在缺陷,“机器人和其他电子产品类似,其性能高度依赖使用者的调试与优化,希望外界能给予行业更多理解与包容。”
4月24日,宇树科技创始人兼首席执行官王兴兴与香港特别行政区行政长官举行会晤,这似乎是对质疑的回应,通过动态演示向特首团队全面呈现了企业自主研发的智能机器人产品矩阵。在技术交流时,四足机器人展示了复杂地形行走的先进功能,仿生机械臂等创新产品展示了物体抓取搬运的先进功能 。
但目前,人形机器人的发展明显低于大众的市场预期。
02
[id_2086730351]
人形机器人是具身智能的最佳形态之一,它更注重智能体与环境的交互以及自主行为能力。具身智能是一种智能系统,它具备环境感知、智能交互和规划行动的能力。具身智能包括感知模块、交互模块、运控模块这三大核心模块。人形机器人通过与环境交互感知、自主决策、执行规划,从而实现任务级交互。
人形机器人的任务执行模式和自动驾驶汽车的模式相类似,都是基于感知、决策、运控这三大模块。人形机器人借助大脑的语音识别、环境感知等功能来接受指令,接着进行任务拆解等上层规划。随后,小脑会实现对路径的最优规划。最终下达决策指令,通过驱动伺服系统来进行本体运动,以此完成任务指令。在任务执行过程中,大模型的通识理解能力赋予人形机器人具身智能的核心,大模型的多级推理能力也赋予人形机器人具身智能的核心,使其能更好地理解泛化任务。
然而从公开比赛来看,当前人形机器人存在诸多问题,自主辨别方向不容易,这证明它不能根据装载地图自动寻的,续航力太差,跑几公里就要换电池,甚至换人,还要喷酒精降温,平衡性不行,比赛时需要工作人员随跑,甚至还需要扶着才能不摔,摔倒了也很难自己爬起来,机器人脑袋掉下来,两只脚照样可以往前走,显然头部可有可无,摆臂动作清晰,没有顺拐,但是手臂在摔倒后不知所措,在实际运动中,绝大部分人形机器人并非跑步,而是走路,没有两脚同时离地的过程……
有网友开玩笑地说,当前的人形机器人存在这样的状况,即“小脑发育不完善,大脑根本没有发育”。从某种程度来讲,这也证实了人形机器人距离真正实现产业化、商业化仍然非常遥远。
03
人形机器人需要更强大脑
早在70年前,具身智能就被视作通往AGI(通用人工智能)的路径之一。只是当时各项技术还不成熟,发展一直不稳定。很明显,当下这波具身智能的热潮,是受第三次AI浪潮推动的结果。
这波具身智能与以往人们所谈论的机器人存在根本区别,其关键在于智能化程度,比如这两年被马斯克大力宣扬的机器人进入工厂工作的情况,早在几十年前就已达成,其原理是为机器人设定一个程序,使其在已知环境中完成规定动作,这种机器人不仅智能水平较低,而且属于被动智能,它根本无法知晓什么是该出手时就出手 。
然而到了神经网络时代,真正的具身智能需要主动,如同电影里那样,借助感知获取有关世界的信息,随后将感知到的信息,转变为机器能够处理的形式,比如把图像转变为像素值,把文本转变为词向量,在此基础上机器自行做出决定,与世界实现交互。这也意味着,机器人的市场定位很可能发生转变,它将从工业场景转向我们日常的生活场景,而这正是具身智能市场火热的关键要素。
芯片是人形机器人的“大脑”,其性能直接决定人形机器人的智能化程度,也直接决定人形机器人的性能表现。比如宇树在硬件方面,采用了行业内顶级的8核高性能CPU,还采用了NVIDIA Jetson Orin高算力模组,在技术上比同类型机器人更精进 。以G1为例,在这些支持的情况下,它借助深度强化学习(DRL),在仿真环境中模拟数万次跌倒,在仿真环境中模拟数万次站起,最终实现“摔倒自动爬起”“单脚跳跃避障”等高难度动作。
英伟达研发的高性能GPU芯片,图形处理性能卓越,提升了在视觉信息识别方面的能力,提升了在各类复杂任务处理方面的能力,实现了质的飞跃。国内有多家科技企业取得关键性突破,成功推动了芯片技术从实验阶段迈向商业化应用。
优必选在初代Walker主要搭载频率为2.7Ghz的Inteli7 7500U芯片,还搭载频率为2.3Ghz的Intel i5 6200U芯片,在升级版Walker X主要是Intel i7-8665U(双路,1.9GHz),还有NVIDIA GT1030显卡,该显卡有384核心。
傅里叶智能的GR-1是首台人形机器人,它具备端到端环境感知能力,其中央处理器主要采用I7 13700H。
2024年,Engine AI众擎机器人推出了PM01人形机器人,该机器人首次深度融合了Intel N97处理器与NVIDIA Jetson Orin模组,这标志着人形机器人进入了异构计算的新纪元,这种创新组合通过CPU与GPU的协同优化,在能效比、实时响应和扩展性方面实现了突破性提升。
智元机器人配置的Jetson AGX Orin 64GB具备极致AI算力,其INT8算力为275 TOPS,是上一代Jetson AGX Xavier的8倍,它支持同时运行多个复杂AI模型,比如VLM视觉语言模型、SLAM算法。
最近,黑芝麻智能将基于新款华山A2000芯片和武当C1236芯片,为“天问”机器人赋予更具智慧的“大脑”和“小脑”。A2000芯片致力于使“天问”具备人类的常识和知识,从而达成人类的决策水平。C1236芯片能够让AI运算任务与控制任务实现并行处理,为“天问”在复杂环境下的稳定运行与精准操作提供可靠保障。
A2000被定义为一个高算力芯片平台,这个平台是专为下一代AI模型设计的,Lite版芯片的性能对标1颗行业旗舰芯片,标准版芯片的性能对标2颗行业旗舰芯片,Pro版芯片的性能对标4颗行业旗舰芯片。
这里提到的“行业旗舰芯片”是英伟达的OrinX ,A2000Pro芯片可对标4颗OrinX ,这意味着它能与英伟达即将量产的旗舰芯片Thor较量 ,Thor的算力达到1000TOPS 。
04
首届具身智能运动会开赛
人形机器人马拉松仅仅是个开端,借助比赛能够对人形机器人的长时间运动能力予以测试,也能对其跑步能力进行测试,进而发现问题,解决问题。然而,要解锁更多的运动形态,还需要开展更多维度、更为全面复杂的测试。
2025年4月24日,首届具身智能机器人运动会举办。举办地点在无锡市惠山区。此次运动会持续到4月26日 。
百余家来自全国各地的企业,带着近两百多件展品齐聚运动会。开幕式结束后,运动会会开展竞速跑、越野跑、足球、篮球、舞蹈、格斗等竞技项目,智能性、运动规划、本体设计等能力都是“考点”。应用赛项目聚焦于搬运、智能抓取、室内救援、创新场景等,多维度展现机器人完成环境识别、抓取、规划设计等复杂任务的综合能力。
在竞速跑项目里,宇树机器人会和国家地方共建具身智能机器人创新中心(北京)同台竞技,会和国家地方共建人形机器人创新中心(上海)同台竞技,还会和来自深圳的机器人企业同台竞技,会和来自上海的机器人企业同台竞技,会和来自西安的机器人企业同台竞技,会和来自重庆的机器人企业同台竞技。
据了解,除了有激烈的竞速跑比赛,宇树机器人还会参与舞蹈表演环节,到时候,它会和东莞市本末科技有限公司的机器人同台演出,也会和深圳市优必选科技股份有限公司的机器人同台演出。
有分析人士觉得,宇树科技忽然宣称参加首届具身智能机器人运动会,这和其产品在4月下旬举办的北京机器人半马比赛成绩存在一定关联。虽说宇树科技对外称并未参赛,参赛机器人是客户买来用于展示的产品,赛前宇树科技没有做针对性调试。然而,比赛结果还是给宇树科技带来了一定舆情。宇树科技参加此次具身智能机器人运动会,这或许是其为自身技术实力再次正名的表现,同时也是运动会的看点之一。