2025年,人形机器人领域迎来了一股热潮。在这股浪潮中,智元机器人灵犀业务线的总裁魏强携其所说的“硅基少年”——灵犀X2,登上了具身智能的前沿。这位曾成功打造叮咚智能音箱、华为FreeBuds系列产品的“智能界老手”,如今正试图通过一款既能跳舞、又能表演脱口秀、还能担任博物馆导览员的机器人,重新划定人机交互的界限。
我们追求的并非是冰冷的机械装置,而应是充满生命力的同行者。在接受了南都娱乐的独家访谈时,魏强以此言确立了灵犀X2的核心理念。自今年3月在B站上首次发布技术演示以来,至5月22日官方启动合作伙伴招募,这款具备双足行走和智能交互功能的人形机器人,正于文娱、教育、康养等多个领域引发一场“活力变革”。
升级
从“关节扭矩提升50%”到“硅基大脑”的进化
2024年8月,全球范围内首款全栈开源型机器人智元灵犀X1正式面世。短短一年之内,这款机器人便迎来了升级和改进。魏强通过一系列数据展示了灵犀X2的技术创新点:灵犀X2的关节扭矩相比上一代产品提高了50%,能够应对15度的斜坡路面挑战;它配备了25至31个自由度,而旗舰版更是配备了具备10个自由度的灵巧手OmniHand;更为关键的是,它搭载了自主研发的“硅光动语”多模态大模型。
魏强以实例说明,传统交流模式为“一问一答”,但灵犀X2具备自主识别能力。游客若在展厅停留,它便可通过摄像头锁定其关注焦点,主动提供解说,其行为宛如真人讲解员。这种技能源自模型对视觉、语音、触觉等多源数据的综合分析,而且它还能依据交互过程中的反馈来调整自身的“个性”——例如,一个长期保持活跃的机器人可能会变得更加开朗,甚至可以称得上是机器人世界中的E型人物,它擅长主动与人类进行情感层面的交流。
魏强透露,经过更新迭代,灵犀X2的研发和制造成本均有显著降低。一方面,通过复用智元全栈技术平台,研发费用得到有效降低;另一方面,得益于供应链的规模化效应,关节模组等制造成本也有所下降。这些因素使得我们能够实现量产数千台的目标,从而进一步摊薄硬件成本。
安全性
柔性外衣下的“急停逻辑”与材料创新
确保安全是具身智能机器人作业的根本要求。那么,灵犀X2如何坚守这一基础?魏强向记者展示了他团队精心研发的“多重防护措施”:采用柔性中空外壳以减轻碰撞冲击、设置硬件急停按钮以实现快速断电。此外,他还特别强调了在文旅场景中的安全保障:即便孩子们推搡机器人,它也能自动维持平衡。
观察智能算法的运作原理,首先,灵犀X2的研发团队由具备自动驾驶技术背景的工程师组成。他们计划将自动驾驶领域的安全设计理念迁移至人形机器人领域。此外,在设计层面,机器人配备了紧急停止按钮,一旦遇到紧急状况,用户可以迅速按下按钮,即刻停止机器人的所有动作,确保所有人的人身安全。这项功能同样适用于远程操控,比如在APP中也能找到相应的智能按钮,用以预防可能的风险。接着,灵犀X2在与人类互动时,会利用传感器和激光雷达等技术,与周围人群保持适当的距离。在移动过程中,机器人不会靠近人类过近,一旦达到预定位置便会自动停止,从而避免对周围人群造成伤害。最终,在算法调整方面,若机器人在执行特定动作时遭遇异常的外部阻力或撞击,它会立刻中止动作或释放力量,以避免对周边人员、大型动物或物体造成伤害。“比如在主题公园或科技馆等游客密集场所,即便如此,灵犀X2依然能确保从A点到B点的自主导航与避障功能稳定运行。”魏强如此阐述。
观察其外壳材质,魏强指出,与其他人形机器人采用的金属或塑料外壳不同,灵犀X2采用了柔性材料,这种材料类似于高档包包所使用的柔性材质,其质感则介于海绵与皮革之间。他进一步说明,采用这些材料具有双重优势:首先,它能有效保障周边人员和物品的安全,例如,即便机器人发生剧烈碰撞,人们也不会因机器人的坚硬外壳而遭受严重伤害。其次,当机器人与设备或机械接触时,由于材料的缓冲作用,内部结构件或器件不会因强力撞击而受损,从而实现良好的保护效果。
交互性
从“工具”到“伙伴”的跨越
灵犀X2的一大优势在于其出色的主动交流功能。魏强对这款机器人赋予了一个别致的昵称——“硅基少年”。它通过搭载的摄像头和麦克风阵列等设备,收集外界的环境图像和声音等数据。借助情感计算引擎以及多模态交互技术,它能主动地识别周围人的情感和意图,并主动发起自然的互动。这款机器人不仅仅是执行命令的工具,更是一个充满活力的伙伴。
简而言之,若有人立于机器人旁,其摄像头能识别该人,灵犀X2便会主动上前与其互动,并借助大模型评估该人的情绪状态。另外,若机器人观察到有人正忙于通话或处理事务,则不会贸然打扰。再者,若前方有指示牌或障碍,它也会主动避开。
这种互动体验源于硅光动语大模型的不断进步。魏强表示,灵犀X2的模型具备角色性格定制功能,同时能够通过不断学习来适应用户的喜好。“展望未来,每一台灵犀X2都将根据交互大数据的不同而塑造出既独特又满足用户需求的个性。”
文娱场景
能跳舞能讲脱口秀的机器人演员
文娱展示与文化旅游博览成为灵犀X2当前的关键应用领域。魏强指出,灵犀X2已在主题公园、展览馆等场所成功实现商业化应用。比如,在我国的移动展厅里,灵犀X2已正式担任起导览员的职责,通过互动问答和主动迎接游客,有效提升了游客的体验感。
此外,灵犀X2具备二次开发能力,能够满足脱口秀、舞蹈表演等多样化需求,并以机器人演员的角色为合作伙伴带来流量与经济效益。魏强透露,目前我们已与某主题公园达成合作,开展灵犀X2的巡演活动。灵犀X2将借助硅光动语模型,实现多模态的复杂交互,为上述场景提供有力支撑。在众多娱乐场合中,机器人不仅展示着各种动作,还可能参与到复杂的互动之中,甚至将来可能负责一些基础任务。为此,研发团队针对机器人在文化娱乐领域的应用,进行了专门的软硬件适配和细致的优化调整,比如配备了灵活的手臂和夹持器,以便在特定环境中执行诸如抓取麦克风、传递礼物等类似操作。在主题公园的表演区域,地面起伏较大,坡度有时高达25至30度,且路径包括沙石或橡胶材质的路面,因此,研发团队必须对机器人进行专项的改良和调整。
灵犀X2的群控算法不仅支持多台设备协同进行舞蹈表演,而且动捕技术与二次开发使得合作运营方能够自行设计动作,这极大地丰富了娱乐场景的想象空间和多样性。魏强向南都记者透露,他们正与合作伙伴共同探索更多创新应用,例如机器人相声和乐器演奏等。
谈及二次开发,魏强补充道,在文化旅游、展览表演等应用场景中,灵犀X2不仅依托硅光动语构建的大模型所拥有的基础知识和技能,还能兼容合作伙伴提供的针对特定场景的知识库,并通过集成技术将这些知识库以IG的形式融入大模型之中。灵犀X2在与人类交流时,能够依据不同情境下的个性化配置,提供更为精确的回应和互动。它可以将诸如博物馆、科技馆、名胜古迹,以及太空、海洋和文物等相关知识融入其模型之中,使其成为一位称职的解说者和向导。
教育场景
支持交互能力和作业能力研究
科研教育领域是人形机器人的常见应用之一。魏强指出,在这一领域,灵犀X2不仅能提供基础的运控和电机模组,还具备交互和作业能力的研究支持,比如它将灵巧手的所有控制接口都进行了开放。魏强向南都记者透露,我们还将提供全方位的开发平台服务,在此过程中,开发者能够专注于他们感兴趣的算法与模块。对于那些他们不感兴趣或非研究焦点的领域,他们可以直接利用我们现有的功能。
此外,灵犀X2拓展了电机模组底层的操控权限,从而使得开发者得以在教育领域量身定制专属的运控算法。这不仅能实现机器人操作的个性化,还能使其完成更为复杂和有趣的动作。同时,这也便于教育工作者针对这些功能进行二次开发,从而在学术上取得创新成果。据悉,灵犀X2有望被纳入校园机器人课程,助力师生将理论知识转化为实践操作。
从场景深耕到家庭愿景
在探讨未来的发展方向时,魏强透露,智元灵犀机器人将遵循“由浅入深”的演进策略,首先在特定环境中精炼产品,随后逐步拓宽至更广泛的场景。“在短期内,我们的重点将集中在文化娱乐、教育以及康养等应用领域,让灵犀机器人充分展现其价值;而长远来看,随着技术和产品的持续突破,我们的目标是将机器人引入家庭,使其成为实至名归的‘三保’伴侣,即安全守护者、生活照料者和环境清洁者。”
魏强对于行业趋势的看法直言不讳,他认为2025年将是人形机器人商业化的关键节点。首先,热度明显提升,各界对人形机器人的发展与应用更加关注。其次,产品商业化落地探索取得了进展,不再是仅仅停留在实验室阶段,简单展示后就结束。再者,量产能力成为焦点,大家都在朝着量产的方向努力,而不仅仅是制造几台原型机。
灵犀X2的核心宗旨在于使智能机器人与人类生活紧密结合,目前,这位“硅基少年”已在文娱、展演、教育等多个领域展开探索,正脚踏实地地向着这一美好愿景不断迈进。