机器人“实习生”要住家了!自变量机器人CEO王潜:具身智能的“Aha Moment”或在2至3年内出现

每日经济新闻 8小时前

机器人真正进入家庭帮助人类做家务还需要多久?4月21日,自变量机器人给出的答案是:35天。

当天,自变量机器人(以下或简称自变量)举行发布会,推出新一代机器人进家庭计划,宣布35天后搭载WALL-B的新一代机器人将首批入驻真实家庭。

发布会现场,自变量机器人创始人兼CEO(首席执行官)王潜站在舞台中央,一台白色轮式双臂机器人缓缓滑上台,机械臂夹着垃圾桶,另一只机械臂精准夹起了他演讲途中随手扔下的纸团。这不是提前编好程序的演示,而是机器人自主决策的结果。正是这个人类看似简单的自主决策的动作,对于机器人能否真正进入复杂的真实家庭,至关重要。

王潜和自变量机器人CTO(首席技术官)王昊会后接受了包括《每日经济新闻》在内的媒体记者采访,王潜表示,具身机器人的硬件已经到位了,双足、灵巧手、力控关节都很好,但大脑没有跟上,当前,机器人的核心瓶颈不在本体,而在数据和技术。

王潜还提到,无论是用于数据收集,还是驱动整体技术进步,商业化都是一件非常自然的事,因此为了把技术做好,自变量一定要把商业化做好。“我们希望在2至3年里,实现真正意义上的、物理世界的Aha Moment(顿悟时刻),就像当年ChatGPT所做的事一样。希望Aha Moment,是我们第一个能做出来的。”王潜表示。

谈机器人驻家: Aha Moment,在未来非常近的地方

“早上七点,闹钟响了。你从床上爬起来,走到客厅。拖鞋不知踢到哪里,厨房的碗还没洗,孩子的书包扔在地上,猫打翻了一杯水。”王潜用这段描述开场,揭示了家庭环境的实际情况:随机、碎片、不断变化。

王潜表示,目前,全球没有任何一台机器人可以在无遥控操作的情况下,独立完成上述场景中的综合整理任务。他和团队所做的,是把机器人送进最复杂的真实家庭。

《每日经济新闻》记者了解到,自变量机器人成立之初,便聚焦于为机器人构建“大脑”,即端到端的具身智能基础模型。2024年底,公司发布基于VLA(视觉—语言—动作)架构的第一代具身基础模型——WALL-A。

今年3月,自变量与58同城合作,将搭载WALL-AS模型的机器人送入真实家庭,与保洁阿姨协同作业。不过,正是在这些真实家庭的部署,让自变量及其团队看到了VLA架构的“天花板”。因此,自变量推出了全球首个基于世界统一模型架构(World Unified Model,WUM)的具身智能基础模型,标志着具身基础模型从VLA架构向原生多模态融合架构演进。

王昊提到,在机器人领域,VLA面临的最大问题是,视觉、语言、动作三个模块各自为政,数据在模块间逐级传递,每过一次模块边界就发生一次信息损耗。

“视觉学到的丰富信息,传到动作模块时,只剩一个模糊的摘要。”王昊解释称,更根本的问题在于,VLA模型只能模仿训练数据中的轨迹,无法真正理解物理世界的规律,它不知道杯子为什么会掉,不知道盘子悬在桌边会摔碎。因此,自变量最新官宣的WALL-B,具备WUM架构,将视觉、语言、动作、物理预测等所有能力放在同一个网络中从零开始联合训练,消除了模块间的边界和数据搬运损耗。

王昊将搭载新架构的机器人认识世界的方式,类比为人类学习使用筷子的过程:筷子掉了无数次,但每一次失败都在调整手上的控制,最终形成稳定的技能。这种自我迭代机制,使机器人能在真实环境中持续进化。

王潜表示,“等到5月份机器人驻家时,理论上,它应该能处理所有我们让它做的事情。所有在物理上可触及范围内的事情,它都能做。当然,这不代表100%自主完成,必要时还是需要人进行远程兜底监管,以保证安全”。

“我觉得,机器人进家庭的发展速度,某种意义上要超过大家一般的预期。我还是毫不犹豫地认为,具身智能真正意义上的Aha Moment,应该就在未来非常近的地方,可能比大家想的要近。”王潜进一步指出。

谈企业融资: 具身机器人融资热度,仍相对欠缺

备受关注的是,王潜当日同时对外证实了公司刚完成近20亿元的B轮融资,这轮融资由小米战投与红杉中国联合领投。至此,自变量机器人成为国内唯一一家同时获得字节跳动、美团、阿里巴巴、小米四家互联网巨头投资的具身智能企业。

公开数据显示,2026年以来,国内具身智能及机器人赛道已披露融资总额接近200亿元,百亿元估值公司增至13家,热钱确实在涌入。但在王潜看来,与移动互联网、自动驾驶等大级别的技术浪潮相比,具身智能仍处在早期阶段,“我觉得影响还是弱的,和之前的大级别机会相比,热度还是欠缺的”。

即便是在这样一个尚未真正“热起来”的赛道上,自变量实现了行业内罕见的被四家互联网巨头集体押注。从融资历程来看,自变量几乎走了一条“一轮一个巨头”的独特路径:A轮美团、A+轮阿里、A++轮字节、B轮小米。

“为什么能够吸引这些大厂投资?我很难给出一个行业通用性的回答。”王潜在接受采访时坦言,“所有这些投资人投我们的逻辑,其实非常简单,就是投技术上的领先性。这几家大厂也在做大W模型,应该是全世界做大模型最好的几家公司之一,他们自己的技术判断力很强,他们需要投某种意义上的技术第一性、技术驱动的事情。”

对于未来可能面临的和巨头竞争等问题,王潜表示:“大厂投资我们,也恰恰说明了创业公司的独特优势。市场足够大,创业公司在软硬一体的能力、技术本身的壁垒上,具有优势。”

在王潜看来,资源不构成壁垒,技术才是最大的壁垒。大模型历史上,Google等大厂投入巨量资源,但追赶OpenAI依然用了很长时间。“为什么大家会认为,在大模型的时代技术门槛变低了,因为有蒸馏,蒸馏做得太多了,以至于忘了什么是真正的技术差距了,但机器人没法蒸馏,技术壁垒会更高。”王潜表示。

谈商业化落地: 是数据来源,更是技术迭代的加速器

值得注意的是,从一直以来的发展路径看,自变量给外界的印象是不急于商业化变现。当被问及为何在此时推出家庭产品时,王潜表示,“我们一直都秉承技术第一性,核心目标还是首先要达到大模型那样的里程碑。这个阶段的商业化,是为这个目标服务”。

“为了把技术做好,我们一定要把商业化做好。”王潜总结称,在他看来,商业化不仅是数据来源,更是技术迭代的加速器。

“在真实场景里,有很多物理上的限制,你不去做就不可能会知道。”王潜说,从硬件设计到数据,再到模型,都会有这种反馈。在他看来,一个产品之所以不只是实验室里的研究品,是因为它终究要和足够大、足够广阔的世界交互。

在数据策略上,王昊做了一个生动的比喻:行业内大多数训练数据来自实验室,固定光照、固定位置、无干扰环境,他称之为“糖水数据”,干净但脱离真实。而自变量的团队进入数百个真实家庭采集的数据,则被比喻为“牛奶数据”,嘈杂、多变、充满随机性。自变量的策略是以实验数据打底、真实场景提质,让模型学会在不确定环境中生存。

关于机器人进家庭会涉及的隐私问题,王潜也给出了明确的解决方案:视觉脱敏,据他介绍,机器人在设备端会对原始图像进行实时打码处理,同时,机器人在用户主动按下同意键后方可开机,不存在“默认同意”的情况。而对于机器人在家庭中采集的图像,王潜表示,系统绝不共享第三方,机器人只认一个主人,发现可疑指令立即锁定。

不过,尽管对技术前景保持乐观,王潜依然将现在的机器人定位为“实习生”。这意味着机器人进入家庭,前期可能会犯错,需要人类远程协助。它可能把拖鞋放到厨房,擦桌子可能擦到一半停下来“思考”。但它的优势是24小时不间断工作,每工作一天都会因新数据而变得更聪明。

“进入家庭的机器人,现在还很笨,走得很慢,经常犯错。但人类从婴儿时期迈出的第一步也是如此。每一个伟大的旅程,都是从踉踉跄跄的第一步开始。如今,机器人已经在最复杂的地方开始了它学习和进化的征程。”王潜表示。

(文章来源:每日经济新闻)

文章来源:每日经济新闻
原标题:机器人“实习生”要住家了!自变量机器人CEO王潜:具身智能的“Aha Moment”或在2至3年内出现
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
特朗普:何时结束同伊朗冲突目前“没有时间表”
特朗普:何时结束同伊朗冲突目前“没有时间表”
新华社 214评论
全球市场:纳指、标普再创收盘新高 存储概念股普涨 国际油价涨超3%
全球市场:纳指、标普再创收盘新高 存储概念股普涨 国际油价涨超3%
东方财富Choice数据 132评论
多晶硅主力合约连续上涨 5股获融资资金加仓(附名单)
多晶硅主力合约连续上涨 5股获融资资金加仓(附名单)
数据宝 20评论
凌晨全线大涨!芯片重大利好来袭!
凌晨全线大涨!芯片重大利好来袭!
券商中国 39评论
打开东方财富APP查看更多内容
24小时点击排行
磷化铟:光模块上游核心材料(附股)
美股大涨 雷声滚滚 市场培养习惯
手握10亿订单,创历史新高!人形机器人赛道唯一核弹,芯片隐形冠军
英维克中阴,大盘周三收中阳,周四市场行情分析!
顶着超买硬拉!A股这波韧性绝了!
点击查看更多内容
写评论 ...