腾讯张正友回应具身智能三问:不造硬件、此时开放、人形非终极

2025-07-29


  “具身智能对数据的需求量无法降低,很多都希望完全端到端训练具身智能模型,但从感知到规划很难完全端到端实现,需要的数据量太大,这也是开放平台的价值★★。”

  从行业看,当前具身智能面临核心技术瓶颈。首先是3D世界动态建模,机器人需要准确感知和理解3D环境的动态变化,这对传感器和算法都提出很高要求。其次,触觉传感器标准化也是难题,不同触觉传感器在性能和数据格式上存在差异,难以实现统一应用和开发。此外,模型泛化能力不足,使得机器人在面对新场景和任务时表现往往不尽如人意◆★■■★■。

  在不断积累和探索中,腾讯Robotics X实验室走过了7年■■■◆★★,沉淀了多模态感知■■◆★◆、规划、感知行动联合三大核心模型,以及虚实融合仿真平台★■★■■◆。去年推出的原型机小五机器人正整合了其前四代机器人,四足机器人Jamoca◆◆■、轮腿式机器人Ollie、灵巧手TRX-Hand等的核心技术积累。

  “像调酒机器人,我们最终不会去做调酒机器人(的本体量产)◆★■■★◆,但之所以有调酒机器人(的场景研发),是去展示技术的灵巧性和触觉各方面的能力。”张正友重申。未来★★◆■,腾讯Robotics X实验室还会继续做一些展示性的、研究性的硬件,“假如一开始停留在Max腿轮一体化机器狗的本体量产★◆★■◆■,那后面就没精力去做其他东西了……我们踩了很多坑,这些都是很宝贵的经验◆◆★◆★◆。◆■★”张正友说★★。

  面对这些难题◆◆■,没有任何企业能完整打通端到端技术链条。加速具身智能的最快方法◆◆,就是开放。

  WAIC具身智能场馆的火爆■■★◆■■,某种程度上折射出行业可能存在过热现象。人们甚至对赛道产生困惑:在无法预知未来时,盲目探索价值何在?

  他认为,腾讯在WAIC推出具身智能开放平台Tairos就是向外界明确一个信号◆◆◆■★■:腾讯的定位是具身智能平台,而非本体竞争者。也就是说◆◆★◆★,腾讯不直接参与本体硬件的量产,不在本体硬件上鏖战,而是聚焦于软件能力不断进化和开放。

  ■◆★◆■■“就像Blackberry或Pocket PC,难道那算是失败吗■◆?没有那个过程,后来怎会有iPhone、安卓手机?这是探索过程。本体的探索需要持续投入★■◆■◆★。”张正友表示。若类比通信设备演化,具身智能似乎正处于大哥大时代前夜★■。

  近日具身智能燃爆世界人工智能大会◆◆,作为AI应用大厂◆★★◆,这届WAIC腾讯也有新动作——推出了具身智能开放平台Tairos■◆。但对于腾讯来说,其对于具身智能的布局并非仅仅是外界看到的Tairos这么简单■◆,腾讯在具身智能上的“野心■◆★★◆”也随之铺开:

  技术开放应用并非■◆“开闸放水”般简单。腾讯介绍,从今年初开始便与种子企业深度合作,对具身智能技术进行打磨,已探索出最佳应用模式★◆◆■◆。如今开放钛螺丝,标志着平台从“种子打磨”进入“标准化铺量◆■★◆■”阶段◆■★■◆■。◆★■◆■■“这次展会和会场PPT都展示了当前合作情况,部分产品标准化后便可稳步推进铺量◆★■★。”腾讯表示◆★■■★★。

  大哥大时代用户相对富裕且形成规模■■★◆。当前机器人尚未达到这种程度,人形机器人大多处于数据采集◆■、科研◆◆、导览阶段■★。Tairos平台希望助推行业进入大哥大时代。其标志是■★★◆◆■:无论养老或工业领域■◆★★,场景足够大、能量产、成本可控后,才能真正进入千家万户。

  借着WAIC的契机,张正友现场回应了腾讯战略层面在具身智能上的诸多思考★◆■■。

  据了解◆■■,小五机器人目前探索的场景包括养老、家居等。之所以选择养老等复杂场景作为具身智能技术牵引的方向,是因为养老场景对机器人的交互安全性和鲁棒性要求极高,任何失误都可能带来严重后果。张正友提到,腾讯有着★◆“十年规划”的长期目标,希望通过在养老等复杂场景的应用,不断打磨技术,使其更加成熟可靠◆◆■。

  以宇树机器人为例,通过接入Tairos平台,它能快速实现新功能开发和优化。这得益于平台虚实融合特性构建的仿真-真实闭环◆★★:在虚拟环境完成测试训练后★■■,可直接将成果应用于真实机器人◆■◆★。现场接入Tairos的宇树机器人G1在无操控状态下■■,展示了多模态感知与规划能力。

  根据腾讯披露的信息,其将五代机器人技术积累封装在Tairos平台中★◆◆■■,平台具备模块化功能★■◆■,合作伙伴可各取所需。具身智能产业链上的软件商如研发新模型◆■◆★,也可接入平台,并利用平台自有的仿真数据、真实数据等优化模型★■★★,再赋能其他机器人厂商◆■■◆。

  ★◆★“要不要做一个机器狗?从我的角度是不支持去做的■★◆◆◆■,不值得去做的,我自己也不会做。因为还有更大的目标在支撑着我们■■★◆。”张正友明确表示。

  “若用语言与机器人交互■◆■■,会被一分钟百字的语速限制;但若机器人有屏幕展示文字信息■★★◆★,每分钟阅读三百字都不成问题。为什么不将现有技术整合到机器人上?为何必须双足人形?为何必须语言对话★◆◆◆■?◆■”

  不过他认为,行业不应被★■“仿生◆★■”限制对具身智能终极形态的想象。人类双足人形是经过千万年演化的复杂环境生存形态,但现代人居环境已大变样,双足效率可能变低■★。在形态探索中,Robotics研发腿轮一体化(兼具轮与腿)机器人★★■■★■,不为仿生,而是探索更适合人居环境的具身智能形态。

  “我们的目的不是要超越所有机器人、具身智能公司或研究机构。某公司感知行动做得很好,可能比我们还优秀,那他们就不需要用我的,用感知大模型和规划大模型即可★■★◆。”从模块化角度看,传统机器人平台往往需要大量数据和复杂编程适配不同本体★◆■◆★■,而Tairos平台采用模块化设计,企业可根据需求选择模块,只需少量数据即可完成适配★★。

  张正友指出,腾讯更倾向于将自身的能力以平台的形式输出,帮助其他企业在具身智能领域更好地发展◆■。而现场演示互动的小五机器人,更多是作为一个研究原型,用于内部的技术验证和探索★■,与真正面向市场的产品有着本质区别◆★★。

  2018年初◆◆★■■■,腾讯创始人马化腾做出了一个重要决定——成立腾讯Robotics X实验室。自那之后,作为腾讯首席科学家的张正友便为实验室定下了一个“十年规划★◆■”,到现在■◆◆◆,正好七年■★■。

  而真正推动Tairos(中文名:钛螺丝)开放的另一个原因,是在走访六七十家企业后◆★★■,腾讯看到了市场的真实需求。★◆◆■■★“在具身智能上积累的技术经验,除了腾讯自己需要,他们(走访企业)很多都缺乏这些工具。”张正友说。

  ■■★◆◆“我有生之年都会看到,你们更不用说。”张正友表示◆◆。今年备受关注的机器人马拉松仍存在人为操控,他预计明年◆■■■◆★“不需要后方遥控”,主要需提升感知能力★■■。

  除了核心技术瓶颈◆★★★,具身智能行业还面临共性挑战。例如★◆■■◆◆,数据量需求大,训练高效具身智能模型需要大量数据支持;端到端模型的限制■★◆,使得模型可解释性和可扩展性较差。


关键词: