【科技资讯】机器人启蒙,需要一所能“犯错”的幼儿园 - 科普头条

【科技资讯】机器人启蒙,需要一所能“犯错”的幼儿园

📌 信息分类:具身智能

📰 信息来源:www.36kr.com

📅 原文发布时间:2026-05-26 18:29

🕒 本站采集时间:2026-05-27 06:11:46


📝 核心摘要

机器人启蒙,需要一所能“犯错”的幼儿园36氪产业创新·2026年05月26日 18:29萨顿和他山科技共建的“幼儿园”,如何让机器人自主持续学习?
2024年,强化学习奠基人理查德·萨顿与他的导师安德鲁·巴托共同获得了图灵奖。
这个奖项来得不算早。过去三十年,萨顿的理论支撑了AlphaGo、ChatGPT等系统的进化,但他三十年前写下的理论,直到今天才被具身智能行业真正理解:
智能体要从试错中学习,要从真实经验里进化。
2023年,萨顿参与创办非营利研究机构Openmind。2025年4月,萨顿在联合发表的文章《欢迎来到经验时代(Welcome to the Era of Experience)》中,再次一针见血地指出:
“新一代智能体,必须拥有像人类一样在长时间尺度上不断推进的经验流,在真实的物理反馈中实现自我进化。”
这一次,除了理论之外,萨顿把目光投向了更远的地方。
今年5月,萨顿与他山科技在加拿大正式签约,以长期合作的形式共同推进一个名为“机器人幼儿园”的项目。

一位图灵奖得主,与一家中国触觉公司一拍即合,共同为具身智能的下一个十年提前做出了判断:训练机器人的全新路径,也许就在真实的触摸与试错之中。
具身智能,缺的是“第一人称经验”
他山科技CEO马扬给出了一个很直白的判断。机器人要干活,无非解决两个问题:一个是机器人自己在物理世界的里移动,通过双足、四足、轮式等途径,很多公司都在做。
另一个就是操作目标物体,用手去抓、去放、去拧,行为流畅且不会被上一个动作的偏差打断。这两件事加起来,基本能覆盖目前人类需要机器人做的90%-95%的工作。
从一开始,他山科技想的就是从触觉切入,做好后面这件事。
2017年他山科技刚成立的时候,大多数机器人厂商都在做移动平台,展示的是跑跳翻滚的能力。然而,人类90%以上的物理交互,其实是通过手指完成的。手指不像腿,它要一直和不同的目标物体接触,感知、决策、调整,是一个难而持续的过程。
把具身智能的“手指位置”解决好,触觉感知能力是一个核心变量,也是“让机器人干活”的底层方法论。在这条路上,他山科技一做就是将近十年。
具身智能的主流训练方向,依赖的是静态数据集下端到端的模仿,就像在套用题库。人类演示的数据,本质上是第二人称经验,机器人在学习人的做法,但不能亲手“摸”出来,也就无法理解物理世界的运作规律。
他山科技很早就意识到这…


🔗 阅读原文


👉 机器人启蒙,需要一所能“犯错”的幼儿园


🏷️ 标签:具身智能

本文由科普头条 AI 自动采集发布,内容仅代表作者观点

© 2026 科普头条   |   京ICP备2026012639号   |   京公网安备11010102007649号