AI在围棋对弈、医学研发等复杂领域中,屡次展现出超越人类的能力,但在简单的日常任务上,机器仍面对挑战。为了解决此一难题,专注于基盘模型和学习演算法开发的公司 Physical Intelligence,经过 8 个月的研究,推出一项帆用机械人基盘模型「π0」,目标是支援多种任务的机械人操作需求。今次他们就示范了利用机械人来折叠衣服、收拾台面、组装箱子。
Physical Intelligence 表示,π0 是实现「人工物理知能(Artificial Physical Intelligence)」的首步,未来期望能如同现行大型语言模型(LLM)及聊天机械人助理般,让机械人具备解决任意日常任务的能力。透过 π0,使用者将可要求机械人完成不同的指令任务。
π0 的设计理念不同于一般 LLM,除了基于文本及图像资料的学习外,还加入机械人操作的实体体验训练。该模型可通过特有的新架构直接输出动作指令,进而使机械人获得一定程度的「物理知性」,更能有效应对多样化的物理性操作需求。在展示影片中,π0 已展现多项家务工作的能力,包括打开洗衣机门、取出并折叠衣物,整理餐桌,甚至计量并研磨咖啡豆,以及组装箱子等任务。
机械人从洗衣机收拾衣服:
机械人收拾桌面
机械人计量咖啡豆并移到咖啡机
机械人组装箱子
这款 π0 原型模型经由开源数据集与来自8款不同机械人的资料训练而成,涵盖了多样化的操作任务。其训练数据选用了广泛的物理互动资料,而非特定用途,目的是赋予模型广泛的物理知识基础,借此奠定物理知能的第一步。
Physical Intelligence 认为,要真正实现这项技术的潜力,需要结合整个机械人社群的力量,并透露已经与多间企业和研究机构展开合作,期望能透过社群力量推动 π0 模型的进一步发展。