会自主学习的“家务机器人”来了 华人主创称“它还比较蠢”

有别于过往机器人的复杂训练,这一机器人通过50次“遥操作”训练,就学会了全自主煎虾仁的技能。有科技博主解读,该机器人学习能力极强,“通过模仿学习,直接克隆人类行为,这能让它学会任意技能。”

这是斯坦福大学华人团队研发的“家务机器人”Mobile Aloha。除了煎虾仁以外,它还能够叠被、洗衣、浇花、使用吸尘器、上下电梯与人类击掌等等。当地时间1月4日上午,该团队成员将演示视频上传后,很快在中外互联网获得了极大关注,有关话题获得数百万浏览量。“老人可以被机器人照顾了”“把人从家务中解放出来”“机器人才是解决智能家居的最后一公里”,网友们纷纷热议。

据公开资料,该项目由两名斯坦福博士生主导负责,斯坦福大学助理教授Chelsea Finn任指导老师。

“上传项目资料是在美西时间早晨,中国在睡觉。过了十几小时后,发现微信朋友圈也有人在转。”1月10日,新京报记者联系到该项目科研团队的中国成员符梓鹏,他是斯坦福大学计算机科学博士在读生,主要研究AI及机器人领域。他介绍,Mobile Aloha是他与另外两名团队成员自主研发的一套操控系统,用以实现机器人全自动做家务。

符梓鹏解释,团队首次尝试将“遥操作”、AI算法“模仿学习”与“协同训练”管道结合,使机器人的学习效率和效果被大大增强,并且能够学会更多人类动作——首先,人类可以通过“遥操作”指挥机器人,即在一定距离外操作机器人的动作。比方说,人类做出倒虾、炒虾的动作,机器人跟着做。这样的“跟做”是一种训练,会产生相应的数据。而后,这些数据被AI算法利用、分析,供机器人模仿。随着“遥操作”训练的次数增加,机器人会学会特定的人类动作,继而能够自主操作。

其团队实验数据表明,同一个人类动作经50次以上的“遥操作”训练,机器人自主操作的成功率在90%以上。

“过去,人类可能需要写几万行代码来告诉机器人,走到哪里要停下,看到了什么,把什么东西递过来——有了‘遥操作’提供足够数据,再让AI算法加以分析利用,经过‘协同训练’,就可以得到一个能够自主操作的机器人。即使不是计算机专业的普通人,也能够进行‘遥操作’,训练机器人。”符梓鹏说。

据其团队发布的资料显示,这款机器人的制作成本约在3.2万美元;且其软件、硬件信息都已开源,有关数据被公布在团队成员的Github平台中。这意味着,依据免费的公开数据,任何个人和机构都可组装并研究自己的同款机器人。

新京报:什么时候开始这项研究的?有评论说,相比市面上的其他双臂机器人,Mobile Aloha的成本便宜很多,你们是怎么做到的?

符梓鹏:2023年暑假,我们就开始购买各种硬件。10月初,所有硬件到位后,我们开始组装机器人,并研究改进算法。

因为我们是自己买硬件组装,买的底盘和机械臂都比较实惠,也没有纳入设计、组装的成本,所以总成本并不高。

符梓鹏:经过50次“遥操作”训练后,机器人目前可以自主煎虾、把锅放到碗柜里、使用垂直电梯。成功率在90%以上。

我们上传的视频中,机器人做的另外一些动作,比如敲鸡蛋、完整地做一顿晚餐,并不是它自主完成的,而是我们“遥操作”进行的。因为这类动作比较复杂,训练成本也太大,目前机器人还没学会自主进行。

新京报:有没有可能通过更多次的“遥操作”训练,把90%的成功率进一步提升?

符梓鹏:有可能,但会有边际递减效应。比方说,通过“遥操作”带着机器人煎虾,头20次、30次训练,能把机器人的自主操作成功率提高到70%;再训练20次,也就是总共训练50次,能把成功率提高到90%;再训练下去,训练到一千次、一万次,也就是煎一千次、一万次虾,可能就只能把成功率提高到95%到98%。

所以说,进一步提高成功率这件事,需要商业界来做。我们团队日常就两三个人做事,经费和时间都有限,很难在这方面突破。

符梓鹏:首先是硬件方面的难点。现在,大部分有“遥操作”系统的机器人,要么只能做简单的抓取、放下的动作;要么动作精细但不能移动,比如医疗机器人;要么能移动,但可进行的操作有限,比方说扫地机器人。我们想要打造一台多功能的机器人,可以涉及家务、办公室等场景的应用。但同时,又要控制成本。

另外是软件方面有突破,此次我们把“遥操作”产生收集的数据和AI算法结合,利用“协同训练”管道,进一步提高了机器人的学习效率,这是此前没有人尝试过的。

符梓鹏:我们希望更好地推广这个项目,让更多人参与进来,共同研究。对于这个项目,我们目前没有任何商业化的打算。

符梓鹏:对于研究者可以,但是对于普通消费者还不行。研究者可以购买它用以自己的有关研究,但消费者如果要使用它进行家务劳动的话,首先需要对它进行大量的“遥操作”训练。比如说,你要它学会煎虾,你就得带着它煎五十次以上。这样的训练成本太大了。

要让这款机器人进入普通人的家庭生活,得先简化数据采集的过程。这在目前来说是一个技术瓶颈。

符梓鹏:首先是机器人的泛化能力。比方说,我教会它洗一个碗,它能不能够以此类推,直接学会洗盘子。以目前的研究水平来看,想一步到位地达成这个目标,这是比较难的。我们设想的方法是,我们教它洗碗,也教它洗杯子、洗锅具,洗尽可能多的不同的器皿。在这种情况下,它学会清洗一种从未见过的器皿的可能性会高很多。

另外,目前“遥操作”机器人,得有个人站在机器人后面。未来,我们希望实现通过视频等远程方式来“遥操作”机器人,这样训练起机器人来,会更方便。

符梓鹏:我所了解到的,还有医疗机器人、物流分拣机器人和生产线机器人等等。不同领域对于应用机器人的接受程度不一样。比方说物流分拣机器人,它对安全性、精确性的要求没有那么高。但比方说医疗界,其实很难接受由全自动机器人完整地进行手术,它只能作为辅助,帮助外科医生节省一定的手术时间。

符梓鹏:短期内很难。对于家务机器人来说,任务的变量太多了——不同款式的冰箱、不一样高度的桌面、不同材质的地毯,都需要机器人进行不同程度上的学习。所以说,要做一个能帮人类干一切家务、全自主的家务机器人是很难的。

反之,目前发展得比较成熟的自主机器人是自动驾驶机器人。有研究表明,自动驾驶机器人的水平基本高于人类普通驾驶员。因为交通实际是很固定的一个场景,机器人的任务只有一个——从A到B,不要发生碰撞。不管在什么地方开车,这个底层逻辑是一致的。机器人学习起来,就会相对容易。

符梓鹏:其实现阶段的机器人非常蠢,它们能干的事情远远不如一个人类小孩来得多。它只能在某些领域,比方说开车,提高人类的效率。但你要说在方方面面,拥有一个通用的、全能型机器人,处理大部分事物的能力都比人类强的话,目前很难想象,或许还需要很长的时间来实现。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注