会自主学习的“家务机器人”来了华人主创称“它还比较蠢”

来源:贝博app体育官网    发布时间:2024-01-17 05:48:27  提示:点击图片可以放大

  “过去,人类在大多数情况下要写几万行代码来告诉机器人,走到哪里要停下,看到了什么,把啥东西递过来——有了‘遥操作’提供足够数据,再让AI算法加以分析利用,就可以更轻松地得到一个能够自主操作的机器人。”符梓鹏说。

  一个双臂机器人站在灶台边,用二指夹起碗边,“啪”,把虾仁往油锅里一倒。机器人左手持锅柄,右手操锅铲,翻炒起来。滋滋作响一阵后,机器人把虾仁装进一旁的盘子。这道煎虾仁就算做完了。

  有别于过往机器人的复杂训练,这一机器人通过50次“遥操作”训练,就学会了全自主煎虾仁的技能。有科技博主解读,该机器人学习能力极强,“通过模仿学习,直接克隆人类行为,这能让它学会任意技能。”

  这是斯坦福大学华人团队研发的“家务机器人”Mobile Aloha。除了煎虾仁以外,它还能够叠被、洗衣、浇花、使用吸尘器、上下电梯与人类击掌等等。当地时间1月4日上午,该小组成员将演示视频上传后,很快在中外互联网获得了极大关注,有关话题获得数百万浏览量。“老人可以被机器人照顾了”“把人从家务中解放出来”“机器人才是解决智能家居的最后一公里”,网友们纷纷热议。

  据公开资料,该项目由两名斯坦福博士生主导负责,斯坦福大学助理教授Chelsea Finn任指导老师。

  “上传项目资料是在美西时间早晨,中国在睡觉。过了十几小时后,发现微信朋友圈也有人在转。”1月10日,新京报记者联系到该项目科研团队的中国成员符梓鹏,他是斯坦福大学计算机科学博士在读生,主要研究AI及机器人领域。他介绍,Mobile Aloha是他与另外两名小组成员自主研发的一套操控系统,用以实现机器人全自动做家务。

  符梓鹏解释,团队首次尝试将“遥操作”、AI算法“模仿学习”与“协同训练”管道结合,使机器人的学习效率和效果被大大增强,还可以学会更多人类动作——首先,人类能够最终靠“遥操作”指挥机器人,即在一定距离外操作机器人的动作。比方说,人类做出倒虾、炒虾的动作,机器人跟着做。这样的“跟做”是一种训练,会产生相应的数据。而后,这一些数据被AI算法利用、分析,供机器人模仿。随着“遥操作”训练的次数增加,机器人会学会特定的人类动作,继而能够自主操作。

  其团队实验数据表明,同一个人类动作经50次以上的“遥操作”训练,机器人自主操作的成功率在90%以上。

  “过去,人类在大多数情况下要写几万行代码来告诉机器人,走到哪里要停下,看到了什么,把啥东西递过来——有了‘遥操作’提供足够数据,再让AI算法加以分析利用,经过‘协同训练’,就能够获得一个能够自主操作的机器人。即使不是计算机专业的普通人,也可以有效的进行‘遥操作’,训练机器人。”符梓鹏说。

  据其团队发布的资料显示,这款机器人的制作成本约在3.2万美元;且其软件、硬件信息都已开源,有关数据被公布在小组成员的Github平台中。这在某种程度上预示着,依据免费的公开数据,任何个人和机构都可组装并研究自己的同款机器人。

  新京报:何时开始这项研究的?有评论说,相比市面上的其他双臂机器人,Mobile Aloha的成本便宜很多,你们是怎么做到的?

  符梓鹏:2023年暑假,我们就开始购买各种硬件。10月初,所有硬件到位后,我们开始组装机器人,并研究改进算法。

  因为我们是自己买硬件组装,买的底盘和机械臂都比较实惠,也没有纳入设计、组装的成本,所以总成本并不高。

  符梓鹏:经过50次“遥操作”训练后,机器人目前可以自主煎虾、把锅放到碗柜里、使用垂直电梯。成功率在90%以上。

  我们上传的视频中,机器人做的另外一些动作,比如敲鸡蛋、完整地做一顿晚餐,并不是它自主完成的,而是我们“遥操作”进行的。因为这类动作很复杂,训练成本也太大,目前机器人还没学会自主进行。

  新京报:有没有可能通过更多次的“遥操作”训练,把90%的成功率进一步提升?

  符梓鹏:有可能,但会有边际递减效应。比方说,通过“遥操作”带着机器人煎虾,头20次、30次训练,能把机器人的自主操作成功率提高到70%;再训练20次,也就是总共训练50次,能把成功率提高到90%;再训练下去,训练到一千次、一万次,也就是煎一千次、一万次虾,可能就只能把成功率提高到95%到98%。

  所以说,进一步提升成功率这件事,需要商业界来做。我们团队日常就两三个人做事,经费和时间都有限,很难在这方面突破。

  符梓鹏:首先是硬件方面的难点。现在,大部分有“遥操作”系统的机器人,要么只能做简单的抓取、放下的动作;要么动作精细但不能移动,比如医疗机器人;要么能移动,但可进行的操作有限,比方说扫地机器人。我们想打造一台多功能的机器人,可以涉及家务、办公室等场景的应用。但同时,又要控制成本。

  另外是软件方面有突破,此次我们把“遥操作”产生收集的数据和AI算法结合,利用“协同训练”管道,进一步提升了机器人的学习效率,这是此前没有人尝试过的。

  符梓鹏:我们大家都希望更好地推广这一个项目,让更多人参与进来,一同研究。对这个项目,我们目前没有一点商业化的打算。

  符梓鹏:对于研究者可以,但是对于普通消费者还不行。研究者能买它用以自己的有关研究,但消费者如果要使用它进行家务劳动的话,第一步是要对它进行大量的“遥操作”训练。比如说,你要它学会煎虾,你就得带着它煎五十次以上。这样的训练成本太大了。

  要让这款机器人进入普通人的家庭生活,得先简化数据采集的过程。这在目前来说是一个技术瓶颈。

  符梓鹏:首先是机器人的泛化能力。比方说,我教会它洗一个碗,它能不能够以此类推,直接学会洗盘子。以目前的研究水平来看,想一步到位地达成这个目标,这是比较难的。我们设想的方法是,我们教它洗碗,也教它洗杯子、洗锅具,洗尽可能多的不同的器皿。在这种情况下,它学会清洗一种从未见过的器皿的可能性会高很多。

  另外,目前“遥操作”机器人,得有个人站在机器人后面。未来,我们大家都希望实现通过视频等远程方式来“遥操作”机器人,这样训练起机器人来,会更方便。

  符梓鹏:我所了解到的,还有医疗机器人、物流分拣机器人和生产线机器人等等。不相同的领域对于应用机器人的接受程度不一样。比方说物流分拣机器人,它对安全性、精确性的要求没那么高。但比方说医疗界,其实很难接受由全自动机器人完整地进行手术,它只能作为辅助,帮助外科医生节省一定的手术时间。

  符梓鹏:短期内很难。对于家务机器人来说,任务的变量太多了——不同款式的冰箱、不一样高度的桌面、不一样的材质的地毯,都需要机器人进行不同程度上的学习。所以说,要做一个能帮人类干一切家务、全自主的家务机器人是很难的。

  反之,目前发展得很成熟的自主机器人是无人驾驶机器人。有研究表明,无人驾驶机器人的水平基本高于人类普通驾驶员。因为交通实际是很固定的一个场景,机器人的任务只有一个——从A到B,不要发生碰撞。不管在啥地方开车,这个底层逻辑是一致的。机器人学习起来,就会相对容易。

  符梓鹏:其实现阶段的机器人非常蠢,它们能干的事情远远不如一个人类小孩来得多。它只能在某些领域,比方说开车,提高人类的效率。但你要说在方方面面,拥有一个通用的、全能型机器人,处理大部分事物的能力都比人类强的话,目前很难想象,或许还需要很长的时间来实现。