切换到宽版
  • 568阅读
  • 1回复

[智能应用]大模型让机器人自学常识:无需人类,自我纠正,完成复杂家务劳动[6P] [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106152
金币
1984
道行
19523
原创
29307
奖券
17275
斑龄
190
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 20018(小时)
注册时间: 2007-11-29
最后登录: 2024-11-22
— 本帖被 兵马大元帅 执行加亮操作(2024-04-08) —

机器人是出色的人类模仿者,但大多离不开人类的帮助,比如一些预设的编程。
尤其是家用机器人,在面对复杂的家务劳动时,如果“大脑”中没有足够多的常识,就很难满足人类家庭的日常需求。
如今,在大型语言模型(LLMs)的驱动下,家用机器人已经可以掌握“常识性知识”,能够在没有人类的帮助下进行自我纠正,出色地完成复杂的家务劳动。
相关研究论文以“Grounding Language Plans in Demonstrations Through Counterfactual Perturbations”为题,以会议论文的形式已发表在人工智能(AI)顶会 ICLR 2024 上。

麻省理工学院(MIT)电气工程和计算机科学系博士 Yanwei Wang 为该研究论文的通讯作者。

他表示,模仿学习是实现家用机器人的主流方法。但是,如果机器人盲目地模仿人类的运动轨迹,微小的错误就会不断累积,最终导致执行过程中的其他错误。“有了我们的方法,机器人就能自我纠正执行错误,提高整体任务的成功率。”
让机器人掌握一点家务常识
从擦拭溢出物到端上食物,机器人正在学习如何完成越来越复杂的家务劳动。
实际上,许多家庭机器人都是通过模仿人类行为来学习的,它们被编程为复制人类指导它们完成的动作。
然而,由于以往的机器人不具备常识,除非人类工程师通过编程让它们适应每一个可能的碰撞和轻推,否则它们并不一定知道如何处理这些情况,就会从头开始执行任务。
或许,通过加入一些“常识性知识”,机器人可以在面对将它们推离训练轨道的情况时有所准备。
据论文描述,Yanwei 等人通过一个简单的日常任务验证了他们提出的方法的有效性。该任务看似非常简单,即从一个碗中舀出弹珠,然后倒入另一个碗中。

然而,在先前的方法中,为了让机器人完成这项任务,工程师往往会让机器人在一个流体轨迹上完成“舀”和“倒”的动作,并可能多次重复,让机器人模仿人类的一些示范动作。
问题是,虽然人类可能会一次性演示一项任务,但这项任务取决于一系列子任务或轨迹。例如,机器人必须先将手伸进碗里,然后才能舀水,在移动到空碗之前,它必须先舀起弹珠。如果机器人在这些子任务中的任何一个过程中受到推挤或犯错,那么它唯一的办法就是停下来,从头开始。
除非人类工程师明确标出每一个子任务,并为机器人编程或收集新的演示,从而让机器人从上述失败中恢复过来,在瞬间进行自我纠正。
“这种程度的规划非常繁琐,” Yanwei 说。
于是,在这项研究中,Yanwei 及其团队将机器人的运动数据与大型语言模型的“常识性知识”联系了起来。

他们使机器人能够从逻辑上将许多给定的家务任务解析为子任务,并对子任务中的干扰进行调整。基于此,机器人就能继续前进,而不必返回并从头开始执行任务。而且重要的是,人类工程师也不必为每一个可能出现的故障编写详细的修复程序。
据介绍,这些深度学习模型可以处理大量的文本库,并以此建立单词、句子和段落之间的联系。通过这些联系,大型语言模型可以根据它所学到的上一个词后面可能出现的词的类型生成新的句子。
另外,除了句子和段落之外,大型语言模型还能根据提示生成特定任务所涉及的子任务的逻辑列表。例如,如果被要求列出将弹珠从一个碗中舀到另一个碗中的动作,模型就可能会产生一系列动词,如“够”、“舀”、“运”和“倒”。

“大型语言模型可以使用自然语言告诉机器人如何完成任务的每一步。人类的连续演示就是这些步骤在物理空间中的体现,” Yanwei 说,“我们希望将两者联系起来,这样机器人就能自动知道自己处于任务的哪个阶段,并能自行重新规划和恢复。”
Yanwei 表示,他们的算法现在可以将远程操作系统收集的数据转化为强大的机器人行为,尽管有外部干扰,机器人仍能完成复杂的任务。
不足与展望
尽管这一方法能够使得机器人在没有人类的帮助下进行自我纠正,从而完成复杂的家务劳动,但也存在一定的局限性。
例如,虽然他们的方法不需要大量的人类演示,但它需要大量的试错和具有重置能力的环境,以便收集轨迹的任务成功标签。不过,研究团队表示,这种数据效率低下的问题可以通过主动学习来解决。
此外,促使大型语言模型为学习分类器找到合适的状态表示也需要一些技巧。在未来的工作中,他们希望以端到端的方式结合模式分类器来学习状态表示。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
102887
金币
1094266
道行
1951
原创
2163
奖券
2124
斑龄
28
道券
567
获奖
0
座驾
设备
摄影级
在线时间: 24713(小时)
注册时间: 2008-10-01
最后登录: 2024-11-23
只看该作者 沙发  发表于: 03-27
近年来,随着人工智能技术的飞速发展,大模型让机器人通过自学常识来完成复杂的家务劳动成为可能。这些大模型能够帮助机器人理解和执行人类语言中的指令,同时还能让它们在执行任务时自我纠正错误,提高效率和准确性。

这种技术的核心是使用大量的数据和深度学习算法来训练机器人。通过这种方法,机器人可以学会如何识别物体、理解语言和执行任务。例如,机器人可以通过观察人类如何完成某个任务的视频来学习如何做同样的事情。此外,机器人还可以通过与环境的互动来不断改进自己的技能。

大模型的一个关键优势是它们可以让机器人在没有人类干预的情况下自我纠正错误。这意味着机器人可以在执行任务时不断学习和改进,从而提高效率和准确性。这对于完成复杂的家务劳动来说非常重要,因为这些任务通常需要高度的灵活性和适应性。

然而,尽管大模型为机器人带来了巨大的潜力,但也存在一些挑战。例如,训练机器人需要大量的数据和计算资源。此外,机器人在执行任务时可能会遇到一些意想不到的问题,这需要人类进行干预和指导。

总的来说,大模型让机器人通过自学常识来完成复杂的家务劳动成为可能。随着技术的不断发展,我们有理由相信,未来机器人将在我们的日常生活中扮演更加重要的角色。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个