人工智能让机器人变得更聪明

Mitch Leslie

工程(英文) ›› 2024, Vol. 40 ›› Issue (9) : 1 -3.

PDF (952KB)
工程(英文) ›› 2024, Vol. 40 ›› Issue (9) : 1 -3. DOI: 10.1016/j.eng.2024.07.015
新闻热点

人工智能让机器人变得更聪明

作者信息 +

Robots Get Smarter with Help from Artificial Intelligence

Author information +
文章历史 +
PDF (974K)

引用本文

引用格式 ▾
Mitch Leslie. 人工智能让机器人变得更聪明[J]. 工程(英文), 2024, 40(9): 1-3 DOI:10.1016/j.eng.2024.07.015

登录浏览全文

4963

注册一个新账户 忘记密码

2023年,纽约市22户居民参加了一项不寻常的实验。在数小时的体验中,他们使用一款配备iPhone的抓取器来完成各种日常家务。这种抓取器常用于捡拾垃圾和帮助行动不便的人抓取难以触及的物品(图1)[12]。志愿者们进行了一些简单的家务活动,如开关门、捡起垃圾袋、打开烤面包机、开关电灯和整理沙发垫等。与此同时,iPhone会记录下抓取器的动作视频,并测量其位置和方向[1]。
这项练习是美国纽约大学计算机科学助理教授Lerrel Pinto及其同事所进行研究的一部分,旨在收集数据,使机器人能够学习同样的任务。研究人员将这些数据输入到他们自主研发的神经网络人工智能(AI)系统中,该系统仅需少量示例便能推断出109项研究任务中每一项所需执行的动作,并生成操作指令,指导机器人来模仿这些动作。为了检验系统的学习效果,科学家将一个名为Stretch的机器人带到另外十个家庭中进行测试。Stretch机器人由美国加利福尼亚州马丁内斯的Hello Robot公司制造。Stretch机器人配备车轮,可以灵活移动,并配备了一条可伸展的机械臂,机械臂末端装有类似手指的夹持器(见图2)。在这十个家庭中,Stretch机器人完成109项任务的平均成功率为81%,其中单个任务的成功率与任务的复杂性间接相关[1]。
Pinto和他的团队只是众多致力于利用AI提高机器人性能的团队之一。这一领域正在蓬勃发展。Pinto表示:“机器人学习领域正在快速发展,每隔几个月就会有新的、令人兴奋的事情发生。”AI使机器人能够学习烹饪[3]、踢足球[4]、交谈[5]以及进行其他日常活动。与学术研究人员一道,许多初创企业和老牌科技公司,如谷歌(美国加利福尼亚州山景城)和电动汽车制造商特斯拉(美国得克萨斯州奥斯汀市),都在致力于开发更智能、适应性更强的机器人,这些机器人具备实用的技能[67]。如果他们成功了,新一代的学习型机器人不仅可以出现在工厂和其他工作场所,还可以走进千家万户,帮助用户折叠衣物、整理杂乱的房间并承担其他家务[8]。然而,这些机器人目前仍停留在示范阶段,距离成为支持者们所设想的无处不在的智能家居设备,可能还需要很多年。
研究人员转向AI是因为如今的机器人太过机械化了。无论是在餐厅送餐、在仓库堆放货物,还是进行景观调查[9],它们基本上都只能按照既定程序,在特定情况下执行所设定的动作[10]。因此,机器人擅长在受限环境中执行特定任务,但面对新奇和不确定性时则显得力不从心。Shikhar Bahl最近在美国宾夕法尼亚州匹兹堡的卡内基梅隆大学(Carnegie Mellon University,CMU)完成了机器人学博士学位,现在是CMU的AI研究员。他说,面对不熟悉的情况,“它们会不知所措”。他希望通过赋予机器人学习能力,使其能够“在非结构化环境中运行并处理那些并未明确编程的事情”。
某些形式的AI的学习能力已迅速提升。在过去的几年中,大型语言模型(LLM)为OpenAI(美国加利福尼亚州旧金山)的ChatGPT和Microsoft(美国华盛顿州雷德蒙)的Copilot等聊天机器人提供了强大的支持,使其运行速度更快、功能更强大[1112]。视觉AI模型在检测和识别照片及视频中的物体方面也已变得更加熟练[13]。
Pinto说,机器人技术发展滞后,其中一个原因是数据稀缺,“AI模型需要大量数据来训练”。但这对LLM而言并非限制。LLM能够利用维基百科、新闻文章、书籍甚至YouTube视频转录等海量信息进行训练。同样,视觉模型也能从互联网上的海量图像和视频库中学习[14]。但是,用于训练机器人AI模型的相对较大的数据源并不容易获得。目前,各方正在努力解决这个问题。例如,谷歌旗下的AI子公司DeepMind(英国伦敦)和33组学术研究人员推出了Open X-Embodiment,这是一个免费开放的机器人数据存储库[15]。这些数据详细描述了22种机器人(包括单臂操作机器人Stretch和类狗机器人)在执行各种动作时的运动情况。
尽管如此,收集的数据仅占可用于训练LLM的全部数据的一小部分,因此研究人员往往需要自行收集数据,例如,要求用户携带装有iPhone的抓取器在家中四处走动,进行数据收集。纽约大学团队的方法有一些优势。抓取器上的iPhone可提供工具的六维数据,包括运动和旋转[1],这为机器人学习提供了丰富信息来源。数据收集成本相对较低,每个抓取器的成本只需25美元。但以这种方式收集数据略显烦琐。
另一组研究人员利用大约100个烹饪演示视频来训练他们的机器人AI。2023年,Bahl、CMU机器人学博士生Russell Mendonca以及他们的导师、计算机科学助理教授Deepak Pathak组成的团队首次推出了一款机器人AI系统。该系统能够从在线视频中学习烹饪技能,这些视频展示了人们进行切割、倾倒、揉捏和切碎等常见烹饪活动[16]。然而,通过人类视频来训练机器人并非易事,因为人和机器人在完成特定任务时,动作不可能完全相同。该小组的AI系统通过观察视频中人的手部动作,预测这些动作的结果,并将其分析转化为指导机器人实现特定目标的方向,从而学习如何与物体进行交互。例如,AI模型从视频中推断出拿起一把刀需要抓住刀柄的特定部位,并能够详细描述正确的动作,从而指导机器人抓住刀柄而非刀刃。通过使用一个包含塑料器具和食物的测试厨房,研究小组证明,使用人类烹饪视频进行训练极大地提升了机器人执行一系列任务时的表现。例如,经过训练的机器人有大约90%的概率能够打开抽屉,而未经训练的机器人仅有大约10%的概率能够打开抽屉[16]。
研究人员也在研发能够通过强化学习自主掌握技能的机器人,这与人们训练狗的方式颇为相似[17]。如果狗能正确完成某个指令,它可能会得到奖励。同样地,如果机器人能出色地完成任务,它也会获得奖励,如来自人工评审员或自动评估系统的正面评分。强化学习的价值在于,它能帮助机器人在无需人工教导的情况下掌握技能[18]。
AI机器人的杀手级应用可能是帮助人们做家务[8,19]。该领域的许多研究人员都认为,市场需要能够承担繁重家务的家用机器人。例如,Pinto认为这个市场是存在的,并已在美国纽约市成立了一家名为Fauna Robotics的公司来开发这类机器人。iRobot公司(美国马萨诸塞州贝德福德)生产的Roombas系列扫地机器人销量已达数千万台。Roombas可以在家中自主导航,且其最新型号的AI辅助功能日益增强[20]。Mendonca表示,开发家用机器人的另一个原因是,家庭环境是检验机器人能力的良好场所,“如果机器人能在孩子房间杂乱无章的地板上自主导航并捡起物品,那么它就能在更有序的环境中轻松完成任务”。
到目前为止,具备学习能力的机器人已经展现了令人惊叹的多种技能,但一些演示也揭示了它们的不足。在未公开的视频中,机器人会丢下手中的物品、误认日常物品、迷路,甚至犯下其他错误。它们笨拙、缓慢且昂贵。Bahl表示,由于精细运动技能有限,它们很难使用工具。“我们正在不断进步,但仍有很长的路要走。”不过,他补充道,“与三四年前相比,我们所取得的进步已让我感到惊讶。”
这样的进步速度能让智能机器人迅速进入市场吗?有人持乐观态度。特斯拉首席执行官Elon Musk曾表示,该公司的人形机器人Optimus有望在2025年年底前推向市场(图3)[7]。然而, Optimus的具体功能尚不明确,且其性能展示也遭到了批评者的质疑[2122]。
特斯拉能否实现其目标仍有待观察。但那些致力于研发更智能、功能更强大的机器人的研究人员却迫不及待地想让这些机器人走出实验室,走进家庭和企业。Pinto说:“我希望它们现在就能成为我们生活的一部分。”

参考文献

[1]

Shafiullah NM, Rai A, Etukuru H, Liu Y, Misra I, Chintala S, et al. On bringing robots home. 2023. arXiv:

[2]

Williams R. This new system can teach a robot a simple household task within 20 minutes [Internet]. Cambridge: MIT Technology Review; 2023 Dec 14 [cited 2024 Jun 1]. Available from:

[3]

Heikkilä M. Watch this robot cook shrimp and clean autonomously [Internet]. Cambridge: MIT Technology Review; 2024 Jan 15 [cited 2024 Jun 1]. Available from:

[4]

Hutson M. Reinforcement learning AI might bring humanoid robots to the real world [Internet]. Washington, DC: Science News; 2024 May 24 [cited 2024 Jun 1]. Available from:

[5]

Ortiz S. Figure’s humanoid robot can have a full conversation with you. Watch for yourself [Internet]. New York City: ZDNET; 2024 Mar 14 [cited 2024 Jun 1]. Available from:

[6]

Gibney E. The AI revolution is coming to robots: how will it change them? Nature 2024;630:22‒4. . 10.1038/d41586-024-01442-5

[7]

Hart R. Elon Musk says Tesla’s Optimus robot could drive company to $25 trillion valuation—here’s what experts think [Internet]. New York City: Forbes; 2024 Jun 14 [cited 2024 Jun 1]. Available from:

[8]

Heikkilä M. Is robotics about to have its own ChatGPT moment? [Internet]. Cambridge: MIT Technology Review; 2024 Apr 11 [cited 2024 Jun 1]. Available from:

[9]

Lillywhite M. M5 drivers in somerset may spot robotic dog on side of road [Internet]. London: BBC News; 2024 Feb 16 [cited 2024 Jun 1]. Available from:

[10]

Berreby D. Scientists are putting ChatGPT brains inside robot bodies. What could possibly go wrong? [Internet]. New York City: Scientific American; 2024 Mar 1 [cited 2024 Jun 1]. Available from:

[11]

Large language models are getting bigger and better [Internet]. London: The Economist; 2024 Apr 18 [cited 2024 Jun 1]. Available from: 10.1007/s10676-024-09779-1

[12]

Mackenzie D. Surprising advances in generative artificial intelligence prompt amazement—and worries. Engineering 2023;25:9‒11. . 10.1016/j.eng.2023.04.004

[13]

What is computer vision? [Internet]. Armonk: IBM; [cited 2024 Jun 1]. Available from:

[14]

Metz C, Kang C, Frenkel S, Thomson SA, Grant N. How tech giants cut corners to harvest data for AI [Internet]. New York City: New York Times; 2024 Apr 8 [cited 2024 Jun 1]. Available from:

[15]

Vuong Q, Sanketi P. Scaling up learning across many different robot types [Internet]. London: Google DeepMind; 2023 Oct 3 [cited 2024 Jun 1]. Available from:

[16]

Mendonca R, Bahl S, Pathak D. Structured world models from human videos. 2023. arXiv: 10.15607/rss.2023.xix.012

[17]

Williams R. How AI taught Cassie the two-legged robot to run and jump [Internet]. Cambridge: MIT Technology Review; 2024 Mar 18 [cited 2024 Jun 1]. Available from:

[18]

Heikkilä M. This robot dog just taught itself to walk [Internet]. Cambridge: MIT Technology Review; 2022 Jul 18 [cited 2024 Jun 1]. Available from:

[19]

Heaven WD. Robots that learn as they fail could unlock a new era of AI [Internet]. Cambridge: MIT Technology Review; 2023 Sep 12 [cited 2024 Jun 1]. Available from:

[20]

Heinlein S. The best robot vacuums [Internet]. New York City: New York Times; 2024 June 20 [cited 2024 Jun 1]. Available from:

[21]

Mann J. Elon Musk’s optimism about Optimus might be misplaced [Internet]. New York City: Business Insider; 2024 Jan 25 [cited 2024 Jun 6]. Available from:

[22]

DaSilva A. Tesla is staking its future on this painfully slow robot [Internet]. Durham: Jalopnik; 2024 May 7 [cited 2024 Jun 6]. Available from:

AI Summary AI Mindmap
PDF (952KB)

2640

访问

0

被引

详细

导航
相关文章

AI思维导图

/