谷歌 DeepMind 推出無(wú)需監(jiān)督即可自學(xué)的人工智能機(jī)器人|微速訊

2023-06-27 12:16:14　　來(lái)源：站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com) 6月26日消息:機(jī)器人正迅速成為我們?nèi)粘Ｉ畹囊徊糠郑鼈兺ǔＶ槐痪幊虂?lái)完成特定的任務(wù)。盡管利用人工智能的最新進(jìn)展可能會(huì)導(dǎo)致機(jī)器人在更多方面發(fā)揮幫助作用，但構(gòu)建通用機(jī)器人的進(jìn)展較慢，部分原因是需要收集現(xiàn)實(shí)世界的培訓(xùn)數(shù)據(jù)。

(資料圖)

日前谷歌 DeepMind 最新的論文介紹了一種自我改進(jìn)的機(jī)器人人工智能代理程序，名為 RoboCat，它學(xué)習(xí)執(zhí)行不同機(jī)械臂上的各種任務(wù)，然后自動(dòng)生成新的訓(xùn)練數(shù)據(jù)來(lái)改善其技術(shù)。

DeepMind 表示，先前的研究探索了如何開(kāi)發(fā)能夠按比例學(xué)習(xí)多項(xiàng)任務(wù)并將語(yǔ)言模型的理解能力與協(xié)助機(jī)器人的現(xiàn)實(shí)能力相結(jié)合的機(jī)器人。RoboCat 是第一個(gè)解決并適應(yīng)于多個(gè)任務(wù)，并在不同的真實(shí)機(jī)器人上完成的代理程序。

RoboCat 學(xué)習(xí)速度比其他最先進(jìn)的模型快得多。它可以通過(guò)僅使用 100 個(gè)演示來(lái)掌握新任務(wù)，因?yàn)樗揽看罅亢投鄻踊臄?shù)據(jù)集。這種能力將有助于加速機(jī)器人學(xué)研究，因?yàn)樗鼫p少了人工監(jiān)督培訓(xùn)的需求，并是創(chuàng)建通用機(jī)器人的重要一步。

DeepMind 的研究科學(xué)家兼 RoboCat 團(tuán)隊(duì)成員之一的 Alex Lee 在接受 TechCrunch 的電子郵件采訪時(shí)表示：「我們證明了一個(gè)單一的大型模型可以在多個(gè)真實(shí)機(jī)器人實(shí)體上解決各種不同的任務(wù)，并能夠快速適應(yīng)新的任務(wù)和實(shí)體。」

RoboCat 是受 Gato 啟發(fā)而開(kāi)發(fā)的，Gato 是 DeepMind 的一個(gè)人工智能模型，可以分析和處理文本、圖像和事件。RoboCat 使用在模擬和現(xiàn)實(shí)生活中收集的圖像和行動(dòng)數(shù)據(jù)進(jìn)行訓(xùn)練。Lee 表示，這些數(shù)據(jù)來(lái)自虛擬環(huán)境中其他控制機(jī)器人模型、人類控制機(jī)器人以及之前的 RoboCat 模型的組合。

為了訓(xùn)練 RoboCat，DeepMind 的研究人員首先收集了 100 到 1000 個(gè)由人類控制的機(jī)器人臂執(zhí)行任務(wù)的示范。然后，他們?cè)谠撊蝿?wù)上對(duì) RoboCat 進(jìn)行了微調(diào)，創(chuàng)建了一個(gè)專門的「分支」模型，平均訓(xùn)練了該任務(wù) 1 萬(wàn)次。

利用分支模型生成的數(shù)據(jù)和示范數(shù)據(jù)，研究人員不斷擴(kuò)充了 RoboCat 的訓(xùn)練數(shù)據(jù)集，并訓(xùn)練了后續(xù)的新版本 RoboCat。

RoboCat 的最終版本在模擬和實(shí)際世界中的 141 種不同變體的任務(wù)集上進(jìn)行了訓(xùn)練，總共涵蓋了 253 個(gè)任務(wù)。DeepMind 聲稱，在觀察了數(shù)小時(shí)的人類控制示范后，RoboCat 學(xué)會(huì)了操作不同的機(jī)器人臂。

雖然 RoboCat 在四種帶有雙爪臂的機(jī)器人上進(jìn)行了訓(xùn)練，但該模型能夠適應(yīng)一個(gè)帶有三指夾爪和兩倍可控輸入的更復(fù)雜的臂。

盡管在 DeepMind 的測(cè)試中，RoboCat 在不同任務(wù)上的成功率差異很大，從最低 13% 到最高 99%。這是在訓(xùn)練數(shù)據(jù)中有 1000 個(gè)示范的情況下；當(dāng)示范數(shù)量減少一半時(shí)，成功率可預(yù)見(jiàn)地較低。

然而，在某些場(chǎng)景中，DeepMind 聲稱 RoboCat 只需 100 個(gè)示范就能學(xué)會(huì)新任務(wù)。

Lee 補(bǔ)充說(shuō)：「通過(guò)提供有限數(shù)量的示范來(lái)進(jìn)行新任務(wù)的微調(diào)，RoboCat 可以自動(dòng)生成更多數(shù)據(jù)以進(jìn)一步改進(jìn)。」未來(lái)，研究團(tuán)隊(duì)的目標(biāo)是將 RoboCat 學(xué)習(xí)完成新任務(wù)所需的示范數(shù)量降低到 10 個(gè)以下。

閱讀DeepMind在 arXiv 上的論文：https://arxiv.org/abs/2306.11706

關(guān)鍵詞：

相關(guān)新聞

谷歌 DeepMind 推出無(wú)需監(jiān)督即可自學(xué)的人工智能機(jī)器人|微速訊(2023-06-27 12:16:14)
雙峰縣多部門聯(lián)合開(kāi)展燃?xì)忸I(lǐng)域消防安全專項(xiàng)檢查(2023-06-27 12:20:55)
環(huán)球最新：中國(guó)女籃戰(zhàn)勝黎巴嫩奪得亞洲杯開(kāi)門紅(2023-06-27 12:15:21)
央行在港發(fā)行6個(gè)月期央票(2023-06-27 12:34:54)
夏季達(dá)沃斯論壇即將舉行天津準(zhǔn)備好了_環(huán)球微資訊(2023-06-27 12:27:04)
6月26日MB鈷報(bào)價(jià) 天天速讀(2023-06-27 12:23:50)
天天熱推薦：6月27日生意社低合金板基準(zhǔn)價(jià)為4092.00元/噸(2023-06-27 12:38:20)
“教育＋數(shù)字化”來(lái)了看這些學(xué)校做了哪些探索-環(huán)球報(bào)道(2023-06-27 12:15:59)
天天快看點(diǎn)丨暑期將至，警惕網(wǎng)紅式旅游的奪命陷阱(2023-06-27 12:28:11)
當(dāng)前速遞！張雪峰因身體原因住院，經(jīng)紀(jì)人回應(yīng)：身體狀況無(wú)大礙(2023-06-27 12:26:54)
天津?yàn)I海建投5億元超短期融資券完成發(fā)行利率6.9%|天天新消息(2023-06-27 12:17:43)
今期特馬望二九指什么生肖，今期二九猜一猜代表什么生肖(2023-06-27 12:28:39)
昆明5歲男童身上出現(xiàn)淤青，有時(shí)還打自己嘴巴…涉事教師已被開(kāi)除|每日短訊(2023-06-27 12:31:11)
端午消費(fèi)：“熱浪”迭起 “煥新”不斷(2023-06-27 12:30:29)
機(jī)器人工程技術(shù)人員：讓機(jī)器人“吃”得更少　“干”得更多_全球要聞(2023-06-27 12:13:08)
世界球精選！京東方：將采用高通智能視頻協(xié)作平臺(tái) 打造沉浸式會(huì)議解決方案(2023-06-27 12:31:44)
春興精工：目前公司為特斯拉主要提供接線母排產(chǎn)品_世界觀察(2023-06-27 12:34:11)
哈焊華通：連續(xù)5日融資凈買入累計(jì)1826.35萬(wàn)元（06-26）全球快報(bào)(2023-06-27 12:19:20)
小米王化：小米汽車14.99萬(wàn)起售為假消息(2023-06-27 12:24:24)
利用系統(tǒng)停更來(lái)拔掉“釘子戶”，已經(jīng)成了所有手機(jī)廠商的共識(shí) 世界快訊(2023-06-27 12:26:37)
瀝青基本面稍顯乏力純堿市場(chǎng)整體處于供需緊平衡狀態(tài)|當(dāng)前資訊(2023-06-27 12:18:54)
今日熱文：健美操串詞主持詞（健美操串詞）(2023-06-27 12:11:38)
焦點(diǎn)消息！梅林新區(qū)幼兒園（梅州高新區(qū)新藍(lán)天幼兒園）(2023-06-27 12:13:11)
或成最后一款燃油車型！懸掛有所提升，大眾探歌原型車路試曝光全球焦點(diǎn)(2023-06-27 12:25:17)
「及時(shí)語(yǔ)」獲數(shù)千萬(wàn)元Pre-A+輪融資，專注打造跨境出海智能客服平臺(tái)-環(huán)球精選(2023-06-27 12:10:14)
每日酒企動(dòng)態(tài) | 茅臺(tái)將派發(fā)現(xiàn)金紅利325.49億元；劉楊出任郎酒股份副總經(jīng)理(2023-06-27 12:19:08)
金科股份：未能按期足額兌付“20金科地產(chǎn)MTN002”本息_天天視點(diǎn)(2023-06-27 12:32:57)
22球11助攻，僅600萬(wàn)！皇馬又施壓：除了姆巴佩，20歲新梅西也要(2023-06-27 12:16:41)
CBA黃牛遭重罰一人獲利超9萬(wàn)追繳+行拘13天倒賣總決賽門票違法(2023-06-27 12:14:30)
天天熱文：寧波首批百名中職專業(yè)課教師脫產(chǎn)到企實(shí)踐——帶項(xiàng)目入企解實(shí)踐難題(2023-06-27 12:19:57)

圖閱

谷歌 DeepMind 推出無(wú)需監(jiān)督

雙峰縣多部門聯(lián)合開(kāi)展燃?xì)忸I(lǐng)域

環(huán)球最新：中國(guó)女籃戰(zhàn)勝黎巴嫩

央行在港發(fā)行6個(gè)月期央票

夏季達(dá)沃斯論壇即將舉行天津

6月26日MB鈷報(bào)價(jià) 天天速讀
天天熱推薦：6月27日生意社低

“教育＋數(shù)字化”來(lái)了看這些

天天快看點(diǎn)丨暑期將至，警惕網(wǎng)

當(dāng)前速遞！張雪峰因身體原因住

天津?yàn)I海建投5億元超短期融資

今期特馬望二九指什么生肖，今

每日推薦

昆明5歲男童身上出現(xiàn)淤青，有時(shí)還打自己嘴

近日，昆明市民謝先生向媒體反映，從今年5月份開(kāi)始，他5歲的兒子羊羊（
端午消費(fèi)：“熱浪”迭起 “煥新”不斷

原標(biāo)題：端午消費(fèi)：“熱浪”迭起“煥新”不斷國(guó)際商報(bào)記者邵志媛端午臨
機(jī)器人工程技術(shù)人員：讓機(jī)器人“吃”得更少

機(jī)器人工程技術(shù)人員：讓機(jī)器人“吃”得更少　“干”得更多---寬敞的物
世界球精選！京東方：將采用高通智能視頻協(xié)

【京東方：將采用高通智能視頻協(xié)作平臺(tái)打造沉浸式會(huì)議解決方案】近日，
春興精工：目前公司為特斯拉主要提供接線母

春興精工：目前公司為特斯拉主要提供接線母排產(chǎn)品
哈焊華通：連續(xù)5日融資凈買入累計(jì)1826.35萬(wàn)

2023年6月26日哈焊華通連續(xù)5日融資凈買入累計(jì)1826 35萬(wàn)元
小米王化：小米汽車14.99萬(wàn)起售為假消息

小米公關(guān)負(fù)責(zé)人王化在其微博上表示，傳聞稱“小米汽車14 99萬(wàn)元起售、
利用系統(tǒng)停更來(lái)拔掉“釘子戶”，已經(jīng)成了所

官方原本表示可以升級(jí)到安卓4 0系統(tǒng)的，但后來(lái)又表示安卓4 0變化太大，
瀝青基本面稍顯乏力純堿市場(chǎng)整體處于供需

原油油價(jià)短期維持震蕩周一美國(guó)WTI原油上漲0 53%，報(bào)收于69 53美元桶。
今日熱文：健美操串詞主持詞（健美操串詞）

來(lái)為大家解答以下的問(wèn)題，美操串詞主持詞，健美操串詞這個(gè)很多人還不知