韓寒代筆門結(jié)果是什么？韓寒真的找人代筆么？
釜山行孕婦才是最大的惡人？喪尸片釜山行免費(fèi)完整觀看
關(guān)于雪的歌曲有哪些？關(guān)于風(fēng)的歌曲有哪些？
歐美電影排行榜最新電影歐美電影推薦榜前十名
蝸居主題曲全部歌曲《我想大聲告訴你》好聽嗎？
《慶余年2》官宣開機(jī) 張若昀、李沁、陳道明、郭麒麟等原班人馬你開心嗎
《漫長的季節(jié)》開播9.1 范偉、秦昊、陳明昊領(lǐng)銜主演
秦嵐新劇《燦爛的轉(zhuǎn)身》開播聚焦女性職場與情感視角
《君心難逑》開機(jī) 李沐宸王祖一領(lǐng)銜主演上演雙面宅斗甜爽復(fù)仇
楊紫瓊周邊價(jià)格暴漲官方簽名照在閑魚售價(jià)高達(dá)1000元
《青春正好》收官平實(shí)質(zhì)感引發(fā)大眾情感共鳴
《狂飆》熱播善與惡的選擇可能就在一念之間
春節(jié)檔題材特殊的商業(yè)片電影《無名》發(fā)布“別說話”預(yù)告
生活劇《打開生活的正確方式》定檔黃渤梅婷開啟中年圖鑒
《塵緣不神山》上線王櫟鑫、陳潔、徐可、翟藝舒等主演
《我們這十年》首播小人物奮斗故事講述大時(shí)代輝煌巨變
《聽見我的聲音》開播一起夢回酸酸甜甜又暗藏危險(xiǎn)的青春時(shí)代
《底線》《大考》等構(gòu)建主題與故事交相輝映的藝術(shù)新貌
《燕山派與百花門》將開播方逸倫、劉令姿、馬聞遠(yuǎn)、蘇曉彤主演
梁靖康《三悅有了新工作》開播相互治愈、相互溫暖并肩前行

谷歌 DeepMind 推出無需監(jiān)督即可自學(xué)的人工智能機(jī)器人環(huán)球關(guān)注

來源：站長之家 2023-06-26 13:46:18

站長之家(ChinaZ.com) 6月26日消息:機(jī)器人正迅速成為我們?nèi)粘Ｉ畹囊徊糠郑鼈兺ǔＶ槐痪幊虂硗瓿商囟ǖ娜蝿?wù)。盡管利用人工智能的最新進(jìn)展可能會導(dǎo)致機(jī)器人在更多方面發(fā)揮幫助作用，但構(gòu)建通用機(jī)器人的進(jìn)展較慢，部分原因是需要收集現(xiàn)實(shí)世界的培訓(xùn)數(shù)據(jù)。

日前谷歌 DeepMind 最新的論文介紹了一種自我改進(jìn)的機(jī)器人人工智能代理程序，名為 RoboCat，它學(xué)習(xí)執(zhí)行不同機(jī)械臂上的各種任務(wù)，然后自動(dòng)生成新的訓(xùn)練數(shù)據(jù)來改善其技術(shù)。

DeepMind 表示，先前的研究探索了如何開發(fā)能夠按比例學(xué)習(xí)多項(xiàng)任務(wù)并將語言模型的理解能力與協(xié)助機(jī)器人的現(xiàn)實(shí)能力相結(jié)合的機(jī)器人。RoboCat 是第一個(gè)解決并適應(yīng)于多個(gè)任務(wù)，并在不同的真實(shí)機(jī)器人上完成的代理程序。

(資料圖)

RoboCat 學(xué)習(xí)速度比其他最先進(jìn)的模型快得多。它可以通過僅使用 100 個(gè)演示來掌握新任務(wù)，因?yàn)樗揽看罅亢投鄻踊臄?shù)據(jù)集。這種能力將有助于加速機(jī)器人學(xué)研究，因?yàn)樗鼫p少了人工監(jiān)督培訓(xùn)的需求，并是創(chuàng)建通用機(jī)器人的重要一步。

DeepMind 的研究科學(xué)家兼 RoboCat 團(tuán)隊(duì)成員之一的 Alex Lee 在接受 TechCrunch 的電子郵件采訪時(shí)表示：「我們證明了一個(gè)單一的大型模型可以在多個(gè)真實(shí)機(jī)器人實(shí)體上解決各種不同的任務(wù)，并能夠快速適應(yīng)新的任務(wù)和實(shí)體。」

RoboCat 是受 Gato 啟發(fā)而開發(fā)的，Gato 是 DeepMind 的一個(gè)人工智能模型，可以分析和處理文本、圖像和事件。RoboCat 使用在模擬和現(xiàn)實(shí)生活中收集的圖像和行動(dòng)數(shù)據(jù)進(jìn)行訓(xùn)練。Lee 表示，這些數(shù)據(jù)來自虛擬環(huán)境中其他控制機(jī)器人模型、人類控制機(jī)器人以及之前的 RoboCat 模型的組合。

為了訓(xùn)練 RoboCat，DeepMind 的研究人員首先收集了 100 到 1000 個(gè)由人類控制的機(jī)器人臂執(zhí)行任務(wù)的示范。然后，他們在該任務(wù)上對 RoboCat 進(jìn)行了微調(diào)，創(chuàng)建了一個(gè)專門的「分支」模型，平均訓(xùn)練了該任務(wù) 1 萬次。

利用分支模型生成的數(shù)據(jù)和示范數(shù)據(jù)，研究人員不斷擴(kuò)充了 RoboCat 的訓(xùn)練數(shù)據(jù)集，并訓(xùn)練了后續(xù)的新版本 RoboCat。

RoboCat 的最終版本在模擬和實(shí)際世界中的 141 種不同變體的任務(wù)集上進(jìn)行了訓(xùn)練，總共涵蓋了 253 個(gè)任務(wù)。DeepMind 聲稱，在觀察了數(shù)小時(shí)的人類控制示范后，RoboCat 學(xué)會了操作不同的機(jī)器人臂。

雖然 RoboCat 在四種帶有雙爪臂的機(jī)器人上進(jìn)行了訓(xùn)練，但該模型能夠適應(yīng)一個(gè)帶有三指夾爪和兩倍可控輸入的更復(fù)雜的臂。

盡管在 DeepMind 的測試中，RoboCat 在不同任務(wù)上的成功率差異很大，從最低 13% 到最高 99%。這是在訓(xùn)練數(shù)據(jù)中有 1000 個(gè)示范的情況下；當(dāng)示范數(shù)量減少一半時(shí)，成功率可預(yù)見地較低。

然而，在某些場景中，DeepMind 聲稱 RoboCat 只需 100 個(gè)示范就能學(xué)會新任務(wù)。

Lee 補(bǔ)充說：「通過提供有限數(shù)量的示范來進(jìn)行新任務(wù)的微調(diào)，RoboCat 可以自動(dòng)生成更多數(shù)據(jù)以進(jìn)一步改進(jìn)?！刮磥?，研究團(tuán)隊(duì)的目標(biāo)是將 RoboCat 學(xué)習(xí)完成新任務(wù)所需的示范數(shù)量降低到 10 個(gè)以下。

閱讀DeepMind在 arXiv 上的論文：https://arxiv.org/abs/2306.11706

（舉報(bào)）

關(guān)鍵詞

相關(guān)閱讀:

圖片新聞

世界視點(diǎn)！星空有約丨全國多地迎高溫天氣，

新華社天津6月25日電（記者周潤?。?月...
新華全媒+｜安全用氣，這些要點(diǎn)要記牢！

餐飲行業(yè)應(yīng)當(dāng)如何安全、規(guī)范地使用天然...
“600號”來信｜直面你的考試分?jǐn)?shù) 當(dāng)前最新

這幾天各地將陸續(xù)公布高考成績。無論是...
玉溪新平：熱區(qū)鄉(xiāng)村產(chǎn)業(yè)興拓寬群眾增收路

雪茄鮮煙葉統(tǒng)一晾制（6月15日攝）。吳浪...
勞模工匠進(jìn)校園活動(dòng)在工商學(xué)院舉行-全球即

6月15日，“中國夢勞動(dòng)美”勞模工匠進(jìn)校...

每日推薦

韩日午夜在线资源一区二区_成人AV综合在线网站_欧美亚洲日本国产黑白配_大臣们罚皇上带玉势上朝_全彩口工漫画无遮爱丽丝