亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當前位置: 首頁 » 行業資訊 » 機器人»伯克利和Deepmind前赴后繼,只為教出一個會做家務的機器人?
   

伯克利和Deepmind前赴后繼,只為教出一個會做家務的機器人?

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2019-02-18   瀏覽次數:495
核心提示:文|腦極體新年伊始,伯克利就傳出新進展,他們教機器人做家務的能力更上一層樓了。在最新的論文中,伯克利介紹了他們是如何讓機
 

文|腦極體

新年伊始,伯克利就傳出新進展,他們教機器人做家務的能力更上一層樓了。

在最新的論文中,伯克利介紹了他們是如何讓機器學會讀懂人類的潛臺詞或未盡之意,而不是傻乎乎地按照字面意思或者獎勵系統來機械地運動。

舉個例子,當餐桌機器人上菜時,它會知道躲避酒柜,或者在停電等緊急情況下停止端盤子,而不是為了盡可能多地得到獎賞(端一個盤子系統會提供一個獎勵),而馬不停蹄地送盤子。甚至還可能直接把盤子打碎,這樣就可以獲得更多的“盤子”(獎勵)了……

反正我看到這個新聞時,第一反應是機器人可真笨啊,這么簡單的任務我兩歲的小侄子都會做。第二反應是伯克利教機器人做家務的執念也未免太深了吧!

之前還開發過引擎教機器人鋪床單、疊衣服、收拾桌面,總之,非要讓機器人摻和家務這件事不可。

想要挑戰家務技能的除了伯克利,還有Deepmind。去年2月,Deepmind就提出了一種新的學習范式“計劃輔助控制SAC-X”,來幫助機器人學會整理桌子和堆疊衣物。

前不久佐治亞理工學院的研究人員,也發表了新的強化學習算法,可以教會機器人穿衣服。

為什么這么多AI巨頭不約而同地走上了家務培訓的道路?未來我們能擁有《底特律》中卡拉小姐姐那樣溫柔能干的家政機器人嗎?本文就來嘗試解釋一下這些疑惑。

家務三十六計:家政機器人都掌握了哪些技能?

首先我們來看看,在這么多人類學霸、AI巨頭的助攻下,機器人都學會了哪些家務小技能。

先來說說“家政狂魔”伯克利。

早在去年,我們就解讀過伯克利的通用預測模型,它可以幫助機器人自主學習和掌握很多通用基礎技能,在此基礎上學習和預測主人的意圖和任務的共性,從而可以舉一反三執行廣泛的任務類別,成長為一個優秀的“家務多面手”。比如折疊短褲毛巾、挪移蘋果、整理桌面等等。

 

伯克利還推出了一個深度學習模型Dex-NET,基于角點檢測和抓取策略,讓機器人完成鋪床單這一艱巨任務。

最值得一提的是新的研究成果“偏好優化模型”。機器人不僅能完成通用任務,而且還能夠推斷出更優解,適應帶有隱藏條件的復雜現實環境。

比如在常規的“actor-critic”增強學習反饋機制中,主人要求機器人導航前往紫色的門,那么機器人就會選擇最短路徑(傳統意義上的最優解),而忽略這么做會打碎路上的花瓶。

因為機器人無法獲知,主人是否關心花瓶會不會被打碎。但如果機器人能自己模擬和演練過去發生過的行為軌跡,比如主人一直都繞著花瓶走,說明她是重視花瓶的完整狀態的,由此推斷出繞過花瓶是最有可能獲得獎勵、應該積極追求的目標。

機器人擁有洞察隱藏條件的能力,意味著它們可以從一種狀態中學習人類的偏好,系統無需事無巨細地列出所有現實環境中的因果聯系和條件,獎勵函數也不再是線性機械的,機器人可以自主模擬和學習過去的經驗,判斷和應對未知的動態環境。

對于做家務這個任務來說,判斷主人的喜好來進行作業,可以說是必殺技了。

與伯克利相比,Deepmind其實對醫療這種高精尖任務更感興趣。但這并不妨礙它在家政領域發光發熱。

Deepmind的“計劃輔助控制SAC-X”模型,就旨在幫助機器人學會探索和掌握家務方面的基本技能。就像嬰兒在爬行和走路之前必須發展出協調和平衡能力一樣,SAC-X也有助于幫助機器掌握幾種核心的視覺-運動技能。

比如運用模擬手臂,按照正確的順序,即使沒有見過這各任務,也能從零開始學習,并按要求順利地把物體舉起來。這樣就能在無需額外編程的前提下,完成整理桌面這樣的復雜任務。

此外,喬治亞理工學院將布料引入學習框架,教機器人學會穿衣服的論文也非常別出心裁。

因為衣服的布料材質各不相同,穿衣服的動作也無法遵循特定的運動軌跡,會和布料產生復雜的交互變化,機器人必須不斷練習,對各個子任務(拽起邊緣、扯平衣角等)進行模擬和優化,在不斷變化的環境條件中學習到穩定的創意控制策略,最終完成穿不同衣服的任務目標。無論襯衫、套頭毛衣,還是外套,都是妥妥滴!

聽起來,好像大部分家務活兒機器人都可以駕馭嘛,但杯具的是,現實中能夠見到的家務機器人,干起活來依然是一副又慢又笨的蠢樣子。

比如由伯克利設計、Rethink Robotics公司開發的家庭助手,疊一個毛巾就要15分鐘;而加州 FoldiMate推出的智能洗疊機器,可以按照程序把衣服疊成需要的方塊,但需要人手動放置在展臺上,并沒有節省多少人力,售價還高達980美金(約7000塊人民幣)……emmmm還是自己動手豐衣足食吧。

不是比人慢,就是比人貴,靠機器人做家務性價比實在是太低了。那么,既然不能真的幫人類做家務,教機器人學習這些技能,究竟有何意義?

為什么是做家務,去工廠搬磚不行嗎?

這么多研究人才齊上陣,要是去教小學生,怕是都能考上清華了。實在不行,去工廠搬磚也能緩解下勞動力緊張啊,干嘛非要跟家務活兒較勁呢?

原因恐怕在于,家政任務提供了一個從零開始學習復雜控制任務的訓練環境,這對通用機器智能來說至關重要。

首先,家政任務的真實性和多樣性,有助于智能體學會如何用最少的先驗知識來解決復雜問題。

先驗知識指的是一種不依賴于經驗總結(類似編寫好的程序,從結果推導過程)的一種元能力,通過觀察學會推理和判斷。而機器人就沒有這種“天生的”知識,但顯然我們也不可能將機器人服務的每個家庭、每個可能任務都進行預先編程,這時,訓練機器人的通用能力就顯得尤為關鍵了。

盡管機器永遠不可能擁有像人一樣的先驗能力和通用性,在各個學科、各個工作崗位都能表現差不多。但在很多垂直領域,比如工業、家務、語言等,先驗能力強的機器智能體就可以低成本、高適應性、靈活地完成工作任務,解決那些現在只有人才能解決的問題。

另外,家政任務是一個集視覺、觸覺、運動、關節控制等為一體的任務,綜合性很強,這是其他碎片應用不具備的環境,對訓練多元功能協作的智能體很有幫助。

比如伯克利教機器人從垃圾桶中拾取原本看不見的物體,就需要通過攝像頭采集深度圖像,形成模擬數據集,再利用該數據集訓練質量卷積神經網絡(GQ-CNN),對物體進行圖像分割,確定抓取嘗試成功的可能性,最后形成抓取成功概率最高的策略,再對夾持器關節進行實時精密控制,才能最終完成這一操作。一次訓練,多種收獲。

更重要的是,家務的操作環境比起工業機器人、電子游戲等,都更加松散,充滿變化,任務的主觀預期和隱藏含義更難界定和預測,無形中加大了訓練難度。與此同時,家政任務的訓練成本也比較低,也更容易為大眾所理解,社會效益和營銷價值雙豐收。

相比對機器狗拳打腳踢、在《Dota》中血虐真人玩家,讓機器做做家務簡直堪稱是最政治正確、價廉物美的訓練方式了。

醉翁之意:做完家務,這些研究還有什么用?

在家政機器人背后,實際隱含的是一種智能體創生的本質邏輯:在復雜的環境中自己探索出解決隨機和非結構化問題的合理方案,可以安全地與環境交互,同時高效地完成任務。

具體一點說,訓練家政機器人,主要有一下三個方面的好處:

一是培養更具有通用智能的機器人,在不需要過多指導的前提下,執行一系列任務,提高機器自動化的安全性和工作效率。

二是有助于開發用于分層規劃、感知和推理的算法,可以幫助自動駕駛、工業自動化、智能物聯網等等領域解決應用問題;

三是推動零樣本學習、少樣本學習等技術的進步。在缺乏外部獎勵信號的情況下,算法也能很好地推理出行為的意圖,可以顯著提升電商、內容產品推薦系統的使用體驗。

這樣,大家恐怕就不難理解,為什家務會成為通用智能體成長道路上無法繞過的“墊腳石”了。

最后可能還有人想問:不愛做家務星人,我只關心機器人啥時候能進我家給我疊被鋪床?我只能說:親親這邊建議直接睡覺呢夢里什么都有。

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
網站首頁 | 網站地圖 | 排名推廣 | 廣告服務 | 積分換禮 | 網站留言 | RSS訂閱
主站蜘蛛池模板: 上海电子秤厂家,电子秤厂家价格,上海吊秤厂家,吊秤供应价格-上海佳宜电子科技有限公司 | 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | uv固化机-丝印uv机-工业烤箱-五金蚀刻机-分拣输送机 - 保定市丰辉机械设备制造有限公司 | 旗杆生产厂家_不锈钢锥形旗杆价格_铝合金电动旗杆-上海锥升金属科技有限公司 | 万博士范文网-您身边的范文参考网站Vanbs.com| 电动球阀_不锈钢电动球阀_电动三通球阀_电动调节球阀_上海湖泉阀门有限公司 | 上海深蓝_缠绕机_缠膜机-上海深蓝机械装备有限公司 | 悬浮拼装地板_幼儿园_篮球场_悬浮拼接地板-山东悬浮拼装地板厂家 | SMN-1/SMN-A ABB抽屉开关柜触头夹紧力检测仪-SMN-B/SMN-C-上海徐吉 | 交联度测试仪-湿漏电流测试仪-双85恒温恒湿试验箱-常州市科迈实验仪器有限公司 | 户外健身路径_小区健身器材_室外健身器材厂家_价格-浩然体育 | 并离网逆变器_高频UPS电源定制_户用储能光伏逆变器厂家-深圳市索克新能源 | 播音主持培训-中影人教育播音主持学苑「官网」-中国艺考界的贵族学校 | 砍排机-锯骨机-冻肉切丁机-熟肉切片机-预制菜生产线一站式服务厂商 - 广州市祥九瑞盈机械设备有限公司 | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 江西自考网-江西自学考试网| 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 杭州中央空调维修_冷却塔/新风机柜/热水器/锅炉除垢清洗_除垢剂_风机盘管_冷凝器清洗-杭州亿诺能源有限公司 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 四合院设计_四合院装修_四合院会所设计-四合院古建设计与建造中心1 | 天长市晶耀仪表有限公司 | 一体化污水处理设备,一体化污水设备厂家-宜兴市福源水处理设备有限公司 | 希望影视-高清影视vip热播电影电视剧免费在线抢先看 | 软文推广发布平台_新闻稿件自助发布_媒体邀约-澜媒宝 | 电解抛光加工_不锈钢电解抛光_常州安谱金属制品有限公司 | 湖南自考_湖南自学考试| 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 机床主轴维修|刀塔维修|C轴维修-常州翔高精密机械有限公司 | 苏州工作服定做-工作服定制-工作服厂家网站-尺品服饰科技(苏州)有限公司 | 亿诺千企网-企业核心产品贸易 | 南京泽朗生物科技有限公司-液体饮料代加工_果汁饮料代加工_固体饮料代加工 | 阴离子_阳离子聚丙烯酰胺厂家_聚合氯化铝价格_水处理絮凝剂_巩义市江源净水材料有限公司 | 钢丝绳探伤仪-钢丝绳检测仪-钢丝绳探伤设备-洛阳泰斯特探伤技术有限公司 | 登车桥动力单元-非标液压泵站-非标液压系统-深圳市三好科技有限公司 | 美国查特CHART MVE液氮罐_查特杜瓦瓶_制造全球品质液氮罐 | 铸铝门厂家,别墅大门庭院大门,别墅铸铝门铜门[十大品牌厂家]军强门业 | 考勤系统_人事考勤管理系统_本地部署BS考勤系统_考勤软件_天时考勤管理专家 | 卫生型双针压力表-高温防腐差压表-安徽康泰电气有限公司 | 滚珠丝杆升降机_螺旋升降机_丝杠升降机-德迈传动| 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 |