亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當前位置: 首頁 » 行業資訊 » 機器人»深度學習要另起爐灶,徹底拋棄反向傳播?
   

深度學習要另起爐灶,徹底拋棄反向傳播?

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2017-09-30   瀏覽次數:823
核心提示:  在深度進修才開端風行然則沒有像現在這么成熟的時刻(2011 年),Hinton 等人就曾經開端思慮一個成績:深度進修依附的反向流傳算法 (back-prop) 在生物學上是很難成立的,很難信任神經體系可以或許主動構成與

  在深度進修才開端風行然則沒有像現在這么成熟的時刻(2011 年),Hinton 等人就曾經開端思慮一個成績:深度進修依附的反向流傳算法 (back-prop) 在生物學上是很難成立的,很難信任神經體系可以或許主動構成與正向流傳對應的反向流傳構造(這須要精準地求導數,對矩陣轉置,應用鏈式軌則,而且剖解學上歷來也沒有發明如許的體系存在的證據)。

  別的一點是,神經體系是有分層的(好比視覺體系有 V1, V2 等等分層),然則層數弗成能像如今的年夜型神經收集一樣動不動就成百上千層(并且生物學上也不支撐如斯,神經傳導速度很慢,不像用 GPU 盤算神經收集一層能夠在微秒量級,生物體系傳導一次普通在 ms 量級,這么多層數弗成能支撐我們如今如許的反響速度,而且同步也存在成績)。

  然則風趣的是,今朝年夜多半研討指出,年夜腦皮層中廣泛存在一種稱為 Cortical minicolumn 的柱狀構造,其外部含有上百個神經元,并存在分層。這意味著人腦中的一層其實不是相似如今神經收集的一層,而是有龐雜的外部構造。

深度學習要另起爐灶,徹底拋棄反向傳播?
深度學習要另起爐灶,徹底拋棄反向傳播?

  不外 Hinton 也沒有料到后來 CNN 成長的如斯火,他其時的這篇論文沒有怎樣遭到存眷。這幾年他也沒有持續存眷這個成績,由于 CNN,LSTM, NTM 等等成績太多太風趣。

  不外到如今,CNN 的成長仿佛到了一個瓶頸:特殊年夜,特殊深的收集;輕易被反抗樣本誘騙;依然須要年夜量練習數據;無監視進修方面停頓很少。

  Hinton 在題主給的視頻中從新剖析了一下今朝 CNN 的成績,重要集中在 Pooling 方面(我以為可以推行到下采樣,由于如今許多 CNN 用卷積下采樣取代 Pooling 層)。Hinton 以為,曩昔人們對 Pooling 的意見是可以或許帶來 invariance 的后果,也就是當內容產生很小的變更的時刻(和一些平移扭轉),CNN 依然可以或許穩固辨認對應內容。

  Hinton 認為這是一個毛病的偏向。他給出了一個心思學試驗的例子,這個例子請求斷定兩個 R 能否是一樣的,僅僅由于扭轉招致分歧:

深度學習要另起爐灶,徹底拋棄反向傳播?

  (簡直一切)人的做法是下認識的扭轉左邊的 R,“看” 它們能否重合。

  然則依照 CNN 的 invariance 的設法主意完整不是這么做。假如你對練習神經收集有經歷,你能夠會想到我們在做圖象預處置和數據拓增的時刻,會把某些圖片扭轉一些角度,作為新的樣本,給神經收集辨認。如許 CNN 可以或許做到對扭轉的 invarience,而且是 “直覺上” 的 invariance,基本不須要像人那樣去扭轉圖片,它直接就 “疏忽” 了扭轉,由于我們愿望它對扭轉 invariance。

  CNN 異樣強調對空間的 invariance,也就是對物體的平移之類的不敏感(物體分歧的地位不影響它的辨認)。這固然極年夜地進步了辨認準確率,然則關于挪動的數據(好比視頻),或許我們須要檢測物體詳細的地位的時刻,CNN 自己很難做,須要一些滑動窗口,或許 R-CNN 之類的辦法,這些辦法很失常(簡直確定在生物學中不存在對應構造),并且極難說明為何年夜腦在辨認靜態圖象和不雅察活動場景等差別很年夜的視覺功效時,簡直應用統一套視覺體系。

  是以 Hinton 以為,人腦做到的是 equivariance ,也就是可以或許檢測到平移、選轉等等各類差別,然則可以或許 “熟悉” 到他們在某些視覺成績場景下是雷同的,某些場景下應當有所差別,而不是像 CNN 一樣為了尋求單一的辨認率,用 invariance 掩飾這些差別。

  因而 Hinton 從新開端存眷 Capsules 的成績,愿望從中有所沖破,處理之前深度進修中的許多成績。假如確切可以或許處理這些成績,Hinton 有勇氣完整擯棄之前的系統構造,從 0 開端。

  這是 Hinton 比來被 NIPS 接收的關于 Capsules 論文 Dynamic Routing between Capsules (未揭橥)。其在 MNIST 上異常勝利,辨認率到達了新高,同時處理了 CNN 難以辨認堆疊圖象等成績。

  注:上文中 equivalence 改成了 equivariance,這是更精確的說法

  一些剖析

  固然如今只要論文摘要,和 Hinton 比來的視頻,我們照樣可以剖析一下 Hinton 的設法主意和尋求:

  可說明性。

  依照 Hinton 的說法, Capsule 是一組神經元,這組神經元的激起向量可以代表對應于一類實體(好比一個物體,或許一個物體的部件)的實例參數( instantiation parameters )。這個說法異常像 Hinton 已經提的 “專家積”(Products of Experts)[1] 的概念,他用這個概念說明有名的比較散度(contrastive divergence)算法 [2]。更加人熟知的是 Andrew Y. Ng 的關于主動從視頻中辨認貓臉的試驗 [3],這些試驗都暗示了某個神經元可以代表代表某些物體實例(祖母細胞假說)。然則我們曉得,某個神經元本身是個簡略的數學變換,其本身不克不及起到決議性的感化。CNN 等可以或許主動抽取圖象特點等等性質曾經為人熟知,然則究竟是哪些神經元或許哪些構造起了感化?這個很難答復。古代年夜多半神經收集的構造是絕對全體且比擬粗拙的,很難說明其外部的詳細感化機制,是以我們經常把神經收集稱為 “黑盒模子”。如今有了 Capsule 后,我們也許可以以 Capsule 為單元剖析得出每一個 Capsule 詳細的感化,如許可說明性要強許多。

  注:從視頻中看 Hinton 所說的 instantiation parameters 應當是指表征以下內容的參數:

  1. 某類物體涌現的幾率

  2. 物體的普通姿勢 (generalized pose),包含地位,偏向,尺寸,速度,色彩等等

  因果性。

  這是 Hinton 在視頻中重點提到的,也是許多機械進修專家關懷的器械。如今的神經收集缺少某種 “揣摸” 的機制,更多是目的函數最年夜化下的函數擬合。我們曉得收集可以或許準確分類某個圖片,然則為何?圖片中甚么部門或許前提才招致收集得出這個結論?假如分類失足了,又是甚么詳細的部門或許前提誤導了它?這些我們都不長短常清晰,年夜部門時刻僅僅靠調參進步成果。而論文中 Dynamic Routing,就是愿望可以或許構成一種機制,讓收集可以或許將合適 Capsule_A 處置的內容,路由到 Capsule_A 讓其處置。如許就構成了某種揣摸鏈。 “找到最好的(處置)途徑等價于(準確)處置了圖象” ,Hinton 如許說明。

  Hinton 指出,本來的 Pooling,相似于靜態的 routing,僅僅把下面的成果原地交給上面一層的神經元。(上面圖片中 Dynamic Routing 僅供表示,詳細完成要看揭橥出來的論文)

深度學習要另起爐灶,徹底拋棄反向傳播?

  無監視進修。

  這點也是 Hinton 強調的(原話仿佛是 A human does not know so much labels)。Hinton 估量有在 Capsule 基本上做無監視研討的意向,在之前的 [4] 中 Hinton 曾經用 Capsule 完成了自編碼器。

  若何對待 Hinton 從新提出的 Capsule ?

  起首這個任務勝利或許不勝利都是很正常的,就算 Capsule 真的會成為今后的趨向,Hinton 也未必這么快找到準確的練習算法;就算 Hinton 找到了準確的練習算法,也沒有人可以或許包管,Capsules 的數目不到人腦中 mini-columns 數目的時刻,可以或許起到達人類的辨認率(況且如今 CNN 固然成績許多,然則辨認率許多曾經跨越人類了)。

  別的看之前的關于 Capsules 的論文 [4],個中的成果在 2011 年照樣不錯的,然則比擬最近幾年來的 CNN 就差多了,這生怕也是 Capsules 隨后沒有火起來的緣由。許多人都吐槽如今深度進修各類各樣的成績,須要年夜量調參,然則每次調參都能有一年夜批人在論文揭橥 deadline 前調到想要的后果,這個也不能不服啊;不服你用 SIFT 給你一年調到一樣的后果嘗嘗?

  也許最糟的成果是,好像散布式存儲中有名的 CAP 實際(又叫 Brewer's theorem)所述,分歧性,可用性和分片性三者不克不及同時知足;也許關于機械進修,準確率,可說明性,因果性也不克不及同時知足(最好的模子必定最難懂得)。Hinton 暮年試圖沖破深度進修就像愛因斯坦暮年試圖同一電磁力和引力一樣,是注定沒法勝利的。不外信任 Hinton 依然情愿等下去,究竟從反向流傳提出,到深度進修的火爆,Hinton 曾經苦守了 30 年了。

  評論中有人提到,人工神經收集不用非要依照生物的門路走。我想 Hinton 重提 Capsule 的緣由不只是由于 Capsule 在生物學上有支撐,而是其有可以實行 dynamic routing 算法等的優秀性質,Hinton 在其上看到了一些能夠的沖破點。

  最早的神經收集作為感知機涌現的時刻是依照 Hebb's rule 進修的,可以說長短常生物了。恰是 Hinton 和 LeCun 弄出離開生物模子的反向流傳算法,和 Hinton 后來基于熱力學統計做的玻爾茲曼機和受限玻爾茲曼機和配套的比較散度算法,才有了深度進修的明天。

只要你關注機器人,你就無法錯過睿慕課

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
主站蜘蛛池模板: 成都思迪机电技术研究所-四川成都思迪编码器 | 艺术漆十大品牌_艺术涂料加盟代理_蒙太奇艺术涂料厂家品牌|艺术漆|微水泥|硅藻泥|乳胶漆 | 爱德华真空泵油/罗茨泵维修,爱发科-比其尔产品供应东莞/杭州/上海等全国各地 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 华禹护栏|锌钢护栏_阳台护栏_护栏厂家-华禹专注阳台护栏、楼梯栏杆、百叶窗、空调架、基坑护栏、道路护栏等锌钢护栏产品的生产销售。 | 太空舱_民宿太空舱厂家_移动房屋太空舱价格-豪品建筑 | 旅游规划_旅游策划_乡村旅游规划_景区规划设计_旅游规划设计公司-北京绿道联合旅游规划设计有限公司 | 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | 电动葫芦|手拉葫芦|环链电动葫芦|微型电动葫芦-北京市凌鹰起重机械有限公司 | 蓝莓施肥机,智能施肥机,自动施肥机,水肥一体化项目,水肥一体机厂家,小型施肥机,圣大节水,滴灌施工方案,山东圣大节水科技有限公司官网17864474793 | 红立方品牌应急包/急救包加盟,小成本好项目代理_应急/消防/户外用品加盟_应急好项目加盟_新奇特项目招商 - 中红方宁(北京) 供应链有限公司 | 深圳3D打印服务-3D打印加工-手板模型加工厂-悟空打印坊 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 搬运设备、起重设备、吊装设备—『龙海起重成套设备』 | 杭州网络公司_百度SEO优化-外贸网络推广_抖音小程序开发-杭州乐软科技有限公司 | 苹果售后维修点查询,苹果iPhone授权售后维修服务中心 – 修果网 拼装地板,悬浮地板厂家,悬浮式拼装运动地板-石家庄博超地板科技有限公司 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 膜结构车棚|上海膜结构车棚|上海车棚厂家|上海膜结构公司 | 蒸压釜_蒸养釜_蒸压釜厂家-山东鑫泰鑫智能装备有限公司 | 渣油泵,KCB齿轮泵,不锈钢齿轮泵,重油泵,煤焦油泵,泊头市泰邦泵阀制造有限公司 | 缠膜机|缠绕包装机|无纺布包装机-济南达伦特机械设备有限公司 | 减速机电机一体机_带电机减速器一套_德国BOSERL电动机与减速箱生产厂家 | 全自动固相萃取仪_高通量真空平行浓缩仪-勤业永为 | 蓝鹏测控平台 - 智慧车间系统 - 车间生产数据采集与分析系统 | 玖容气动液压设备有限公司-气液增压缸_压力机_增压机_铆接机_增压器 | 轴流风机-鼓风机-离心风机-散热风扇-罩极电机,生产厂家-首肯电子 | 超声波乳化机-超声波分散机|仪-超声波萃取仪-超声波均质机-精浩机械|首页 | 全自动烧卖机厂家_饺子机_烧麦机价格_小笼汤包机_宁波江北阜欣食品机械有限公司 | 全国国际学校排名_国际学校招生入学及学费-学校大全网 | vr安全体验馆|交通安全|工地安全|禁毒|消防|安全教育体验馆|安全体验教室-贝森德(深圳)科技 | 澳威全屋定制官网|极简衣柜十大品牌|衣柜加盟代理|全屋定制招商 百度爱采购运营研究社社群-店铺托管-爱采购代运营-良言多米网络公司 | 活性炭厂家-蜂窝活性炭-粉状/柱状/果壳/椰壳活性炭-大千净化-活性炭 | 苏州西朗门业-欧盟CE|莱茵UL双认证的快速卷帘门品牌厂家 | 金属抛光机-磁悬浮抛光机-磁力研磨机-磁力清洗机 - 苏州冠古科技 | 车件|铜件|车削件|车床加工|五金冲压件-PIN针,精密车件定制专业厂商【东莞品晔】 | 集菌仪_智能集菌仪_全封闭集菌仪_无菌检查集菌仪厂家-那艾 | 减速机_上海宜嘉减速机 | 公交驾校-北京公交驾校欢迎您!| 紧急切断阀_气动切断阀_不锈钢阀门_截止阀_球阀_蝶阀_闸阀-上海上兆阀门制造有限公司 | 高压负荷开关-苏州雷尔沃电器有限公司| 深圳市索富通实业有限公司-可燃气体报警器 | 可燃气体探测器 | 气体检测仪 |