亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當前位置: 首頁 » 行業資訊 » 機器人»人工智能:讀書“破萬卷”,難答“小兒科”
   

人工智能:讀書“破萬卷”,難答“小兒科”

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2018-04-08   瀏覽次數:781
核心提示:(從左至右)崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖  瀏覽來自維基百科的536篇文章,答復10萬個基于文章內容的成績,除題量年夜一點,這場競賽挺像年夜學英語六級測驗的瀏覽懂得測試。

人工智能:讀書“破萬卷”,難答“小兒科”
(從左至右)崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖

  瀏覽來自維基百科的536篇文章,答復10萬個基于文章內容的成績,除題量年夜一點,這場競賽挺像年夜學英語六級測驗的瀏覽懂得測試。

  但你弗成能聽到科場里奮筆疾書的“唰唰”聲,由于“參賽者”只是一段代碼。輸出文章和成績后,盤算機的中心處置器(CPU)和圖形處置器(GPU)開端高速盤算,最初交出答卷,由出題者批閱。

  對來自世界列國的研討者來講,這是一場沒有止境的比賽——任何人可以在隨意率性時光參加,排行榜及時更新;即便是第一位,不堅持“進修”和“更新”,隨時有能夠被新參加者超出。它能夠產生在你吃飯和睡覺的時刻,而“敵手”不外是“啪啪啪”地敲擊了一串代碼。

  這場比賽全稱SQuAD(Stanford Question Answering Dataset)文本懂得挑釁賽,由斯坦福年夜學在2016年9月提議,是業內公認的機械瀏覽懂得尺度程度測試,也是這個范疇的頂級賽事。

  在2018年1月3日之前,人類一直堅持著搶先的優勢——歷來沒有任何一個團隊可以或許設計出一種答題準確率跨越人類的算法。這一天,微軟亞洲研討院天然說話盤算組提交的新模子取得了82.650的準確婚配分數,跨越了人類得分82.304。僅過了兩天,阿里巴巴iDST-NLP團隊也拿到了82.440的準確婚配分數。

  微軟亞洲研討院院長洪小文告知中國青年報·中青在線記者:“這對微軟和天然說話處置(NLP)研討范疇來講,都是一個主要的里程碑。盤算機文本懂得才能初次超出人類,預示著該范疇的研討將會有更年夜沖破。”

  在盤算機看來,人間萬物都是一串數字

  微軟亞洲研討院副院長、天然說話盤算組擔任人周明博士坐在盤算機前,重要地期待測試成果。經由1個多月對模子和算法的更新,他們提交了最新代碼。

  這支團隊在SQuAD挑釁賽早期,一度以穩固的成就歷久位居排行榜榜首,但周明曉得,這場比賽的排名瞬息萬變。2017年最初兩個月里,科年夜訊飛與哈工年夜結合試驗室、騰訊DPDAC NLP團隊前后跨越了他們。

  新選手參賽年夜約兩三分鐘后,體系就完成了約50篇數百詞的文章瀏覽和約1萬個成績的答復。即便母語是英語的成年人,這個時光也才委曲讀完5篇文章。

  “對人類來講,讀完一篇文章就會在腦海中構成必定的印象,好比這篇文章講的甚么人,產生了甚么故事。人們可以或許易如反掌地歸結出文章里的重點內容,但對盤算機來講不是如許。”周明告知中國青年報·中青在線記者。

  在SQuAD測試中,盤算機須要瀏覽一段資料,然后答復諸如人名、地輿地位等成績。分歧于相似測試,SQuAD測試的答復能夠是一段短語,而非某個單詞或單個內容。它能夠遭受同義詞調換、句子構造變換等情形,乃至須要綜合多個句子停止邏輯推理。

  為懂得決這個成績,研討組模仿人類做瀏覽懂得進程的方法,他們將全部進程分紅了四步。拿到測試題后,盤算機起首會進修文本和成績,就像我們做瀏覽題時,起首會通讀文章,然后審題,取得一個全體印象。

  下一步,盤算機遇將成績和文章停止比對,找出相干段落,就像人類定位癥結信息的環節。接上去,盤算機遇把初步成果放到高低文里比對,相似人會綜合全文對待成績。最初,它會推敲并選出最像謎底的內容。

  在這場比賽中,分歧團隊設計的答題形式能夠完整分歧。周明引見說,他們的設計中,最奇特的就是第3步,是經由過程“留意力機制”到達的。這讓癥結信息像被畫上了重點一樣,成為盤算機眼中高亮的部門。

  “除天然說話處置,留意力機制在圖象辨認范疇也是癥結的概念。”美國哥倫比亞年夜學盤算機系碩士生何欽堯告知中國青年報·中青在線記者。

  人類視覺可以或許經由過程疾速掃描全體圖象后,找到須要重點存眷的區域,并投入更多留意力,以取得更多細節,克制其他無用信息。研討者也測驗考試讓盤算機進修并應用這類機制。分歧于人類具有動植物、山水河道的概念,一切單詞和圖象在盤算機看來都是一串數字。它必需從數字面前奧妙的接洽中,洞悉它們的意義。

  真諦隱蔽在數據和幾率里

  周明地點團隊應用的盤算機其實不是平空學會做題。加入SQuAD比賽前,它就像“學霸”考前刷題一樣,先看過了約500篇文章和與之對應的10萬道標題、謎底。

  但周明表現,“今朝基于深度進修的機械瀏覽懂得模子都是黑盒的狀況,很難直不雅地表現機械停止瀏覽懂得的進程和成果。將來,可說明性的深度進修模子值得進一步探討。”

  經由過程年夜量進修,盤算機明確了甚么數字意味著與文章內容相干,如何的接洽意味著這就是成績的謎底。

  “真諦就隱蔽在數據和幾率里,我們這個范疇的研討者年夜多都這么看。”何欽堯說。一個1歲人類孩童看過狗今后,就可以辨認各類體型、種類和分歧拍攝角度的狗,構成概念,但盤算機須要看過許多照片后,能力斷定某個物體是否是狗。“我們不曉得人類是怎樣構成這個概念的,但對盤算機來講,概念是靠積聚數據、靠盤算幾率得來的。”

  直到20世紀90年月之前,人們還在試圖讓盤算機學會人類說話的規矩,從而懂得面前的寄義。但說話在應用時常常不標準,機械沒法處置偏離規矩的內容。后來,人們開端讓機械本身停止進修,獲得說話常識。

  成長到明天,天然說話處置范疇的研討曾經根本可以敷衍單個句子,懂得句子成份。各年夜手機廠商也推出了本身的人工智能語音體系,可以辨認并完成用戶的指令,還能停止簡略的交換和對話。

  “長文本的懂得一向是難點,這觸及句子之間的連接性、高低文連接和邏輯推理等更高難度的內容。”周明說。

  當我們告知盤算機,“萊茵河上最年夜的城市是德國科隆,它是中歐和西歐區域的第二長河道,位于多瑙河以后”,并問它“甚么河比萊茵河長”時,許多盤算機遇答復“科隆”。

  若何懂得代詞“它”、懂得“位于……以后”表現比擬而非物理上的前后,成為這些“選手”很年夜的妨礙。人類具有“科隆是城市而非河道”這類知識,簡直不會在這個成績上出錯,但盤算機沒法懂得這個概念。

  SQuAD比賽不是第一個盤算機“超出”人類的范疇

  盤算機很早就在盤算、記憶的范疇碾軋人類,后來又擊敗了人類最優良的國際象棋、圍棋棋手。

  “其實,盤算、下棋、機械翻譯等只聚焦單一義務自己的人工智能都屬于弱人工智能,”周明說,“不外弱人工智能其實不弱,它可以具有超出人類的某些才能,有很年夜的價值,然則弱人工智能還沒法真正懂得它吸收到的信息,而這就使得通往能人工智能的途徑非常艱苦。”

  60多年前,曾有人測驗考試讓盤算機用6條規矩和200個辭匯做俄英翻譯,這被以為是最早的人工智能測驗考試。那時的研討人員信念滿滿,傳播鼓吹能在5年內完整處理一種說話到另外一種說話的主動翻譯成績。

  這個目的至今沒有完成,人工智能也由于研討停頓遲緩閱歷過兩次高潮。一向到近10年,盤算機機能的年夜幅度晉升和機械進修實際的鼓起讓人工智能再次熱了起來。人們發明,盤算性能夠寫詩詞、與人對話,它變得愈來愈像人。

  據統計,21世紀以來新開辦的人工智能企業中,有近三分之二是在5年內開辦的。比來3年,人工智能范疇的失業崗亭數目飆升近8倍。在亞洲,曩昔17年內投向人工智能范疇的51億美元中,有95%是在曩昔5年內投入的。

  翻看SQuAD比賽排行榜,前3名都是來自中國的團隊。“這在曩昔是不敢想象的。”周明說。放在20年前,中國乃至還沒有在這個范疇的頂級會議上揭橥過文章。而如今,中國揭橥的文章數曾經穩居世界第二,2017年還有5篇文章當選該會議的22篇出色論文。

  在SQuAD比賽中,盤算機得分比人類高0.346分,可以懂得為異樣做1萬道題時,盤算機多做對35道。“這遠不代表盤算機超出了人類的瀏覽懂得程度。”周明告知中國青年報·中青在線記者。也有人質疑,這里代表“人類”的,不外是眾包平臺上一小時掙9美元、受教導程度良莠不齊的人。

  一個公認的人工智能的尺度是可以或許經由過程“圖靈測試”——假如一臺機械可以或許與人停止交換,而且被人誤認為是人,那它就具有智能。

  “ ‘能懂得、會思慮’,這個中,懂得天然說話是最焦點的成績。”周明說。今朝,盤算機照樣很難在平常交換中懂得雙關和譏諷。在中文語境下,盤算機還須要面臨若何將一個句子拆分為數個辭匯的成績。許多對人類而言無需進修的工作,例如堅持均衡、用手拿起一個杯子,對機械而言也是非常艱苦的工作。

  機械沒有經由幾億年的演變,也沒有人類年夜腦里由神經元數百萬次電脈沖轉化成的觸覺、聽覺或是視覺。在人類法式員的馴導下,它把一切轉化為數字。

  懂得辨認特征的工程師可以經由過程肉眼沒法辨認的微調,讓盤算機把小狗圖片當做鴕鳥,或是將一片馬賽克認成獵豹。有時,把中文翻譯成英文再翻譯回來,整句話都變得面貌全非。

  在人工智能威逼論不停于耳的明天,周明簡直沒有擔憂,他向中國青年報·中青在線記者舉了SQuAD比賽中的一個例子。

  機械瀏覽了“按質量算,氧氣是宇宙中第三多的元素,排在氫和氦以后”,面臨“甚么是第二多的元素”的成績,它的答復倒是“氧”。不論是微軟照樣阿里巴巴團隊設計的算法,都不克不及處理這個再簡略不外的成績。

  這不只是人工智能之間的比賽,也是人類和本身的比賽。

只要你關注機器人,你就無法錯過睿慕課

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
 
主站蜘蛛池模板: 钢绞线万能材料试验机-全自动恒应力两用机-混凝土恒应力压力试验机-北京科达京威科技发展有限公司 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 生物制药洁净车间-GMP车间净化工程-食品净化厂房-杭州波涛净化设备工程有限公司 | 成都竞价托管_抖音代运营_网站建设_成都SEM外包-成都智网创联网络科技有限公司 | 全国冰箱|空调|洗衣机|热水器|燃气灶维修服务平台-百修家电 | 超高频感应加热设备_高频感应电源厂家_CCD视觉检测设备_振动盘视觉检测设备_深圳雨滴科技-深圳市雨滴科技有限公司 | 贝壳粉涂料-内墙腻子-外墙腻子-山东巨野七彩贝壳漆业中心 | 北京西风东韵品牌与包装设计公司,创造视觉销售力! | 沈阳液压泵_沈阳液压阀_沈阳液压站-沈阳海德太科液压设备有限公司 | 二维运动混料机,加热型混料机,干粉混料机-南京腾阳干燥设备厂 | 地磅-地秤-江阴/无锡地磅-江阴天亿计量设备有限公司_ | 沈阳楼承板_彩钢板_压型钢板厂家-辽宁中盛绿建钢品股份有限公司 轴承振动测量仪电箱-轴承测振动仪器-测试仪厂家-杭州居易电气 | 搪瓷搅拌器,搪玻璃搅拌器,搪玻璃冷凝器_厂家-淄博越宏化工设备 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 | 塑料熔指仪-塑料熔融指数仪-熔体流动速率试验机-广东宏拓仪器科技有限公司 | 免联考国际MBA_在职MBA报考条件/科目/排名-MBA信息网 | 砍排机-锯骨机-冻肉切丁机-熟肉切片机-预制菜生产线一站式服务厂商 - 广州市祥九瑞盈机械设备有限公司 | 荣事达手推洗地机_洗地机厂家_驾驶式扫地机_工业清洁设备 | 重庆波纹管|重庆钢带管|重庆塑钢管|重庆联进管道有限公司 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 干粉砂浆设备-干粉砂浆生产线-干混-石膏-保温砂浆设备生产线-腻子粉设备厂家-国恒机械 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 超声波清洗机_细胞破碎仪_实验室超声仪器_恒温水浴-广东洁盟深那仪器 | 预制围墙_工程预制围墙_天津市瑞通建筑材料有限公司 | 交流伺服电机|直流伺服|伺服驱动器|伺服电机-深圳市华科星电气有限公司 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 免费个人pos机申请办理-移动pos机刷卡-聚合收款码办理 | 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 陶瓷加热器,履带式加热器-吴江市兴达电热设备厂 | 砂尘试验箱_淋雨试验房_冰水冲击试验箱_IPX9K淋雨试验箱_广州岳信试验设备有限公司 | 储气罐,真空罐,缓冲罐,隔膜气压罐厂家批发价格,空压机储气罐规格型号-上海申容压力容器集团有限公司 | 瑞典Blueair空气净化器租赁服务中心-专注新装修办公室除醛去异味服务! | 天津电机维修|水泵维修-天津晟佳机电设备有限公司 | 膜片万向弹性联轴器-冲压铸造模具「沧州昌运模具」 | 北京京云律师事务所| GAST/BRIWATEC/CINCINNATI/KARL-KLEIN/ZIEHL-ABEGG风机|亚喜科技 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 黑龙江「京科脑康」医院-哈尔滨失眠医院_哈尔滨治疗抑郁症医院_哈尔滨精神心理医院 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 |