亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當前位置: 首頁 » 行業資訊 » 機器人»為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?
   

為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2017-09-06   瀏覽次數:540
核心提示:  深度進修在2006年開端嶄露頭腳后,近幾年獲得了飛速的成長,不管是學術研討照樣企業運用均出現出指數級增加的趨向;隨同著這項技巧的賡續成熟,深度進修在智能語音范疇率先發力,獲得一系列勝利的運用。  例如

  深度進修在2006年開端嶄露頭腳后,近幾年獲得了飛速的成長,不管是學術研討照樣企業運用均出現出指數級增加的趨向;隨同著這項技巧的賡續成熟,深度進修在智能語音范疇率先發力,獲得一系列勝利的運用。

  例如,一。 音色的定制化,須要跟蹤錄年夜量的音庫,從新練習一個模子;二。 特性化表現辦法的定制化,可以錄一些數據,經由過程深度進修練習模子,自順應的辦法來完成。

  深度進修在統計參數語音分解中的運用

  語音分解重要采取波形拼接分解和統計參數分解兩種方法。波形拼接語音分解須要有足夠的高質量發音人灌音能力夠分解高質量的語音,它是貿易產物中最經常使用的語音分解技巧。統計參數語音分解固然全體分解質量略低,然則在小范圍語料、低占用資本的情形下,優勢更加顯著。另外,混雜語音分解結合了波形拼接分解和統計參數分解的優勢,選音辦法相似于傳統的波形拼接辦法,它應用參數分解辦法來指點選音;接上去重點引見今朝普遍應用的語音分解辦法:

  (1) 傳統的基于DNN/LSTM的分解

為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?

  傳統的基于HMM統計參數的語音分解是在練習進程中樹立文本參數與聲學參數之間的映照模子,經由過程高斯混雜模子描寫每一個建模單位。在建模進程中有三個環節會招致語音音質降低,第一是決議計劃樹的聚類,第二是聲碼器,第三是參數生成算法。針對決議計劃樹聚類成績,可以經由過程深層神經收集樹立文本特點和聲學特點之間的映照關系,替換傳統的淺層模子,進步模子精度;比擬典范的深層神經收集模子構造包含深層相信神經收集和長短時記憶遞歸神經收集;后者具有更強的序列進修才能,采取BLSTM-RNN建模時,還可以跳過參數生成算法直接猜測語音參數,最初經由過程聲碼器便可以分解語音;總的來講,應用深層神經收集壯大的非線性建模才能,在必定水平上晉升了語音分解體系的機能,然則并沒有跳出原本的語音分解體系框架。

  (2) 基于WaveNet的分解

為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?

  在已有的研討中,很少有人會直接在時域上對已有音頻建模。從直覺上剖析,構建一個自回歸模子,可以或許猜測每個samples是若何被后面一切的samples所影響的,是一個相當艱難的義務。谷歌提出的基于WaveNets的語音分解辦法,跳出了傳統語音分解框架,繞開聲碼器模塊,直接對采樣點停止猜測,面臨這個充斥挑釁的成績,獲得了沖破。

  WaveNet語音分解體系的輸出包含文本特點和先前時段的音頻采樣點。個中文本特點的有用表述起到異常主要的感化。假如在沒有文本序列的情形上去練習收集,依然可以生成語音,然則沒法聽懂輸入音頻的內容。WaveNet語音分解體系存在的成績是模子每次輸入單個采樣點,盤算效力難以知足適用請求。可以引入一些自順應的辦法對已有模子停止優化,使其可以或許實用于分歧發音人。也能夠在模子的輸出端供給更多的信息,例如情緒或口音,如許使得生成的語音可以更多樣化,更具表示力。

  (3) 基于DeepVoice的分解

為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?

  百度提出了Deep Voice語音分解體系,它將外面的許多模塊用深度神經收集去完成,經由過程相似于WaveNet的分解器來分解,后果也是比擬幻想的。已有的語音分解體系會在某些環節上采取深度進修,但在Deep Voice之前,沒有團隊采取全深度進修的框架。傳統語音分解須要停止年夜量的特點處置和特點構建,但百度經由過程應用深度進修防止了這些成績。這使得 Deep Voice 的運用規模加倍普遍,應用起來也加倍便利。假如須要運用于新的數據集,傳統的語音分解體系完成從新練習需數天到數周的時光停止調理,而對Deep Voice停止手動操作和練習模子所需的時光只需幾個小時就足夠。比擬于WaveNet語音分解體系 ,如今這個體系的有用速度晉升了400倍。

  (4) 兩個端對真個語音分解

  第一個是Char2Wav,這個模子是直接對輸出的文本停止編碼,采取encoder-decoder模子。對輸出特點停止編碼,然后生成的中央編碼信息放到解碼器里停止最初的分解,分解采取SimpleRNN的分解器來分解語音,后果也是比擬幻想的,并且是典范的End-To-End的語音分解模子。

為了合成讓人類聽懂的語音,機器做了哪些“深度學習”?

  再一個是谷歌提出的端對真個語音分解體系,它跟Char2Wav比擬相似,輸出的也是Embeddings,分解的后果也比擬感性。

只要你關注機器人,你就無法錯過睿慕課

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
 
主站蜘蛛池模板: 会议会展活动拍摄_年会庆典演出跟拍_摄影摄像直播-艾木传媒 | 船用锚链|专业锚链生产厂家|安徽亚太锚链制造有限公司 | 沈阳庭院景观设计_私家花园_别墅庭院设计_阳台楼顶花园设计施工公司-【沈阳现代时园艺景观工程有限公司】 | 厌氧反应器,IC厌氧反应器,厌氧三相分离器-山东创博环保科技有限公司 | 硫酸亚铁-聚合硫酸铁-除氟除磷剂-复合碳源-污水处理药剂厂家—长隆科技 | 注塑_注塑加工_注塑模具_塑胶模具_注塑加工厂家_深圳环科 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 合肥办公室装修 - 合肥工装公司 - 天思装饰 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 便携式谷丙转氨酶检测仪|华图生物科技百科 | 自动化生产线-自动化装配线-直流电机自动化生产线-东莞市慧百自动化有限公司 | 合肥活动房_安徽活动板房_集成打包箱房厂家-安徽玉强钢结构集成房屋有限公司 | 房间温控器|LonWorks|海思| 彩超机-黑白B超机-便携兽用B超机-多普勒彩超机价格「大为彩超」厂家 | 亚克力制品定制,上海嘉定有机玻璃加工制作生产厂家—官网 | 塑料检查井_双扣聚氯乙烯增强管_双壁波纹管-河南中盈塑料制品有限公司 | 橡胶弹簧|复合弹簧|橡胶球|振动筛配件-新乡市永鑫橡胶厂 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 昆山PCB加工_SMT贴片_PCB抄板_线路板焊接加工-昆山腾宸电子科技有限公司 | 岩棉板|岩棉复合板|聚氨酯夹芯板|岩棉夹芯板|彩钢夹芯板-江苏恒海钢结构 | 新能源汽车电机定转子合装机 - 电机维修设备 - 睿望达 | TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 华禹护栏|锌钢护栏_阳台护栏_护栏厂家-华禹专注阳台护栏、楼梯栏杆、百叶窗、空调架、基坑护栏、道路护栏等锌钢护栏产品的生产销售。 | 河南正规膏药生产厂家-膏药贴牌-膏药代加工-修康药业集团官网 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | 生态板-实木生态板-生态板厂家-源木原作生态板品牌-深圳市方舟木业有限公司 | 打包钢带,铁皮打包带,烤蓝打包带-高密市金和金属制品厂 | 高博医疗集团上海阿特蒙医院 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 河南正规膏药生产厂家-膏药贴牌-膏药代加工-修康药业集团官网 | 流水线电子称-钰恒-上下限报警电子秤-上海宿衡实业有限公司 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 天津云仓-天津仓储物流-天津云仓一件代发-顺东云仓 | SDG吸附剂,SDG酸气吸附剂,干式酸性气体吸收剂生产厂家,超过20年生产使用经验。 - 富莱尔环保设备公司(原名天津市武清县环保设备厂) | 网站seo优化_seo云优化_搜索引擎seo_启新网络服务中心 | 合肥活动房_安徽活动板房_集成打包箱房厂家-安徽玉强钢结构集成房屋有限公司 | 塑料托盘厂家直销-吹塑托盘生产厂家-力库塑业【官网】 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 中高频感应加热设备|高频淬火设备|超音频感应加热电源|不锈钢管光亮退火机|真空管烤消设备 - 郑州蓝硕工业炉设备有限公司 | 压滤机-洗沙泥浆处理-压泥机-山东创新华一环境工程有限公司 |