
谷歌語音模型USM目前已支持100多種語音自動識別。
(相關資料圖)
編譯 | 吳菲凝
編輯 | 李水青
智東西3月7日報道,根據谷歌官網,谷歌的通用語音模型USM目前已實現升級,支持100多個語種內容的自動識別檢測。
去年11月,谷歌曾計劃創建一個支持1000個語種的AI模型USM。谷歌將其描述為“最先進的通用語音模型”,擁有20億個參數,經過涵蓋1200萬小時的語音、280億個句子和300多個語種數據集的預訓練。
USM的強大效果目前已在Youtube的字幕生成中展現出來,可自動翻譯和檢測如英語、漢語等主流語種,還能識別出阿薩姆語這種小眾語種,可以說“精通方言”。
根據谷歌博客,與OpenAI的大型通用語音模型Whisper相比,USM的數據訓練時長更短,錯誤率更低。
01.可自動檢測翻譯100+語種
USM面臨兩大挑戰
當微軟和谷歌還在為誰家的AI聊天機器人更智能而爭論不休時,我們需要清楚,語音模型的用途遠不止于此。
外媒The Verge的記者稱,除了相傳將在今年的I/O開發者大會中展示的20多款AI驅動產品之外,谷歌目前還在朝著更高目標邁進——構建一個支持1000種語種的機器學習模型。
在周一發布的更新中,谷歌分享了更多有關USM的信息,谷歌稱,這是構建支持1000種語言的通用語音模型的“關鍵第一步”。
USM已被YouTube用于生成字幕,它還支持自動語音識別(ASR),可自動檢測和翻譯語言,不僅包括普通話、英語等廣泛使用的語言,還包括阿姆哈拉語、宿務語、阿薩姆語等冷門語言。
目前,谷歌稱USM可支持檢測100多個語種,并將作為構建更大的系統的“基礎”。不過,這項技術似乎還有些遙遠,谷歌在I/O開發者大會期間對阿拉伯語的錯誤表述就已證明。
谷歌研究院科學家張宇(Yu Zhang)和軟件工程師詹姆斯·秦(James Qin)在谷歌博客上發文稱,為了實現USM這個雄心勃勃的目標,他們目前需要解決ASR面臨的兩個重大挑戰。
一是傳統的學習方法的缺乏可擴展性。語音技術擴展到多語種的一個基本挑戰是需要足夠的數據來訓練高質量的模型,使用傳統方法時,需要手動將音頻數據進行標記,既耗時又價格高昂,對于那些小眾冷門的語種而言,也更難找到預先存在的來源收集。因此,研究院后續準備將傳統學習方法轉變為自我監督學習,利用純音頻來收集數據。
二是在擴大語言覆蓋范圍和質量的同時,模型必須以計算效率更高的方法來改進。這就要求學習算法更加靈活、高效、泛化。這些算法需要使用來源廣泛的數據,并在不用完全訓練的情況下更新模型,再推廣到新的語言中。
02.三個步驟降低識別錯誤率
擊敗OpenAI
據該團隊發表的論文稱,USM使用的是標準的編碼器-解碼器架構,其中解碼器是CTC、RNN-T和LAS,編碼器使用的是Conformer或卷積增強變換器。其中,Conformer使用的關鍵組件是Conformer塊,由注意力模塊、前饋模塊和卷積模塊組成,應用一系列Conformer塊和投影層以最終嵌入。
據論文顯示,對于USM的訓練共分為三個步驟。
第一步是使用BEST-RQ來對涵蓋數百種語種的語音音頻進行自我監督學習,已經在多語言任務上展示了最先進的結果,在使用了大量的無監督音頻數據后的證明結果是有效的。
第二步需要使用多目標監督預訓練來整合來自于其他文本數據的信息。該模型引入了一個額外的編碼器模塊來輸入文本,并引入額外層來組合語音編碼器和文本編碼器的輸出,并在未標記語音、標記語音和文本數據上聯合訓練模型。
最后一步需要USM對下游任務進行微調,包括ASR(自動語音識別)和AST(自動語音翻譯)。
USM的整體培訓渠道
對于USM的有效性,團隊通過Youtube Caption的多語言語音數據進行微調來驗證。
受監督的Youtube數據包括有73種語種,每個語種的數據不到3000小時。盡管監督的數據有限,但USM在73個語種當中實現了平均低于30%的單詞容錯率(WER),與當前內部最先進的模型相比降低了6%。與進行了近40萬小時數據訓練的大型模型Whisper相比,USM的錯誤率更低,它在18個語種中的解碼錯誤率僅有32.7%,而Whisper有40%。
在WER低于40%的情況下,USM在其支持的語言上優于Whisper
在公開可用的數據上,與Whisper相比,USM在CORAAL(非裔美國人使用的英語)、SpeechStew和FLEURS這三個語言數據集上都顯示出了更低的單詞容錯率。
在ASR基準上比較USM(有或沒有域內數據)和Whisper的結果。
對于語音翻譯,團隊在CoVoST數據集上微調USM,在有限的監督數據上實現了最好的性能。為了評估模型性能的廣度,他們根據資源可用性將CoVoST數據集中的語言分為高、中、低三類,并計算每個部分中的BLEU分數(機器翻譯評價指標),根據最終展示出的結果,USM在所有細分市場上的表現都優于Whisper。
他們認為,谷歌若想實現連接全球信息并使每個人都能自由訪問的愿景,USM的開發將會是關鍵的一步,USM的基礎模型框架和訓練通道已經打下了一個基礎,他們要做的就是在此基礎上將語音模型擴展至1000種語言。
03.結語:AI突破語言障礙
助全球打破信息繭房
目前,USM已支持100多個語種,未來將持續擴展到1000多個,屆時將會吸引到更大一部分用戶進行體驗,真正實現將信息分發到全球各個角落。
信息時代,科技進步將會進一步幫助各個國家地區的語言和文化突破地域的限制,很大程度上解決信息繭房帶來的困擾。
關鍵詞:
網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
Copyright © 2000-2020 www.yjkq2010.com All Rights Reserved.
中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
聯系郵箱:920 891 263@qq.com
欧美色综合网_狠狠色狠色综合曰曰_麻豆精品一区二区av白丝在线_久久精品综合一区 欧美一区二区国产| 免费的成人av| 色综合久久久久久久久久久| 久久99久久精品欧美| 又紧又大又爽精品一区二区| 欧美国产精品一区二区三区| 精品国产91洋老外米糕| 91精品国产欧美一区二区成人| 91久久久免费一区二区| 91视频在线观看免费| 丁香婷婷综合激情五月色| 国产亚洲欧美在线| 久久精品亚洲精品国产欧美kt∨| 精品久久五月天| 精品欧美一区二区三区精品久久| 欧美一区午夜视频在线观看| 欧美电影在线免费观看| 在线91免费看| 91精品一区二区三区在线观看| 精品视频免费看| 欧美肥胖老妇做爰| 日韩一区二区视频在线观看| 欧美v国产在线一区二区三区| 日韩视频一区二区在线观看| 日韩一级视频免费观看在线| 亚洲精品在线观看网站| 久久午夜色播影院免费高清| 久久日韩精品一区二区五区| 国产日产欧美一区二区视频| 日韩一区欧美一区| 亚洲国产婷婷综合在线精品| 肉肉av福利一精品导航| 免费观看日韩电影| 国产精品影视天天线| av中文字幕在线不卡| 在线精品视频免费观看| 欧美精品久久99久久在免费线| 91精品在线一区二区| 久久你懂得1024| 亚洲免费看黄网站| 日韩精品欧美精品| 国产成人免费视频网站| 91久久国产综合久久| 欧美一级二级在线观看| 久久嫩草精品久久久精品一| 中文字幕中文字幕在线一区 | 日本亚洲欧美天堂免费| 九色综合国产一区二区三区| 欧美日韩在线直播| 日韩一区二区免费视频| 国产精品久久久久久久久快鸭 | 色香蕉久久蜜桃| 日韩三级高清在线| 国产精品毛片久久久久久久| 婷婷六月综合亚洲| 成人av影院在线| 欧美一级xxx| 亚洲欧美成aⅴ人在线观看| 日产国产欧美视频一区精品 | 8x福利精品第一导航| 中文字幕一区三区| 久久99精品视频| 欧美三级韩国三级日本一级| 欧美极品另类videosde| 美女视频黄免费的久久| 91国偷自产一区二区三区成为亚洲经典 | 欧美成人性战久久| 亚洲三级在线观看| 国产白丝网站精品污在线入口| 欧美美女一区二区三区| 中文成人综合网| 国产在线精品一区二区三区不卡| 在线免费视频一区二区| 国产欧美一区二区三区在线看蜜臀| 五月天婷婷综合| 色噜噜狠狠色综合中国| 中文字幕免费观看一区| 黄色小说综合网站| 91精品国产免费久久综合| 一区二区三区不卡在线观看 | 国产精选一区二区三区| 欧美一级片在线观看| 亚洲国产sm捆绑调教视频 | 日韩欧美在线1卡| 五月天网站亚洲| 欧美色综合久久| 亚洲国产精品一区二区久久| 日本乱人伦aⅴ精品| 亚洲美女精品一区| 色综合天天天天做夜夜夜夜做| 最新国产成人在线观看| 91尤物视频在线观看| 亚洲另类在线一区| 欧洲一区二区三区免费视频| 亚洲国产精品久久人人爱| 欧美三级一区二区| 日韩综合一区二区| 欧美一区二区私人影院日本| 久久精品二区亚洲w码| 2020日本不卡一区二区视频| 国产一本一道久久香蕉| 国产精品色婷婷| 91成人免费电影| 亚洲国产精品一区二区久久| 337p亚洲精品色噜噜噜| 日本91福利区| 久久久久9999亚洲精品| 成人开心网精品视频| 亚洲精品视频在线观看免费| 欧美在线观看一区| 免费高清在线一区| 国产欧美日韩在线| 91麻豆精品在线观看| 亚洲欧美成aⅴ人在线观看| 色婷婷久久久综合中文字幕 | 91成人网在线| 亚洲国产欧美日韩另类综合 | 中文字幕不卡在线| 一本高清dvd不卡在线观看| 国产高清成人在线| 国产欧美1区2区3区| 色菇凉天天综合网| 日本不卡一二三区黄网| 久久色在线视频| 91麻豆免费观看| 日本不卡视频在线观看| 中文字幕二三区不卡| 欧美区一区二区三区| 国产成人在线看| 丝袜亚洲另类欧美综合| 国产清纯美女被跳蛋高潮一区二区久久w | 国产欧美日本一区二区三区| 91视频国产观看| 精品亚洲成a人在线观看| 亚洲欧美另类小说| 精品国产乱码久久久久久免费| 91在线精品秘密一区二区| 美国十次了思思久久精品导航| 国产精品久久久久影视| 欧美一级二级三级乱码| 在线免费观看成人短视频| 国产馆精品极品| 麻豆精品一区二区三区| 亚洲卡通欧美制服中文| 久久精品在线观看| 日韩视频免费直播| 91极品美女在线| 成人爱爱电影网址| 精品一区二区三区视频| 亚洲国产综合视频在线观看| 日本一区二区在线不卡| 日韩欧美aaaaaa| 欧美欧美午夜aⅴ在线观看| 99re6这里只有精品视频在线观看| 久久99精品视频| 六月丁香综合在线视频| 日韩精品乱码av一区二区| 一区二区激情小说| 亚洲图片另类小说| 中文字幕一区在线观看| 国产欧美精品一区二区三区四区| 精品国产亚洲在线| 欧美mv日韩mv国产| 日韩一级成人av| 日韩片之四级片| 日韩欧美成人激情| 日韩精品一区二区三区四区| 6080日韩午夜伦伦午夜伦| 欧美日本国产一区| 欧美日韩一区二区三区在线看| 日本福利一区二区| 欧美影视一区在线| 欧美午夜电影网| 欧美日韩久久久一区| 欧美怡红院视频| 欧美精品日韩精品| 欧美一二三四区在线| 精品久久国产97色综合| 欧美va亚洲va| 久久久久久久久蜜桃| 欧美国产日韩亚洲一区| 国产精品视频观看| 亚洲乱码国产乱码精品精98午夜| 一区二区三区视频在线看| 亚洲一区二区三区三| 亚洲超碰精品一区二区| 美女脱光内衣内裤视频久久网站 | 香蕉影视欧美成人| 日韩**一区毛片| 国产综合色在线视频区| 国产成人av影院| 99视频热这里只有精品免费| 99精品国产视频| 欧美日韩一区二区三区视频 | 欧美日韩电影在线| 日韩欧美色综合网站| 久久九九全国免费| 91视频在线观看| 7777精品伊人久久久大香线蕉超级流畅 | 天天影视色香欲综合网老头|