久久深夜福利免费观看,亚洲欧美国产日韩中文字幕,欧美亚男人的天堂

擊敗OpenAI！谷歌公布20億參數通用語音模型支持100多語種檢測翻譯

來源：鳳凰網

時間：2023-03-08 10:16:47

谷歌語音模型USM目前已支持100多種語音自動識別。

(相關資料圖)

編譯 | 吳菲凝

編輯 | 李水青

智東西3月7日報道，根據谷歌官網，谷歌的通用語音模型USM目前已實現升級，支持100多個語種內容的自動識別檢測。

去年11月，谷歌曾計劃創建一個支持1000個語種的AI模型USM。谷歌將其描述為“最先進的通用語音模型”，擁有20億個參數，經過涵蓋1200萬小時的語音、280億個句子和300多個語種數據集的預訓練。

USM的強大效果目前已在Youtube的字幕生成中展現出來，可自動翻譯和檢測如英語、漢語等主流語種，還能識別出阿薩姆語這種小眾語種，可以說“精通方言”。

根據谷歌博客，與OpenAI的大型通用語音模型Whisper相比，USM的數據訓練時長更短，錯誤率更低。

01.可自動檢測翻譯100+語種

USM面臨兩大挑戰

當微軟和谷歌還在為誰家的AI聊天機器人更智能而爭論不休時，我們需要清楚，語音模型的用途遠不止于此。

外媒The Verge的記者稱，除了相傳將在今年的I/O開發者大會中展示的20多款AI驅動產品之外，谷歌目前還在朝著更高目標邁進——構建一個支持1000種語種的機器學習模型。

在周一發布的更新中，谷歌分享了更多有關USM的信息，谷歌稱，這是構建支持1000種語言的通用語音模型的“關鍵第一步”。

USM已被YouTube用于生成字幕，它還支持自動語音識別（ASR），可自動檢測和翻譯語言，不僅包括普通話、英語等廣泛使用的語言，還包括阿姆哈拉語、宿務語、阿薩姆語等冷門語言。

目前，谷歌稱USM可支持檢測100多個語種，并將作為構建更大的系統的“基礎”。不過，這項技術似乎還有些遙遠，谷歌在I/O開發者大會期間對阿拉伯語的錯誤表述就已證明。

谷歌研究院科學家張宇（Yu Zhang）和軟件工程師詹姆斯·秦（James Qin）在谷歌博客上發文稱，為了實現USM這個雄心勃勃的目標，他們目前需要解決ASR面臨的兩個重大挑戰。

一是傳統的學習方法的缺乏可擴展性。語音技術擴展到多語種的一個基本挑戰是需要足夠的數據來訓練高質量的模型，使用傳統方法時，需要手動將音頻數據進行標記，既耗時又價格高昂，對于那些小眾冷門的語種而言，也更難找到預先存在的來源收集。因此，研究院后續準備將傳統學習方法轉變為自我監督學習，利用純音頻來收集數據。

二是在擴大語言覆蓋范圍和質量的同時，模型必須以計算效率更高的方法來改進。這就要求學習算法更加靈活、高效、泛化。這些算法需要使用來源廣泛的數據，并在不用完全訓練的情況下更新模型，再推廣到新的語言中。

02.三個步驟降低識別錯誤率

擊敗OpenAI

據該團隊發表的論文稱，USM使用的是標準的編碼器-解碼器架構，其中解碼器是CTC、RNN-T和LAS，編碼器使用的是Conformer或卷積增強變換器。其中，Conformer使用的關鍵組件是Conformer塊，由注意力模塊、前饋模塊和卷積模塊組成，應用一系列Conformer塊和投影層以最終嵌入。

據論文顯示，對于USM的訓練共分為三個步驟。

第一步是使用BEST-RQ來對涵蓋數百種語種的語音音頻進行自我監督學習，已經在多語言任務上展示了最先進的結果，在使用了大量的無監督音頻數據后的證明結果是有效的。

第二步需要使用多目標監督預訓練來整合來自于其他文本數據的信息。該模型引入了一個額外的編碼器模塊來輸入文本，并引入額外層來組合語音編碼器和文本編碼器的輸出，并在未標記語音、標記語音和文本數據上聯合訓練模型。

最后一步需要USM對下游任務進行微調，包括ASR（自動語音識別）和AST（自動語音翻譯）。

USM的整體培訓渠道

對于USM的有效性，團隊通過Youtube Caption的多語言語音數據進行微調來驗證。

受監督的Youtube數據包括有73種語種，每個語種的數據不到3000小時。盡管監督的數據有限，但USM在73個語種當中實現了平均低于30%的單詞容錯率（WER），與當前內部最先進的模型相比降低了6%。與進行了近40萬小時數據訓練的大型模型Whisper相比，USM的錯誤率更低，它在18個語種中的解碼錯誤率僅有32.7%，而Whisper有40%。

在WER低于40%的情況下，USM在其支持的語言上優于Whisper

在公開可用的數據上，與Whisper相比，USM在CORAAL（非裔美國人使用的英語）、SpeechStew和FLEURS這三個語言數據集上都顯示出了更低的單詞容錯率。

在ASR基準上比較USM（有或沒有域內數據）和Whisper的結果。

對于語音翻譯，團隊在CoVoST數據集上微調USM，在有限的監督數據上實現了最好的性能。為了評估模型性能的廣度，他們根據資源可用性將CoVoST數據集中的語言分為高、中、低三類，并計算每個部分中的BLEU分數（機器翻譯評價指標），根據最終展示出的結果，USM在所有細分市場上的表現都優于Whisper。

他們認為，谷歌若想實現連接全球信息并使每個人都能自由訪問的愿景，USM的開發將會是關鍵的一步，USM的基礎模型框架和訓練通道已經打下了一個基礎，他們要做的就是在此基礎上將語音模型擴展至1000種語言。

03.結語：AI突破語言障礙

助全球打破信息繭房

目前，USM已支持100多個語種，未來將持續擴展到1000多個，屆時將會吸引到更大一部分用戶進行體驗，真正實現將信息分發到全球各個角落。

信息時代，科技進步將會進一步幫助各個國家地區的語言和文化突破地域的限制，很大程度上解決信息繭房帶來的困擾。

關鍵詞：

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環球報道:[今日關注] 南昌男科醫院男科...
環球報道:[今日關注] 南昌男科醫院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監會立案！此前剛遭上交所紀律處分！-...
證監會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩豐一年定開債券發...
基金分紅：方正富邦穩豐一年定開債券發...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮江中國獨角獸企業數量全國排...
世界滾動:鎮江中國獨角獸企業數量全國排...
世界播報:新疆挖掘南疆特色產業潛力
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養權怎么判
頭條焦點：離婚二審撫養權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環球速讀：瘋狂！散戶大買15億，美股空...
環球速讀：瘋狂！散戶大買15億，美股空...
世界動態:首屆京津冀生態產業創新發展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區服務
港交所紐約辦事處開幕　提升北美地區服務
韓媒：韓國環境部已批準“薩德”基地環...
看圖學習｜中華優秀傳統文化是中華民族...
看圖學習｜中華優秀傳統文化是中華民族...
當前觀察：郴電國際郴州分公司營業班獲...
當前觀察：郴電國際郴州分公司營業班獲...
天天新動態：三亞22日10時起發放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監察機關統籌用好基層監督力量精...
紀檢監察機關統籌用好基層監督力量精...
總投資約36億元，惠州新材料產業園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發行熱度持續上升多家龍頭企業扎堆...
GDR發行熱度持續上升多家龍頭企業扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區別_近親屬|當前看點
近親屬和親屬的區別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

欧美色综合网_狠狠色狠色综合曰曰_麻豆精品一区二区av白丝在线_久久精品综合一区

科技

熱文