日本久久网I久久精品五月天I91wumaI国产又粗又猛又爽I98福利在线I久操人妻I午夜激情AVI中文字幕在线日亚洲9I色综合久久夜色精品国产天堂I午夜爱爱网站I黄色小说免费观看I精品天堂I亚洲欧美性爱I成人av在线影院I丝袜网站黄I91色国产I毛片基地,无码I姝姝窝人体色www聚色窝

EN

明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果

2022-09-13

明略科技即將開源Blockformer語音識別模型,提升銷售過程中的會話智能,助力各行業數智化轉型。

深度學習已成功應用于語音識別,各種神經網絡被大家廣泛研究和探索,例如,深度神經網絡(Deep Neural Network,DNN)、卷積神經網絡(Convolutional Neural Network,CNN)、循環神經網絡(Recurrent Neural Network,RNN)和端到端的神經網絡模型。

目前,主要有三種端到端的模型框架:神經網絡傳感器(Neural Transducer,NT),基于注意力的編碼器-解碼器(Attention-based Encoder Decoder,AED)和連接時序分類(Connectionist Temporal Classification,CTC)。

NT是CTC的增強版本,引入了預測網絡模塊,可類比傳統語音識別框架中的語言模型,解碼器需要把先前預測的歷史作為上下文輸入。NT訓練不穩定,需要更多內存,這可能會限制訓練速度。

AED由編碼器,解碼器和注意力機制模塊組成,前者對聲學特征進行編碼,解碼器生成句子,注意力機制用來對齊編碼器輸入特征和解碼狀態。業內不少ASR系統架構基于AED。然而,AED模型逐個單元輸出,其中每個單元既取決于先前生成的結果,又依賴后續的上下文,這會導致識別延遲。

另外,在實際的語音識別任務中,AED的注意力機制的對齊效果,有時也會被噪聲破壞。

CTC的解碼速度比AED快,但是由于輸出單元之間的條件獨立性和缺乏語言模型的約束,其識別率有提升空間。

目前有一些關于融合AED和CTC兩種框架的研究,基于編碼器共享的多任務學習,使用CTC和AED目標同時訓練。在模型結構上,Transformer已經在機器翻譯,語音識別,和計算機視覺領域顯示了極大的優勢。

明略科技集團高級總監、語音技術負責人朱會峰介紹,明略團隊重點研究了在CTC和AED融合訓練框架下,如何使用Transformer模型來提高識別效果。

明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果

明略團隊通過可視化分析了不同BLOCK和HEAD之間的注意力信息,這些信息的多樣性是非常有幫助的,編碼器和解碼器中每個BLOCK的輸出信息并不完全包含,也可能是互補的。(https://doi.org/10.48550/arXiv.2207.11697)

基于這種洞察,明略團隊提出了一種模型結構,Block-augmented Transformer (BlockFormer),研究了如何以參數化的方式互補融合每個塊的基本信息,實現了Weighted Sum of the Blocks Output(Base-WSBO)和Squeeze-and-Excitation module to WSBO(SE-WSBO)兩種block集成方法。

明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果
明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果

實驗證明,Blockformer模型在中文普通話測試集(AISHELL-1)上,不使用語言模型的情況下實現了4.35%的CER,使用語言模型時達到了4.10%的CER。

明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果
明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果
明略科技Blockformer語音識別模型在AISHELL-1測試集上取得SOTA結果

AISHELL-1是希爾貝殼2017年開源的中文普通話語音數據庫,錄音時長178小時,由400名中國不同地域說話人進行錄制。該數據庫涉及智能家居、無人駕駛、工業生產等11個領域,被高頻應用在語音技術開發及實驗中,是當今中文語音識別評測的權威數據庫之一。
AI Wiki網站Papers With Code顯示,Blockformer在AISHELL-1上取得SOTA的識別效果,字錯率降低到4.10%(使用語言模型時)。

https://paperswithcode.com/sota/speech-recognition-on-aishell-1
明略科技集團CTO郝杰表示,明略的會話智能產品針對基于線上企微會話和線下門店會話的銷售場景,語音識別團隊聚焦美妝、汽車、教育等行業的場景優化和定制訓練,但是也不放松對通用語音識別新框架、新模型的探索,Blockformer模型的這個SOTA效果為語音識別的定制優化提供了一個高起點,明略即將開源Blockformer。

信息填寫

*手機號碼:

請選協議

主站蜘蛛池模板: 久久亚洲精品中文字幕波多野结衣| 成人国产一区二区精品小说| 亚洲午夜性猛春交xxxx| 亚洲成av人片在线观看无| 波多野结衣超清无码专区| 亚洲成av人片在线观看wv| 无线乱码一二三区免费看| av无码国产在线观看岛国| 久久精品人人做人人爽| 少妇无码av无码专区线y| 久久国产天堂福利天堂| 久久永久免费人妻精品我不卡| 精品国产迷系列在线观看| 日本一区二区无卡高清视频| 亚洲乱码日产精品一二三| 寂寞骚妇被后入式爆草抓爆| 久久午夜无码鲁丝片午夜精品| 久久久g0g0午夜无码精品| 艳妇臀荡乳欲伦交换h在线观看 | 人妻洗澡被强公日日澡电影| 成年女人永久免费看片| 色综合视频一区二区三区 | 国产特黄级aaaaa片免| 又粗又黑又大的吊av| 激情第一区仑乱| 伊人久久成人爱综合网| 国产亚洲精品拍拍拍拍拍 | 午夜性色吃奶添下面69影院| 亚洲精品久久久久久下一站| 国产精品久久久av久久久| 亚洲性无码av在线欣赏网| 午夜美女裸体福利视频| 午夜理论片yy8860y影院| 国产欧美国日产在线播放| 久久不见久久见中文字幕免费 | av无码电影在线看免费| 激情五月开心综合亚洲| 人妻另类 专区 欧美 制服| 十八18禁国产精品www| 亚洲国产99精品国自产拍| 777午夜福利理论电影网|