歡迎來(lái)體驗(yàn)
什么是最懂你的中文語(yǔ)音識(shí)別算法

華少的快,矮大緊的京范兒口音,神仙打架的《奇葩說(shuō)》,這些復(fù)雜場(chǎng)景的語(yǔ)音識(shí)別有多難?今天依圖帶你領(lǐng)略新鮮出爐的語(yǔ)音識(shí)別算法實(shí)力。

今天開(kāi)始,依(zei)圖(hao)語(yǔ)音開(kāi)放平臺(tái)上線了!

 

業(yè)內(nèi)首次
系統(tǒng)測(cè)試主流語(yǔ)音識(shí)別廠商的技術(shù)性能


(測(cè)試完成于2018年11月底)

在全球最大中文普通話數(shù)據(jù)庫(kù)AISHELL-2的三個(gè)測(cè)試子集、Accent近場(chǎng)口音測(cè)試集、Chat近場(chǎng)安靜聊天測(cè)試集上,依圖語(yǔ)音識(shí)別算法最近測(cè)得多項(xiàng)第一。AISHELL-2數(shù)據(jù)規(guī)模達(dá)1000小時(shí),是目前全球最大的中文開(kāi)源數(shù)據(jù)庫(kù)。在AISHELL2-2018A-EVAL數(shù)據(jù)集中,依圖語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到96.29%,字錯(cuò)率(CER)為3.71%,領(lǐng)先第二名約17%。

無(wú)論是語(yǔ)音助手還是節(jié)目,電話客服或是閑聊,依圖更懂你。

 

依圖語(yǔ)音識(shí)別性能優(yōu)于第二名約17%
語(yǔ)音未來(lái)任重道遠(yuǎn)

通過(guò)手機(jī)近距離收集聲音,依圖優(yōu)于第二名約17%,字字再現(xiàn)強(qiáng)時(shí)效內(nèi)容

語(yǔ)速超快又有地方口音?依圖和訊飛挺下來(lái)了

考驗(yàn)系統(tǒng)是不是夠“皮實(shí)”、夠“穩(wěn)健”的時(shí)候到了!在遠(yuǎn)距離場(chǎng)景,環(huán)境中會(huì)存在噪聲、混響和反射,依圖和訊飛聽(tīng)見(jiàn)優(yōu)勢(shì)明顯

從技術(shù)性能來(lái)說(shuō),字錯(cuò)率曲線抖動(dòng)越小,算法的場(chǎng)景通用性越好。綜合各場(chǎng)景測(cè)試的結(jié)果,業(yè)界主流算法中,依圖和訊飛的算法字錯(cuò)率抖動(dòng)相對(duì)較小。

但是同樣說(shuō)明了語(yǔ)音識(shí)別的發(fā)展既有驚喜也有遺憾。各大廠商的近場(chǎng)場(chǎng)景識(shí)別能力讓我們感受到了科技的力量,而加入遠(yuǎn)場(chǎng)演講的高難度場(chǎng)景的識(shí)別能力不足,也表明了未來(lái)的路還很遠(yuǎn)。

 

花式挑戰(zhàn)算法性能
依圖表現(xiàn)穩(wěn)定

聽(tīng)寫大會(huì)小程序一經(jīng)發(fā)布,各種評(píng)(tiao)測(cè)(xi)洶涌而來(lái)。依圖語(yǔ)音憑借自身優(yōu)秀的技術(shù),展現(xiàn)了極其穩(wěn)定的語(yǔ)音識(shí)別能力。

再熱血的足球解說(shuō)我們hold住

繞口令?依圖能聽(tīng)清!

語(yǔ)音識(shí)別歌詞,依圖可帶勁啦!

 

呂昊博士現(xiàn)場(chǎng)演示的這款“聽(tīng)寫大會(huì)”小程序也是業(yè)界第一次基于公開(kāi) API 將市場(chǎng)上的主流語(yǔ)音識(shí)別技術(shù)性能做比較——?dú)g迎大家去花式調(diào)戲!


 

 

此次測(cè)試的安靜對(duì)話和混響的數(shù)據(jù)集,依圖也將在線公布,敬請(qǐng)期待!

您可以復(fù)制這個(gè)鏈接分享給其他人:http://www.dfk3a.com/node/539