-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
推動萬物互聯(lián)時代人機交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進一步關(guān)注語音,其實在去年11月份的時候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術(shù),并把語音做成一個非常重要的方向。最近蘋果的手機大家也看到了語音技術(shù)的進步,手機廠商對語音技術(shù)進一步產(chǎn)生了更大的關(guān)注,而且要用它來改變所有人機交互的方式。
人類社會進入到了萬物智能互聯(lián)的時代,越來越多的設(shè)備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時候,我們需要更自然的人機對話,用戶才能夠得到更好地體驗,更迅速地學(xué)習(xí),獲得相關(guān)生活中的幫助,我們更需要語音。
星火語音大模型再次升級,會使得萬物互聯(lián)時代下人機交互的革命進一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時就提出來了要實現(xiàn)人機信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡(luò)出臺之后,科大訊飛一直引領(lǐng)著語音技術(shù)的發(fā)展。我們是全世界第一個讓語音識別超過了專業(yè)速記員水平的公司,像這種會議轉(zhuǎn)寫的情況,機器翻譯超過了99%的大學(xué)六級考生,通過了國家翻譯師資格考試;個性化語音合成也給央視的節(jié)目進行配音;我們的多語種技術(shù)在2020年代表中國,在美國把訊飛列入實體清單之后,對中國極限施壓的背景下,多語種技術(shù)依然保持了全球領(lǐng)先,解決了我們的汽車、手機、智能家居等出?!翱ú弊印眴栴}。
我們非常榮幸在幾天前獲得了國家科技進步獎一等獎,這也是中國人工智能領(lǐng)域在深度神經(jīng)網(wǎng)絡(luò)之后的第一個國家科技進步獎一等獎,當(dāng)然也有中國科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為、中國移動等合作伙伴共同努力的結(jié)果。
技術(shù)進一步發(fā)展使得我們在萬物互聯(lián)時代的人機交互標準被重新定義,它應(yīng)該要實現(xiàn)多語言多方言的交互,在遠距離、高噪音場合下也能夠識別,能夠全雙工隨時隨地可以打斷,可以支持多模態(tài),語音、手勢、嘴型等結(jié)合。大家關(guān)注的Open AI發(fā)布的GPT-4o中最重要的一個全雙工功能,實際上使用的是科大訊飛2020年就在國際會議上提出來,在去年5月正式發(fā)布的國際標準。
目前,我們的語音識別在最主流的語種上已經(jīng)繼續(xù)保持了全球領(lǐng)先,這是多語種多方言免切換的演示,在相對安靜的手機等各種場景下,還有更極限的場合,例如強干擾情況下“雞尾酒會”的語音識別場景都能進行識別。
伴隨著技術(shù)的最新進步,我們也有個專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當(dāng)然我們還有更多語種。同時,這個翻譯系統(tǒng)是軟硬一體化的,我在后臺講話,通過語音識別、翻譯、語音合成,每個人戴著耳機就可以聽到,從而實現(xiàn)大會同傳、展廳同傳以及各種旅游同傳。一個人講話所有人聽,我們還會推出軟硬一體化的設(shè)備,讓各種語言混雜在一起可以隨意開會,要把整個軟件和硬件結(jié)合在一起,來解決現(xiàn)在社會的剛需。
將來,我們?nèi)粘5臋C器人進入到各種高噪音環(huán)境下,在各種各樣的服務(wù)場景下,有這樣的能力,我們就不怕機器聽不懂了。語音識別進入到規(guī)模化使用,當(dāng)年我們在手機輸入法上,在全球率先提出手機語音聽寫時代開始到來,它的標志是85%以上的準確率,到89%就可以全面使用了,現(xiàn)在我們的識別中,兩個人混疊場景準確率已經(jīng)到了91%,遠超國際競品,三混疊場景準確率更是完全不一樣,我們準確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場景,噪音已經(jīng)比我們?nèi)酥v話還要高不少的情況下,我們依然能做到90%以上的準確率。
因為這些技術(shù)進步,我們從去年底到今年的國際連續(xù)最權(quán)威的語音識別比賽,一個是國際多通道語音分離和識別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個是今年的上半年國際聲學(xué)、語音和信號處理會議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國際車載多通道語音識別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國500多萬輛汽車出海,成為中國出海的“新三樣”,其中的多語種智能語音技術(shù)幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結(jié)合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會說、能理解會思考”的汽車方案。
- 責(zé)任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對中國提供API服務(wù),周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學(xué)家實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測
2024-06-25 18:20 科技前沿 -
習(xí)近平代表黨中央、國務(wù)院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會為何瞄準這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學(xué)技術(shù)獎勵名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復(fù)使用運載火箭首次10公里級垂直起降飛行試驗成功
2024-06-23 14:58 航空航天 -
純度達99.9%!中國團隊實現(xiàn)海上風(fēng)電驅(qū)動海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學(xué)家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會7月4日開幕,特色亮點搶先看!
2024-06-20 16:00 2024世界人工智能大會 -
我國首個工業(yè)用途核能供汽項目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當(dāng)于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺全高溫超導(dǎo)托卡馬克裝置在上海建成運行
2024-06-19 08:15 -
“美國在核電技術(shù)上落后中國10-15年”
2024-06-18 16:42
相關(guān)推薦 -
解放日?“對于市場而言這是‘屠戮日’” 評論 19“世界變了”,加拿大汽車零部件巨頭瞄準中國市場 評論 26“中國對美反制,巴西看到了機會” 評論 36“眾叛親離!要是再發(fā)生911,誰還同情美國人?” 評論 217她對美放狠話,還提到歐盟的“實力地位” 評論 274最新聞 Hot
-
解放日?“對于市場而言這是‘屠戮日’”
-
交割日已到,香港各界再批:長和“賣港”不得人心
-
魯比奧警告歐盟:不要將美國排除在外
-
又攤上事了,這回還有華爾茲
-
“世界變了”,加拿大汽車零部件巨頭瞄準中國市場
-
德外長插一腳:美烏能不能簽,先得給歐盟“掌掌眼”
-
候任美軍參聯(lián)會主席炒作:若與中國打持久戰(zhàn),我們還有很多不足
-
知名華裔教授失聯(lián)兩周?“異常而危險的信號”
-
“中國對美反制,巴西看到了機會”
-
共和黨人也不滿關(guān)稅,“長期來看,我們都會死”
-
韓網(wǎng)民強扯“中國間諜”喊美軍介入,駐韓美軍急了
-
美國航運巨頭發(fā)話:我們有很多中國船,這錢得美國人掏
-
馬斯克狂撒2500萬,這場“會改變西方文明進程”的選舉還是輸了
-
俄高官有望沖突后首次訪美,“美方暫時解除制裁”
-
美防長稱日本是“前線”,日媒急了
-
美國兩黨拿出對俄制裁草案:征500%二級關(guān)稅
-