
極限元是國(guó)內(nèi)領(lǐng)先的人工智能技術(shù)公司,以“智能交互”為核心,擁有自主產(chǎn)權(quán)的智能語(yǔ)音、人機(jī)對(duì)話、機(jī)器視覺(jué)、大數(shù)據(jù)分析等AI技術(shù),推出了云端、桌面、嵌入式等跨平臺(tái)AI技術(shù)解決方案,產(chǎn)品和服務(wù)廣泛應(yīng)用于教育、安全、交通、智能硬件等多個(gè)領(lǐng)域。
公司致力于發(fā)展智能交互技術(shù),與中國(guó)科學(xué)院自動(dòng)化研究所掛牌成立了“智能交互聯(lián)合實(shí)驗(yàn)室”服務(wù)于騰訊、奇虎360、搜狗等公司以及網(wǎng)信辦、公安部門(mén)等國(guó)家相關(guān)安全機(jī)構(gòu)。
核心技術(shù)優(yōu)勢(shì):
。1)前端信號(hào)處理
通過(guò)前端處理模塊可以有效抑制噪聲、混響、回聲的干擾,增強(qiáng)語(yǔ)音的可懂度,提高真實(shí)環(huán)境下語(yǔ)音識(shí)別的魯棒性;在智能家居、智能車(chē)載等領(lǐng)域有廣泛應(yīng)用。
。2)聲紋識(shí)別
聲音就是密碼,自動(dòng)識(shí)別說(shuō)話人身份,實(shí)現(xiàn)快速精準(zhǔn)的身份認(rèn)證。
。3)情感識(shí)別
能夠精確探測(cè)用戶的面部表情、語(yǔ)音語(yǔ)調(diào)、語(yǔ)言情緒等特征,識(shí)別喜、怒、哀、驚、懼情緒,并在此基礎(chǔ)上,制定擬人化的情感交互模型和對(duì)話策略。(如使用于呼叫中心質(zhì)檢等場(chǎng)景)
。4)語(yǔ)音識(shí)別
將語(yǔ)音識(shí)別成文字,讓機(jī)器具有人類(lèi)一樣的聽(tīng)力。識(shí)別準(zhǔn)確率達(dá)97%以上,支持方言口音識(shí)別、智能降噪,識(shí)別實(shí)時(shí)率<0.15.
(5)語(yǔ)音合成
將文字合成為語(yǔ)音,讓機(jī)器說(shuō)話,媲美真人發(fā)聲,專(zhuān)業(yè)MOS分可達(dá)4.4,多方言、多語(yǔ)種、多音色的音庫(kù)選擇,支持個(gè)性化語(yǔ)音定制。
(6)人機(jī)對(duì)話
實(shí)現(xiàn)多類(lèi)型人機(jī)對(duì)話管理,結(jié)合上下文的多輪對(duì)話,面向口語(yǔ)的語(yǔ)義理解,基于語(yǔ)音的魯棒性問(wèn)答。
解決方案
。1)語(yǔ)音質(zhì)檢
針對(duì)現(xiàn)行業(yè)內(nèi)運(yùn)用的質(zhì)檢方式的諸多弊端,“極限元”采用了基于語(yǔ)音識(shí)別、語(yǔ)音關(guān)鍵詞檢索技術(shù)、音頻對(duì)比技術(shù)、情感識(shí)別技術(shù)的錄音質(zhì)檢方案。本方法有效的減少語(yǔ)音識(shí)別準(zhǔn)確率不高帶來(lái)的錄音質(zhì)檢誤差,有效提升了錄音質(zhì)檢效率,全面覆蓋人工客服與用戶的每一次對(duì)話,基于度神經(jīng)網(wǎng)絡(luò)算法,智能分析人工客服對(duì)話內(nèi)容,節(jié)約大量的人工成本,同時(shí)根據(jù)各客服系統(tǒng)的工作重點(diǎn)和特點(diǎn),進(jìn)行個(gè)性化設(shè)定與定制。

。2)智能客服
基于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解等技術(shù),可以實(shí)現(xiàn)呼叫中心撥號(hào)音檢測(cè)、智能外呼、智能問(wèn)答、語(yǔ)音導(dǎo)航、智能營(yíng)銷(xiāo)等一系列的功能。應(yīng)用場(chǎng)景:客戶回訪、產(chǎn)品推薦、債務(wù)提醒、信息資訊、業(yè)務(wù)辦理、電話訂購(gòu)等,可應(yīng)用領(lǐng)域包括:金融、保險(xiǎn)、電商、教育、企業(yè)服務(wù)、生活服務(wù)。

(3)語(yǔ)音轉(zhuǎn)寫(xiě)
錄音轉(zhuǎn)寫(xiě)文稿、快速定位回聽(tīng)、視頻字幕制作,可實(shí)現(xiàn)長(zhǎng)句子連續(xù)語(yǔ)音識(shí)別,音頻文本對(duì)齊時(shí)間軸,普通話識(shí)別準(zhǔn)確率高達(dá)96%,幫助各行各業(yè)的用戶實(shí)現(xiàn)高效記錄和信息輸入。應(yīng)用場(chǎng)景包括演講或授課、記者訪談、會(huì)議辦公、影視娛樂(lè)視頻字幕等。
。4)智能交互
多通道語(yǔ)音前端信號(hào)處理方案,嵌入式遠(yuǎn)講語(yǔ)音喚醒,離線模式下語(yǔ)音/指令詞識(shí)別,云-端一體化語(yǔ)音交互方案,可應(yīng)用領(lǐng)域:車(chē)載導(dǎo)航、智能音箱、智能家居、機(jī)器人等。
企業(yè)網(wǎng)址:www.jixianyuan.com