智能語音識別系統(tǒng)

智能語音識別技術作為現(xiàn)代會議系統(tǒng)的發(fā)展新方向,賦予了會議產(chǎn)品更智能的人機交互體驗。傳統(tǒng)會議的發(fā)言交流通常僅通過瞬時的視頻與聲音進行傳達,與會者的注意力需要時刻保持高度集中,尤其是在信息量較多的各種重要會議中,與會者難以同時做到一邊聽,一邊記錄,一邊分析整理發(fā)言內容,需要對多語種發(fā)言進行現(xiàn)場翻譯的會議更是難以高效進行。同時,用戶會后的文件處理、會議紀要及特定用戶的法定程序也要求必須以文字的形式呈現(xiàn)。

GONSIN公信智能語音識別系統(tǒng)可將每個座席的發(fā)言語音實時轉寫成對應的有序的文字內容;系統(tǒng)具備角色分離功能,確保轉寫后的文字與各座席的語音一一對應。

選用在線語音識別及翻譯方案,可對不同語種(有指定的支持語種范圍)的發(fā)言進行實時在線翻譯,譯文可設置為指定的語種。語音識別轉寫的文字及在線翻譯生成的譯文能實時同步顯示在會場內的大屏顯示系統(tǒng)和GONSIN公信無紙化會議系統(tǒng)屏幕上,同時系統(tǒng)將記錄發(fā)言語音,自動生成會議紀要。

該系統(tǒng)適用于多種應用場景,實現(xiàn)包括會議紀要、實時演講字幕、訪談錄音轉寫、跨語種商務洽談、法庭庭審實時記錄等。



 


公信智能會議管理軟件-語音識別模塊 V7.1.0
基本功能
? 支持公有云、專有云語音服務器選擇對接。可滿足不同的服務器部署方式,靈活適用于多種應用場景
? 支持ASR服務器關機管理功能,支持ASR服務器、討論系統(tǒng)連接、搜索,以及話筒角色自定義功能,并支持公信各系列討論系統(tǒng)無縫對接,實現(xiàn)會議管理、角色分離、與自動識別
? 支持人員設備管理,包括設備搜索、顯示單元號信息、IP地址信息、人員姓名設置;支持會議信息編輯,包括新建會議名稱、定義會議時間、地點、及會議內容編輯等
? 支持對多個話筒角色同時識別,支持防串音功能,可以有效避免多個話筒同時識別時的相互串音;支持話筒狀態(tài)提示,可實時顯示話筒開啟與關閉狀態(tài)
? 支持語言模型學習功能。支持人名、地名等常用詞導入,對語言模型進行學習
? 支持自動識別與會人員的角色,自動識別與會人員的語音并轉寫成文字。軟件支持翻譯成其他所需要的語音(軟件功能根據(jù)引擎能力有所區(qū)別)
? 支持智能化語義理解,可自動理解與會人員的語義,并根據(jù)語義進行自動斷句與分段。支持對連續(xù)數(shù)字阿拉伯格式自動轉換,支持自動識別手機號碼、身份證等連續(xù)數(shù)字轉換成阿拉伯格式
? 支持會議文字編輯與矯正功能。對不同角色語音生成生成單獨的錄音文件,或合并各角色的文字記錄及錄音錄音。語音與文字記錄可同步回放并對照顯示,實現(xiàn)文檔校正
■ 支持會議記錄輸出功能。支持文字合并,生成會議紀要,并導出文本
■ 支持內容檢索功能,支持文字內容搜索。可對關鍵字進行搜索,快速定位相應內容的位置,大大提高了內容檢索的效率
? 支持文字分屏輸出功能。轉寫文字實時顯示在操作電腦主屏,支持擴展分屏輸出,實時顯示語音識別的文字內容。支持屏幕定制功能,屏幕分辨率自適應,支持文字字體、大小設置,提供優(yōu)質的分屏文字顯示服務
? 支持錄音文件識別,通過錄音文件導入,自動將錄音文件內容轉換成文字內容;支持mp3、wav等文件格式
? 支持選擇音頻輸入設備,可以連接電腦的音頻輸入設備,實時音頻輸入轉錄文字
■ 支持電腦當前播放聲音內容識別,并自動轉換成文字
■ 支持更多自定義功能:軟件支持中、英文切換,以及其他自定義語言;支持二次開發(fā),可根據(jù)項目需求開放接口協(xié)議或定制開發(fā)



 

輕量級智能語音識別服務器
GX-AS201/GX-AS202/GX-AS205/GX-AS208

輕量級智能語識別服務器是針對中小型會議應用場景的智能語音識別計算產(chǎn)品,內置輕量級的智能語音識別引擎,具備轉寫 速度快、識別率高、易部署,穩(wěn)定性強等特點。可滿足需要語音轉寫和記錄的會議場景,實現(xiàn)有效的會議留痕。同時服務器體積 小,系統(tǒng)對接簡單,使用便捷,方便攜帶,可滿足針對不同會議場所的快速設備切換和系統(tǒng)搭建,實現(xiàn)有效的設備共享。適用于固 定會場、臨時會場及租賃性質的會議場景。

基本功能
內嵌ASR智能語音識別引擎
不同型號的語音識別服務器可實現(xiàn)不同數(shù)量的語音轉寫能力
GX-AS201:支持1路語音識別能力
GX-AS202:支持2路語音識別能力
GX-AS205:支持5路語音識別能力
GX-AS208:支持8路語音識別能力
業(yè)界領先的單遍大規(guī)模語言模型解碼技術
? 標準引擎支持普通話及普通話體系的方言及口音識別
? 支持外語(需定制):英語、西班牙語、阿拉伯語、俄語、法語等
? 可定制金融、政法、醫(yī)療、教育等用行業(yè)識別引擎
配合GONSIN會議管理系統(tǒng),可實現(xiàn)各參會角色的語音分離識別,滿足同一場會議內多個話筒同時打開的語音識別需求
 

智能語音識別服務器 GX-AS301
內嵌ASR智能語音識別引擎V3.0以及語音轉寫模塊授權V1.0



基本功能
安裝ASR智能語音識別引擎V3.0軟件
局域網(wǎng)內(會議中心/多會議室集群)多個會議室語音識別。
支持公信全系列討論系統(tǒng)產(chǎn)品,同一時間最大支持50路語音轉寫(根據(jù)語音轉寫模塊的授權數(shù))
最大支持50路語音識別并發(fā)授權
業(yè)界領先的單遍大規(guī)模語言模型解碼技術
? 標準引擎支持普通話及普通話體系的方言及口音識別
? 支持外語(需定制):英語、西班牙語、阿拉伯語、俄語、法語等
? 可定制金融、政法、醫(yī)療、教育等用行業(yè)識別引擎
高效率CTC模型,通過選配授權,最大支持50路語音并發(fā)識別
支持會議中心多會議室局域網(wǎng)集中部署,滿足多會議室并行語音轉寫
? 配合GONSIN管理系統(tǒng),可實現(xiàn)各角色分離識別
? 支持在會議中心集群部署或本地會議室部署


音頻擴展器 DCS-AE04
基本功能
■ 支持設備級聯(lián),最大可級聯(lián)至32通道 
■ 支持DA/AD兩種工作模式,可根據(jù)不同的應用場景進行設置:
 ■ DA模式:可將數(shù)字音頻轉成模擬音頻,實現(xiàn)系統(tǒng)擴展
 ■ AD模式:可將模擬音頻轉換成數(shù)字音頻,實現(xiàn)數(shù)字傳輸



 

ASR智能語音識別引擎V3.1/ V3.2

? 采用業(yè)界領先的在線語音識別技術,通過云端部署,為本地語音提供語音識別服務。低延時,高識別準確率,準確率可達到99%以上
■ 引擎采用套餐付費模式,有效降低語音識別的投入成本和建設門檻。用戶可以根據(jù)實際語音識別的時長需求,購買合適時長的套餐方案(請及時購買套餐服務,以確保引擎的正常使用)
? 支持角色分離識別:可根據(jù)不同角色選擇不同的原語種和翻譯語種,實現(xiàn)多語種同時識別,轉寫成為相應的文字,并翻譯成翻譯語種的文字信息
? 支持國際上多個主流語種,包含中文、英語、法語、俄語、阿拉伯語、西班牙語等,滿足國際大多數(shù)語言使用需求
? 搭配公信智能語音識別字幕顯示軟件,可同時顯示原文和翻譯文字,或設置單獨顯示原文/譯文,為跨語種商務洽談、跨語種視頻會議提供字幕服務

ASR智能語音識別引擎V3.0
■ 采用智能化語言識別模型技術,基于AI智能技術實現(xiàn)語音識別
? 標準引擎支持普通話語系識別,支持普通話及普通話體系的方言及口音識別
? 支持多種國外語言識別。支持定制英語、西班牙語、阿拉伯語、俄語、法語等國外語言識別
? 支持應用領域語系識別。支持教育、司法、醫(yī)療、會議演講、新聞媒體、娛樂視頻、智能家居、社交、汽車等應用領域及應用場景識別