AI和企業(yè)通信最初的融合是用戶需求驅(qū)動(dòng)的結(jié)果,比如會(huì)議攝像頭需要手動(dòng)調(diào)試找到最佳角度,或者開會(huì)時(shí)面對第一次見面的同事對不上名字的尷尬。后來在解決這些問題的過程中發(fā)現(xiàn),AI能解決很多用戶體驗(yàn)欠佳的痛點(diǎn)需求,所以被廣泛應(yīng)用在企業(yè)通信中。
目前被應(yīng)用在企業(yè)通信領(lǐng)域的AI技術(shù)子領(lǐng)域主要包括語音識別、計(jì)算機(jī)視覺兩方面。跟艾科法小編一起來看看吧。
1、自動(dòng)取景:
在會(huì)議終端中,這項(xiàng)功能集成人臉檢測、聲源定位、語音追蹤等多項(xiàng)AI技術(shù),能根據(jù)參會(huì)人數(shù)與位置變化自動(dòng)調(diào)整畫面大小,呈現(xiàn)最佳取景。此外,還能實(shí)時(shí)檢測發(fā)言者位置呈現(xiàn)特寫,免去手動(dòng)調(diào)節(jié)攝像機(jī)操作,像有一個(gè)自動(dòng)導(dǎo)播員,讓與會(huì)人員更專注于會(huì)議內(nèi)容。
2、人臉識別
在會(huì)議中,系統(tǒng)能自動(dòng)標(biāo)記身份信息,即便你不認(rèn)識與會(huì)人員也不用浪費(fèi)時(shí)間自我介紹,系統(tǒng)能自動(dòng)識別并提供該人員信息。
3、語音識別
利用語音識別技術(shù),能夠識別語音并自動(dòng)轉(zhuǎn)寫為字幕,上下文語義推斷還能實(shí)時(shí)更正。會(huì)后自動(dòng)生成會(huì)議紀(jì)要,會(huì)議助理可以在會(huì)后快速整理會(huì)議決議,第一時(shí)間同步到項(xiàng)目群聊中留檔,形成有效的會(huì)議閉環(huán)。
4、智能噪聲消除
噪聲抑制是通訊設(shè)備和視頻會(huì)議軟件中的基本功能,但過去噪聲抑制技術(shù)通常都是基于聲音頻譜特征進(jìn)行信號濾波處理,對與人聲差別明顯的環(huán)境噪音和穩(wěn)態(tài)噪聲才有比較好的抑制效果,例如會(huì)議背景音里空調(diào)運(yùn)行的聲音,開關(guān)門的聲音。
在AI技術(shù)發(fā)展起來后,通過深度學(xué)習(xí)和傳統(tǒng)信號處理相結(jié)合的方式,實(shí)現(xiàn)人聲和背景噪聲的分離,從環(huán)境噪音中提取出清晰的人聲,這就突破了傳統(tǒng)信號處理降噪方案的瓶頸。從抑制噪聲提升到消除噪聲,從特定場景擴(kuò)展到更多場景的噪聲消除。
更多AI應(yīng)用在企業(yè)通信、生活中案例,歡迎咨詢艾科法智能。