10月14日-10月16日,2022年IEEE (電氣電子工程師學會)組織的國際電子商務工程會議(ICEBE會議)在英國伯恩茅斯舉行。

 

保利威技術副總裁梁瑛瑋、保利威CTO黃海亮、華南理工大學博導吳慶耀教授在【AI音視頻技術】領域的兩篇學術論文入選,并在會議中公開發表。

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

 

ICEBE 今年共接收44篇,保利威被錄用的兩篇論文主要涉及「智能語音識別屏蔽」「AI視頻水印技術」的前沿研究,分別為:

 

· 《An End-to-End Speech Recognition System Based on Shared Encoder 》(基于共享編碼器的端到端語音識別系統)

 

· 《Robust Video watermarking based on deep neural network and curriculum learning》(基于深度神經網絡和課程學習的高健壯性視頻水印)

 

截至2022年10月,保利威已獲得52項發明專利以及62項軟件著作權。

 

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

 

《基于共享編碼器的端到端語音識別系統》一文介紹了行業上對于智能語音識別存在大量需求,不僅于語音轉文字,更在于對語音實時監測并屏蔽,以確保直播的安全合規性。
 
論文詳解了基于共享編碼的語音識別機制,將每一個音節作為獨立的單元模塊提升語音識別準確度,并采用流失+智能斷句的方式,在保證可接受的延遲范圍內保障直播穩定推流。

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

▲基于音節單元模塊的共享編碼系統

 

基于與華工合作的語音識別引擎,保利威目前已完成產品功能層面的對接與測試,顯示出適配各項業務場景、高度安全、識別穩定等優勢,為技術商業化提供有力支撐。

 

隨著雙方的進一步研究深入,該智能語音引擎將有望大規模應用于直播字幕、翻譯、警報、自動化營銷等企業業務場景。據保利威觀察,AI語音違法內容自動識別屏蔽在金融合規、營銷直播、活動直播等場景有著重要意義,能切實有效地幫助客戶降低直播風險,保障直播合規。
 

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

 

《基于深度神經網絡和系統學習的高可用性視頻水印》一文則是介紹了視頻水印對于視頻防盜的重要性,并闡釋了視頻切片編碼技術在添加動態水印的底層邏輯

 

該技術會自動對視頻每一幀進行切片并嵌入動態水印,最后輸出成私有化格式(區別于常見的視頻格式,如MP4、MOV等),從而提升視頻破解難度,兼顧兼容性和安全性。

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

▲嵌入和提取視頻水印的完整流程

 

目前,保利威已將該視頻切片技術應用于旗下PlaySafe版權防盜體系中,從防錄屏、防下載、異常行為監測等多維度護航視頻安全。

 

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

▲ 保利威PlaySafe視頻安全保護體系 

 

據保利威觀察,防止視頻內容被盜已不局限與職教、培訓等內容生產機構,在企業側,尤其是金融、醫療、汽車等大型企業對于內容安全的要求也更愈發高漲,視頻水印技術應用愈發深入,能有效地幫助企業方式視頻內容失竊。

 

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

 

2019年,華南理工大學和易方信息科技股份有限公司成立了「智能音視頻聯合實驗室」!

 

重磅!保利威兩篇【AI音視頻技術】論文入選「IEEE 國際電子商務工程會議」!

 

該實驗室充分發揮了保利威在音視頻領域的技術積累和行業經驗,并結合華工在大數據分析、AI技術、智能訓練模型等領域的研究實力,共同創新智能音視頻技術領域的應用!

 

此次,兩篇論文被國際學術會議公開發表,不僅是實驗室技術探索的成果體現,也是校企合作的一次成功實踐,更是產教融合,產學研一體化的縮影。

 

未來,雙方將繼續深化合作,促進產教融合,推動音視頻技術的應用和產業化進程,構建產學研用一體化平臺,為數字中國注入新動能。

 

深耕企業直播賽道9年,保利威持續探索音視頻技術的可能性,堅持與高校及科研機構協同共創,并將創新成果付諸于產品之上,打造符合市場需求及可用性的產品。

 

作為企業級視頻SaaS領導品牌,保利威自研并落地了SaaS化MR、PRTC無延遲直播、PlaySafe版權保護等一系列前沿音視頻技術,技術產品化,技術服務化,推動音視頻技術商業化,引領行業發展!