面向高動態顯示的自適應動態範圍增強

Adaptive Dynamic Range Enhancement Oriented to High Dynamic Display

最近,對超高清(UHD)視頻服務的需求不斷增長。UHD視頻提供大量數據的逼真的觀看體驗,正在徹底改變視頻生態系統並推動信息產業的升級。在這種背景下,超高清視頻大數據的指數增長與有限的存儲空間以及傳輸帶寬之間的矛盾日益突出。面對這些挑戰,來自ITU-T和MPEG的視頻專家聯合團隊已經啟動了下一代視頻編碼標準多功能視頻編碼(VVC)項目。在VVC中,採用了新的編碼結構和一組編碼工具,與以前的HEVC標準相比,它們大大提高了編碼性能。隨著標準化進程的發展,研究編碼器優化算法顯得尤為重要和迫切,這不僅有利於將來VVC標準的實施和部署,而且為標準化進程提供了有益的信息和指導。

 

在這個項目中,我們將利用人工智能技術,從高效速率控制和低複雜度編碼的角度系統地研究VVC編碼器的優化。特別是,我們首先研究VVC中UHD視頻的速率失真特性,以規範編碼比特率。更具體地,利用結合了四叉樹-二叉樹和三叉樹劃分的新編碼結構來研究速率量化和失真量化關係,並且基於增強學習的最新發展實現了智能速率控制。這樣,優化了每個幀和CTU的編碼位數,以實現高效率速率控制。此外,我們將速率失真模型擴展到VVC編解碼器的聯合速率失真複雜度(RDC)優化,目的是在低失真編碼的速率失真性能和編碼複雜度之間取得良好的平衡。特別是,通過使用高級機器學習技術對它們之間的關係進行建模,可以在復雜性受限的情況下確定編碼器結構。此外,可以通過複雜度分配策略進一步優化編碼模式的決策。通過對本地RDC關係進行智能建模,可以為每個編碼單元優化複雜度分配,以實現整體最佳編碼性能。預計該研究結果將被基於UHD視頻的各種應用所採用,包括視頻監視,數字電視廣播,IPTV,視頻通信和Internet視頻。