7777色淫在线视频,无码高清一区二区久操

AI Codec自2016年首次提出以來，眾多海內外高校、企業(yè)研究院等機構對此展開了廣泛研究。6年時間里，AI Codec 的SOTA方案的壓縮性能已經超越了H.266(最新的傳統(tǒng)Codec標準)，展現(xiàn)了強大的技術潛力。但受限于計算復雜度、非標等原因，AI Codec在應用落地方面的案例卻屈指可數(shù)。LiveVideoStackCon2022北京站邀請了來自雙深科技的田康為大家分享基于雙深科技的AI Image Codec技術落地探索經驗。

文/田康編輯/LiveVideoStack

大家好，本次分享的主題為：AI Image Codec技術落地實踐，主要將分三部分介紹我們在移動端方面取得的技術成果。第一部分介紹圖像視頻行業(yè)發(fā)展趨勢和我們的理解；第二部分簡單總結AI Codec發(fā)展；第三部分為重點，即AI Image Codec移動端落地實踐。

-01-

圖像視頻行業(yè)發(fā)展趨勢

首先介紹圖像視頻行業(yè)發(fā)展趨勢，“我們身處圖像數(shù)據(jù)大爆發(fā)的時代”可能已成為了一項行業(yè)共識。據(jù)我們從相關機構取得的調研數(shù)據(jù)顯示，全球圖片視頻數(shù)據(jù)總量至2025年預計將超過140ZB，每年的數(shù)據(jù)復合增長率達到27%，這是一個很恐怖的數(shù)量級。隨著近年來ChatGPT等技術的火爆，相信增長率還會進一步提升。簡單分析數(shù)據(jù)量迅速增長的原因：首先是在醫(yī)療、安防等應用場景下，影像數(shù)據(jù)按照國家政策要求需要長期或永久存儲，導致數(shù)據(jù)積累量越來越大。第二是隨著大眾對高畫質、高幀率等高質量視頻需求的增長，導致數(shù)據(jù)密度提升。第三是隨著視頻數(shù)據(jù)在互聯(lián)網(wǎng)、安防、無人機、云游戲（不同于傳統(tǒng)游戲，過程中伴隨著超大量視頻傳輸）等等多種應用場景的拓展帶來了數(shù)據(jù)量的巨量增長。那么要高效運用這些數(shù)據(jù)必定伴隨著壓縮、傳輸和存儲等底層技術的發(fā)展優(yōu)化，我們認為壓縮技術的提升是其中的關鍵，主要原因有三個：首先是帶寬和存儲的提升是有瓶頸的。其次針對野外巡檢等特殊應用場景，增加帶寬并不適用。第三是存儲和帶寬的提升并沒有從根本解決傳輸數(shù)據(jù)量龐大這個問題。

上圖為我們設計的視覺AI應用鏈路圖，首先通過攝像頭或計算機生產影像內容，然后進行修復、剪輯或AI審核等處理，并將數(shù)據(jù)呈遞給用戶進行數(shù)據(jù)查看，過程中可能伴隨著AI動作識別交互或超分，隨后傳遞至存儲設備進行數(shù)據(jù)存儲。在應用前通過文本、圖片、跨模態(tài)等檢索方式查找所需的數(shù)據(jù)，最終可以對其進行結構化解析和隱私/分布式計算等應用。可以看到整個流程都由編解碼來進行銜接。同時在每個環(huán)節(jié)都可能存在AI的應用，這也是數(shù)據(jù)處理后續(xù)的發(fā)展趨勢。和傳統(tǒng)編解碼相比，AI端到端編解碼在天然上更適應這種趨勢。從算法層面來看，AI編解碼以提取的圖像特征直接進行下游應用，從而節(jié)約了下游特征提取計算量。從硬件層面來看，AI的大量應用使當下硬件都或多或少地帶有AI算力，這同時為AI編解碼的應用創(chuàng)造了條件。

-02-

AI Codec發(fā)展

接下來介紹AI Codec的發(fā)展，上圖為傳統(tǒng)和AI編解碼發(fā)展歷程的對比?？梢钥吹?，AI Codec壓縮性能超越傳統(tǒng)的H.264、H.265僅使用了傳統(tǒng)方法1/6的發(fā)展時間。從1988年的H.261到2020年的H.266，相較于傳統(tǒng)編解碼器平均十年一次的迭代頻率，AI編解碼實現(xiàn)了飛速發(fā)展，從2016年端到端編碼框架的提出到后續(xù)GAN、1857標準的應用，甚至是后續(xù)AIGC編碼發(fā)展方向的出現(xiàn)，它在短時間內不斷涌現(xiàn)可落地應用的各種新方法。

另一方面是AI芯片行業(yè)的發(fā)展同時為AI編解碼提供了落地土壤。近年來GPT-4、AIGC的大規(guī)模使用在側面推動了AI芯片業(yè)整體的快速發(fā)展，隨著行業(yè)利好，高通等著名邊緣芯片企業(yè)也在逐步啟動對AI芯片的開發(fā)研究。其次是存算一體、類腦芯片、量子計算等未來技術為芯片算力發(fā)展帶來了更好前景。

-03-

AI Image Codec移動端落地實踐

接下來介紹我們關于AI Image Codec在移動端的落地實踐，以互聯(lián)網(wǎng)移動端CDN圖片分發(fā)場景為應用場景，首先解釋采用該場景的原因。

第一，當下大量社交、內容社區(qū)、電商APP均涉及該場景，中心端以一對多方式進行圖片的分發(fā)，即使是抖音這種小視頻平臺也會涉及很多圖片內容。同時由于CDN 80%左右的運營成本為流量帶寬費用，因此它有很大的圖片壓縮訴求，優(yōu)化圖片壓縮技術可以有效節(jié)約成本。第三是該場景為閉環(huán)場景，可以解決目前AI Codec非標的問題。最后是移動端的AI算力相對于其他物聯(lián)網(wǎng)設備較強，可以實現(xiàn)更好的編解碼效果。

以上為我們自研的AI圖像編解碼模型框架，它被稱為ANF。不同于傳統(tǒng)編解碼器通過分塊預測處理來進行數(shù)據(jù)壓縮，ANF編解碼器在接收圖片后，通過神經網(wǎng)絡提取高層像素規(guī)律作為數(shù)據(jù)量化和輔助熵模型概率預估的依據(jù)。數(shù)據(jù)最終傳遞至傳輸端進行熵解碼和像素重建，向用戶呈現(xiàn)圖片。

我們在整個流程中針對AI訓練設置了兩個約束，第一是R-Loss，它代表比特流和超先驗的存儲信息量；第二是D-Loss，它用于衡量輸入和輸出圖片之間的質量差，以上兩個指標都需要保持盡量小。

針對該模型我們也提出了一些優(yōu)化策略，如在特征提取階段采用Neighbor-patch-attention策略來參考周邊信息，提取更深層次特征。其次是在熵模型概率預估階段: 采用Space Shuffle策略，提升概率估計準確度。第三是在超先驗階段，將局部感受野擴展到全局感受野來提取更準確的輔助信息。

右圖為測試結果，其中紅線代表ANF模型數(shù)據(jù)，可以看到相比于VVC等傳統(tǒng)編碼器，它的測試結果要超出0.5～0.7dB左右。

由于ANF模型的架構比較復雜，為了更好的在移動端上進行應用，我們對它進行了輕量化處理，在量化和部署加速方面做了相當多的工作。在畫質損失盡量小的前提下盡量獲取加速收益。

以上是輕量化后的ANF模型和其他編解碼器使用LPIPS指標測試的對比結果，用于衡量ANF和其他編解碼器之間的差距，該指標越小代表壓縮后的圖像和原圖主觀質量越接近。通過在多種場景下測試可以看到，ANF壓縮的圖片質量要明顯優(yōu)于其他編解碼器。

在客觀指標結果較好的基礎上，我們組織對壓縮圖像進行了主觀評測，選擇了數(shù)十種不同場景，約兩萬張涵蓋不同分辨率的圖片作為數(shù)據(jù)集進行測試。以avif的壓縮圖像作為基準進行對比，按照三種不同比例將原始圖片用ANF和avif編解碼器進行壓縮，將壓縮后的圖片從相同位置裁取100*100左右大小的塊，與原圖對應小塊對比壓縮畫質，最后征集志愿者進行測評。

下表為評測結果，可以看到同體積下，主觀選擇ANF的比例(49.4%)明顯高于AVIF(18.6%)，說明ANF主觀質量明顯比AVIF好; 體積比為1:1.4時，結果與1:1時相同；體積比為1:2時，選擇ANF和AVIF的次數(shù)相當，且有較大比例“不選擇”，說明兩者主觀畫質相當。

以上為同體積比下，兩種編碼器的測試效果圖，可以看到ANF壓縮圖片的質量和原圖更加接近。

以上為體積比為1:1.5時，兩種編碼器的測試效果圖?？梢钥吹紸NF的圖像細節(jié)效果仍然不錯。

接下來介紹ANF的解碼速度，我們在驍龍8gen1平臺上對解碼速度進行了測試，使用自封SDK測試從圖片載入到最終在移動端顯示所需的時間?？梢钥吹皆?080P分辨率下，ANF的平均延遲可以達到29.4毫秒，這個量級是人眼感受不到的，可以滿足應用需求。

以上為編碼吞吐對比結果，在同樣的硬件條件下和傳統(tǒng)編碼器相比，ANF可獲得10-30倍的編碼加速。

以上為壓縮對二次識別檢測影響的測試結果，選取了精確率和召回率兩個指標進行衡量?？梢钥吹皆诘蛪嚎s比下，ANF壓縮圖片的檢測精度略高于avif, 兩項指標與原圖相當；在高壓縮比下，ANF壓縮圖片的檢測精度明顯高于avif, 與原圖的差距保持在2-5%范圍。

接下來進行總結，首先在當前的圖像視頻大爆發(fā)時代，我們認為編解碼技術的提升迫在眉睫和勢在必行的。第二是圖像處理AI化的趨勢明顯，基于AI的編碼方式從算法和硬件層面均能夠更好地協(xié)同。第三是AI Codec的發(fā)展速度很快，未來發(fā)展前景光明；同時AI Codec的發(fā)展也順應了AI芯片發(fā)展的趨勢。最終我們基于AI Codec的主觀優(yōu)化，可以超過AVIF 30%以上，解碼效率可在高端機型落地，編碼效率顯著優(yōu)于傳統(tǒng)Codec的CPU軟編方案，具備在CDN圖片場景落地的可行性。我的分享到此結束，謝謝大家！
責任編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

帶寬

帶寬

+關注

關注
3

文章
993

瀏覽量
41940
AI

AI

+關注

關注
88

文章
34592

瀏覽量
276309
移動端

移動端

+關注

關注
0

文章
42

瀏覽量
4568

原文標題：AI Image Codec技術落地實踐

文章出處：【微信號：livevideostack，微信公眾號：LiveVideoStack】歡迎添加關注！文章轉載請注明出處。

搜索歷史

AI Codec在應用落地方面的案例

評論

電子發(fā)燒友