AI 和 AIGC 目前已經(jīng)與我們的工作和生活深度融合, AI將如何影響音視頻開(kāi)發(fā)?AI在給視頻編解碼帶來(lái)畫(huà)質(zhì)提升的收益時(shí),是否會(huì)增加成本?在最近落下帷幕的2023年LiveVideoStackCon2023音視頻技術(shù)大會(huì)上海站中,關(guān)于AI和AIGC的討論遠(yuǎn)比以往更加火熱。大模型、多模態(tài)、AIGC工具……很多專(zhuān)家認(rèn)為,AI和AIGC一定會(huì)對(duì)整個(gè)編解碼行業(yè)產(chǎn)生巨大的革新,但同時(shí)也面臨著更大的挑戰(zhàn)。
英特爾不僅在大會(huì)上分享了音視頻領(lǐng)域的前沿技術(shù)洞察,還聯(lián)合LiveVideoStack為各位技術(shù)人們準(zhǔn)備了一次特別的MINI圓桌晚宴,邀請(qǐng)到了互聯(lián)網(wǎng)頭部企業(yè)的技術(shù)大咖們,既有技術(shù)討論,又有趣味問(wèn)答,通過(guò)“YES”or“NO”的互動(dòng)方式,引發(fā)了嘉賓們的高度參與熱情和對(duì)音視頻技術(shù)應(yīng)用趨勢(shì)的激烈討論。
向左滑動(dòng)看更多精彩瞬間
AI處理對(duì)音視頻來(lái)說(shuō)
是必須的嗎?
在大會(huì)現(xiàn)場(chǎng),英特爾至強(qiáng)產(chǎn)品線軟件架構(gòu)師謝義認(rèn)為,AI將會(huì)越來(lái)越多地應(yīng)用到音視頻處理當(dāng)中。但隨著AIGC的廣泛使用,智能化編碼將面臨著越來(lái)越大的性能瓶頸。而目前人工智能模型訓(xùn)練對(duì)算力的需求,原有的單一的CPU或GPU的單架構(gòu)形態(tài)已經(jīng)無(wú)法完全滿足。謝義認(rèn)為,基于CPU服務(wù)器的全鏈路智能化編碼將成為未來(lái)的趨勢(shì)并解決上述挑戰(zhàn)。
英特爾至強(qiáng)產(chǎn)品線軟件架構(gòu)師謝義
謝義介紹,音視頻的轉(zhuǎn)碼方式有很多種,GPU的速度快,算力高。但CPU有兩個(gè)不可替代的優(yōu)勢(shì):超高的靈活性和復(fù)用性。CPU的升級(jí)成本極低,只需升級(jí)一下軟件部分即可。更何況在云上申請(qǐng)一個(gè)虛擬主機(jī),無(wú)論是docker還是container都可以隨用隨放,十分自由靈活,成本更低。
由于視頻前處理的超分部分算力要求非常高,通常需要通過(guò)GPU來(lái)輔助,但帶來(lái)的問(wèn)題是:客戶將高要求的AI負(fù)載遷移到GPU上,將編碼和前處理完全分離?!斑@就像在一間屋子里解碼——發(fā)送到另一間屋子進(jìn)行前處理——再轉(zhuǎn)回來(lái)編碼。不僅讓流程變得冗長(zhǎng),也對(duì)運(yùn)維造成了極大的負(fù)擔(dān),數(shù)據(jù)的反復(fù)調(diào)度也造成了一定的時(shí)延增加。CPU全鏈路智能化編碼將視頻前處理遷移到CPU上進(jìn)行,正好解決了這一問(wèn)題?!敝x義說(shuō)。
AI在給視頻編解碼帶來(lái)畫(huà)質(zhì)提升的收益時(shí)是否會(huì)增加成本?
事實(shí)上,基于第四代英特爾至強(qiáng)可擴(kuò)展處理器及其內(nèi)置的AI加速器英特爾AMX,以及英特爾發(fā)行版 OpenVINO 軟件幫助視頻編解碼工作者打造全鏈路智能化編碼,就可以讓視頻編解碼AI負(fù)載高效運(yùn)行的同時(shí),降低用戶的成本壓力。
英特爾AMX 專(zhuān)為AI負(fù)載加速而設(shè)計(jì),可優(yōu)化深度學(xué)習(xí)(DL) 訓(xùn)練和推理工作負(fù)載。借助英特爾 AMX,第四代英特爾 至強(qiáng) 可擴(kuò)展處理器可在優(yōu)化通用計(jì)算和 AI 工作負(fù)載間快速轉(zhuǎn)換。同時(shí),由于視頻編解碼處理的整個(gè)pipeline中數(shù)據(jù)的處理速度并不一致,為了讓整個(gè)過(guò)程的數(shù)據(jù)順滑地流動(dòng)起來(lái),就需要針對(duì)FFmpeg的開(kāi)發(fā)工作。而英特爾發(fā)行版 OpenVINO 工具套件讓用戶可以直接進(jìn)行開(kāi)發(fā),在大幅降低開(kāi)發(fā)難度和工作量的同時(shí),讓AI處理更加流暢。
在一個(gè)英特爾合作伙伴的實(shí)際案例中,使用了第四代英特爾至強(qiáng) 可擴(kuò)展處理器及英特爾AMX優(yōu)化的AI推理性能,在視頻增強(qiáng)和目標(biāo)檢測(cè)這兩個(gè)場(chǎng)景下,相對(duì)上一代平臺(tái)分別提升了1.86倍和1.95倍。這也證明了用戶在CPU上完全可以實(shí)現(xiàn)全鏈路的智能化編碼,在AI推理性能提升的同時(shí),大幅降低了部署成本和運(yùn)維成本。
英特爾至強(qiáng)產(chǎn)品線軟件架構(gòu)師謝義表示,英特爾已向全球交付了超過(guò)8500萬(wàn)顆英特爾 至強(qiáng) 可擴(kuò)展處理器,支持著全世界的數(shù)據(jù)中心,可以說(shuō)至強(qiáng)服務(wù)器是數(shù)據(jù)中心的基石。第四代英特爾 至強(qiáng) 可擴(kuò)展處理器一個(gè)重要的革新就是內(nèi)置了數(shù)個(gè)硬件加速器,用于不同應(yīng)用場(chǎng)景的性能加速,使CPU性能更為強(qiáng)悍,在包括AI視頻編解碼等領(lǐng)域可以替代GPU的工作。
助力視頻開(kāi)發(fā)者以更高性能
和低成本擁抱AIGC時(shí)代
在高質(zhì)量編碼領(lǐng)域,目前CPU仍是主力,而AI的高算力仍需額外的GPU卡來(lái)承擔(dān)?;诘谒拇⑻貭栔翉?qiáng) 可擴(kuò)展處理器打造的全鏈路智能化編碼,以及英特爾擁有的全棧AI軟件生態(tài)和豐富的工具鏈,可以順利協(xié)助視頻開(kāi)發(fā)者構(gòu)建高性能、低成本的編碼方案。
AI應(yīng)用的普及,技術(shù)的發(fā)展仍需依賴底層技術(shù)突破。除內(nèi)置諸多加速器的第四代至強(qiáng)外,英特爾的Habana Gaudi2, GPU、FPGA等多種算力資源和完整軟硬件解決方案,將為AIGC時(shí)代鑄就更堅(jiān)實(shí)的算力基石。
-
英特爾
+關(guān)注
關(guān)注
61文章
9967瀏覽量
171796 -
cpu
+關(guān)注
關(guān)注
68文章
10863瀏覽量
211799
原文標(biāo)題:LiveVideoStackCon2023音視頻技術(shù)大會(huì)上海站,英特爾?AMX帶來(lái)全鏈路智能化編碼新路徑!
文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論