以 ChatGPT 為代表的大模型面世,帶來了 AI 大模型技術(shù)熱潮,快手科技圍繞提高模型計算效率和可部署開展技術(shù)攻關(guān),沉淀了一套通用的混合并行訓(xùn)練、壓縮、推理整體解決方案,并聯(lián)合業(yè)務(wù)實現(xiàn)百億參數(shù) Dense 模型和千億參數(shù) MOE 大模型落地,取得顯著業(yè)務(wù)收益。
快手科技算法專家為我們介紹了關(guān)于短視頻多模態(tài)超大模型的場景應(yīng)用和挑戰(zhàn)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
-
英偉達
-
gtc
-
短視頻
-
ChatGPT
-
大模型
相關(guān)推薦
電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去近一年時間,國內(nèi)外大模型技術(shù)越來越成熟,并逐步在不同場景中實現(xiàn)實現(xiàn)應(yīng)用。在國內(nèi),作為早早布局多模態(tài)大模型的
發(fā)表于 12-08 00:09
?2210次閱讀
的信息,而在短視頻搜索場景下的模型中則是將個性化前移到召回的部分,同時與最終的排序模型進行了統(tǒng)一;其次就是多
發(fā)表于 05-08 16:28
自動情感識別是一個非常具有挑戰(zhàn)性的課題,并且有著廣泛的應(yīng)用價值.本文探討了在多文化場景下的多模態(tài)情感識別問題.我們從語音聲學(xué)和面部表情等模態(tài)
發(fā)表于 12-18 14:47
?0次下載
多卡推理--流水線并行:將模型和數(shù)據(jù)切分,以流水線形式計算,提高GPU利用率。模型切分策略:依照各部分的計算時間和參數(shù)量設(shè)計。
發(fā)表于 03-23 18:17
?2257次閱讀
隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進,多模態(tài)大模型
發(fā)表于 07-10 10:05
?718次閱讀
熱度。Flamingo 具備強大的多模態(tài)上下文少樣本學(xué)習(xí)能力。 Flamingo 走的技術(shù)路線是將大語言模型與一個預(yù)訓(xùn)練視覺編碼器結(jié)合,并插入可學(xué)習(xí)的層來捕捉跨模態(tài)依賴,其采用圖文對、
發(fā)表于 07-16 20:45
?724次閱讀
不同于單模態(tài)模型編輯,多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點依然從單
發(fā)表于 11-09 14:53
?512次閱讀
我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(tài)(包括圖像、語音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強
發(fā)表于 12-13 13:55
?1706次閱讀
隨著人工智能技術(shù)的不斷發(fā)展,多模態(tài)成為了一個備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和信息進行融合,以實現(xiàn)更加準確、高效的人工智能應(yīng)用。本文將詳細介紹
發(fā)表于 12-15 14:28
?9865次閱讀
多模態(tài)大語言模型(MLLM) 最近引起了廣泛的關(guān)注,其將 LLM 的推理能力與圖像、視頻和音頻數(shù)據(jù)相結(jié)合,通過多模態(tài)對齊使它們能夠更高效地執(zhí)
發(fā)表于 12-28 11:45
?527次閱讀
“大語言模型為 AI 產(chǎn)業(yè)帶來新的生機,然而語言模型的應(yīng)用場景有限。要全面打開生成式 AI 的想象力,還是要依托多模態(tài)大
發(fā)表于 02-20 16:13
?442次閱讀
李未可科技多模態(tài) AI 大模型正式發(fā)布,積極推進 AI 在終端的場景應(yīng)用 ? 4月18日,2024中國生成式AI大會上李未可科技正式發(fā)布為眼鏡等未來終端定向優(yōu)化等自研WAKE-AI
發(fā)表于 04-18 17:01
?601次閱讀
大模型在不同行業(yè)領(lǐng)域的應(yīng)用前景;7月19日, “依圖科技多模態(tài)大模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖多
發(fā)表于 07-23 15:16
?422次閱讀
多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進行融合,通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實現(xiàn)更加智能化的信息處理。簡單來說
發(fā)表于 10-18 09:39
?440次閱讀
剛剛,商湯科技日日新SenseNova多模態(tài)大模型,在權(quán)威綜合評測權(quán)威平臺OpenCompass的多模態(tài)評測中取得榜單第一。
發(fā)表于 12-20 10:39
?191次閱讀
評論