搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

GTC 2023：短視頻多模態(tài)超大模型的場景應(yīng)用

以 ChatGPT 為代表的大模型面世，帶來了 AI 大模型技術(shù)熱潮，快手科技圍繞提高模型計算效率和可部署開展技術(shù)攻關(guān)，沉淀了一套通用的混合并行訓(xùn)練、壓縮、推理整體解決方案，并聯(lián)合業(yè)務(wù)實現(xiàn)百億參數(shù) Dense 模型和千億參數(shù) MOE 大模型落地，取得顯著業(yè)務(wù)收益。

快手科技算法專家為我們介紹了關(guān)于短視頻多模態(tài)超大模型的場景應(yīng)用和挑戰(zhàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269108
英偉達

英偉達

+關(guān)注

關(guān)注
22

文章
3776

瀏覽量
91111
gtc

gtc

+關(guān)注

關(guān)注
0

文章
73

瀏覽量
4427
短視頻

短視頻

+關(guān)注

關(guān)注
1

文章
124

瀏覽量
8935
ChatGPT

ChatGPT

+關(guān)注

關(guān)注
29

文章
1561

瀏覽量
7673
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2450

瀏覽量
2714

評論

相關(guān)推薦

千億參數(shù)多模態(tài)大模型，“紫東太初”規(guī)模化應(yīng)用加速

電子發(fā)燒友網(wǎng)報道（文/李彎彎）過去近一年時間，國內(nèi)外大模型技術(shù)越來越成熟，并逐步在不同場景中實現(xiàn)實現(xiàn)應(yīng)用。在國內(nèi)，作為早早布局多模態(tài)大模型的

的頭像

發(fā)表于 12-08 00:09 ?2210次閱讀

從手淘搜索到優(yōu)酷短視頻，阿里巴巴是如何在搜索推薦領(lǐng)域下應(yīng)用深度學(xué)習(xí)的？

的信息，而在短視頻搜索場景下的模型中則是將個性化前移到召回的部分，同時與最終的排序模型進行了統(tǒng)一；其次就是多

發(fā)表于 05-08 16:28

多文化場景下的多模態(tài)情感識別

自動情感識別是一個非常具有挑戰(zhàn)性的課題，并且有著廣泛的應(yīng)用價值．本文探討了在多文化場景下的多模態(tài)情感識別問題．我們從語音聲學(xué)和面部表情等模態(tài)

發(fā)表于 12-18 14:47 ?0次下載

GTC 2023：多模態(tài)短視頻模型推理優(yōu)化方案解析

　　多卡推理--流水線并行：將模型和數(shù)據(jù)切分，以流水線形式計算，提高GPU利用率。模型切分策略：依照各部分的計算時間和參數(shù)量設(shè)計。

的頭像

發(fā)表于 03-23 18:17 ?2257次閱讀

<b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>：<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>短視頻</b><b class='flag-5'>模型</b>推理優(yōu)化方案解析

VisCPM：邁向多語言多模態(tài)大模型時代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進，多模態(tài)大模型

的頭像

發(fā)表于 07-10 10:05 ?718次閱讀

VisCPM：邁向多語言<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>時代

更強更通用：智源「悟道3.0」Emu多模態(tài)大模型開源，在多模態(tài)序列中「補全一切」

熱度。Flamingo 具備強大的多模態(tài)上下文少樣本學(xué)習(xí)能力。 Flamingo 走的技術(shù)路線是將大語言模型與一個預(yù)訓(xùn)練視覺編碼器結(jié)合，并插入可學(xué)習(xí)的層來捕捉跨模態(tài)依賴，其采用圖文對、

的頭像

發(fā)表于 07-16 20:45 ?724次閱讀

更強更通用：智源「悟道3.0」Emu<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>開源，在<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>序列中「補全一切」

探究編輯多模態(tài)大語言模型的可行性

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點依然從單

發(fā)表于 11-09 14:53 ?512次閱讀

探究編輯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語言<b class='flag-5'>模型</b>的可行性

大模型+多模態(tài)的3種實現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢是不支持其他模態(tài)（包括圖像、語音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強

的頭像

發(fā)表于 12-13 13:55 ?1706次閱讀

大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種實現(xiàn)方法

人工智能領(lǐng)域多模態(tài)的概念和應(yīng)用場景

隨著人工智能技術(shù)的不斷發(fā)展，多模態(tài)成為了一個備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和信息進行融合，以實現(xiàn)更加準確、高效的人工智能應(yīng)用。本文將詳細介紹

的頭像

發(fā)表于 12-15 14:28 ?9865次閱讀

自動駕駛和多模態(tài)大語言模型的發(fā)展歷程

多模態(tài)大語言模型(MLLM) 最近引起了廣泛的關(guān)注，其將 LLM 的推理能力與圖像、視頻和音頻數(shù)據(jù)相結(jié)合，通過多模態(tài)對齊使它們能夠更高效地執(zhí)

發(fā)表于 12-28 11:45 ?527次閱讀

自動駕駛和<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語言<b class='flag-5'>模型</b>的發(fā)展歷程

Sora爆紅，多模態(tài)大模型是下一發(fā)展階段

“大語言模型為 AI 產(chǎn)業(yè)帶來新的生機，然而語言模型的應(yīng)用場景有限。要全面打開生成式 AI 的想象力，還是要依托多模態(tài)大

的頭像

發(fā)表于 02-20 16:13 ?442次閱讀

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

李未可科技多模態(tài) AI 大模型正式發(fā)布，積極推進 AI 在終端的場景應(yīng)用 ? 4月18日，2024中國生成式AI大會上李未可科技正式發(fā)布為眼鏡等未來終端定向優(yōu)化等自研WAKE-AI

發(fā)表于 04-18 17:01 ?601次閱讀

李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>

依圖多模態(tài)大模型伙伴CTO精研班圓滿舉辦

大模型在不同行業(yè)領(lǐng)域的應(yīng)用前景;7月19日， “依圖科技多模態(tài)大模型伙伴CTO精研班”在杭州圓滿舉辦，讓更多的伙伴們深度體驗了依圖多

的頭像

發(fā)表于 07-23 15:16 ?422次閱讀

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進行融合，通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián)，實現(xiàn)更加智能化的信息處理。簡單來說

的頭像

發(fā)表于 10-18 09:39 ?440次閱讀

商湯日日新多模態(tài)大模型權(quán)威評測第一

剛剛，商湯科技日日新SenseNova多模態(tài)大模型，在權(quán)威綜合評測權(quán)威平臺OpenCompass的多模態(tài)評測中取得榜單第一。

的頭像

發(fā)表于 12-20 10:39 ?191次閱讀

<abbr id="cobgg"></abbr>