0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

生成式AI的功能簡述

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2023-09-24 15:34 ? 次閱讀

作者:Yury Gorbachev 英特爾院士

翻譯:武卓 英特爾AI軟件布道師;楊亦誠 英特爾 AI軟件工程師

在過去的一年里,我們看到了生成式AI用例和模型的爆炸式增長?,F(xiàn)在幾乎每周都會針對不同的領(lǐng)域發(fā)布新的值得注意的生成式模型,這些模型在不斷增加的數(shù)據(jù)集上訓(xùn)練,具有各種計算復(fù)雜性。使用像LoRA這樣的方法,可以在非常適度的訓(xùn)練加速器上微調(diào)大模型,這解鎖了對基礎(chǔ)模型的更多修改。由于資源消耗,部署這些模型仍然是挑戰(zhàn),并且高度依賴于在云端部署模型。

隨著 OpenVINO 2023.1 版本的發(fā)布,我們希望將生成式 AI 的強大功能引入常規(guī)臺式機和筆記本電腦,讓這些模型可以運行在在資源受限的本地環(huán)境中,并被您嘗試集成到自己的應(yīng)用程序中。我們在整個產(chǎn)品中針對這些場景進行了優(yōu)化,實現(xiàn)了一些關(guān)鍵功能,并為我們的下一步工作計劃奠定了基礎(chǔ)。

也就是說,我們的變化不僅限于生成式AI,我們還改進了產(chǎn)品的其它部分,并希望它能使您的工作更輕松,并為您帶來額外的價值。讓我們來看看這些變化到底是什么。

生成式AI功能

大模型的整體堆棧優(yōu)化。來自生成式AI家族的模型有一個共同點——它們亟需資源。模型尺寸巨大,運行它們所需的內(nèi)存量非常高,對內(nèi)存帶寬的需求也非常大。例如不必要的權(quán)重搬運這樣簡單的問題,都可能會導(dǎo)致由于內(nèi)存不足而無法運行模型。

為了更好地適應(yīng)這一點,我們已經(jīng)跨推理堆棧工作,包括 CPUGPU(集成顯卡和獨立顯卡),目標就是優(yōu)化我們使用這些模型的方式,包括優(yōu)化讀取和編譯模型所需的內(nèi)存,優(yōu)化如何處理模型的輸入和輸出張量以及其他內(nèi)部結(jié)構(gòu),從而縮短模型執(zhí)行時間。

大型語言模型的權(quán)重量化。LLM 在執(zhí)行時需要大量的內(nèi)存帶寬。為了對此進行優(yōu)化,我們在 NNCF(神經(jīng)網(wǎng)絡(luò)壓縮框架)優(yōu)化框架和 CPU 推理中實現(xiàn)了 int8 LLM 權(quán)重量化功能。

使用此功能時,NNCF 將生成優(yōu)化的 IR 模型文件,與精度為 fp16 的常規(guī)模型文件相比,該文件能夠?qū)⒊叽鐪p小一半。IR 文件將在 CPU 插件中被執(zhí)行額外的優(yōu)化,這將改善延遲并減少運行時內(nèi)存消耗。GPU 的類似功能正在實施中,并將在后續(xù)發(fā)布的版本中提供。

更容易轉(zhuǎn)換模型。大多數(shù)LLM目前來自基于PyTorch的環(huán)境。要轉(zhuǎn)換這些模型,您現(xiàn)在可以使用我們的直接 PyTorch 轉(zhuǎn)換功能。對于LLM,與我們之前通過ONNX格式的路徑相比,這大大加快了轉(zhuǎn)換時間并減少了內(nèi)存需求。

總體而言,由于我們的優(yōu)化,我們能夠在CPU和GPU上均能提高 LLM 性能。[WZ1]此外,我們還按 倍數(shù)級減少了運行這些模型所需的內(nèi)存量。在某些情況下,新版本OpenVINO可以讓我們運行那些以前由于內(nèi)存不足而失敗的模型。我們一直在數(shù)十個不同規(guī)模和不同任務(wù)的LLM上驗證我們的工作,以確保我們的方法能夠很好地擴展到我們所有的平臺和支持的操作系統(tǒng)

我們的轉(zhuǎn)換API和權(quán)重量化功能也集成到Hugging Face optimum-intel擴展中,允許您使用OpenVINO作為推理堆棧運行生成式模型,或以方便的方式將模型導(dǎo)出為OpenVINO格式。

簡化您的工作流

不再需要開發(fā)包,提供統(tǒng)一的工具。從 2023.1 版本開始,我們不再要求您為運行時和開發(fā)環(huán)境分別安裝單獨的軟件包。我們一直致力于簡化我們的工具,并將所有必要的組件集成到單個 OpenVINO軟件包中。這也意味著模型轉(zhuǎn)換和推理可以通過所有OpenVINO分發(fā)機制以統(tǒng)一的方式獲得:pip,conda,brew和archive。

此外,從此版本開始,OpenVINO Python API 可從所有支持最低要求 Python 版本 (3.7) 的軟件包中獲得。這意味著除了以前可用的 pip 之外,還有conda、brew和指定的 apt 版本。

更高效、更友好的模型轉(zhuǎn)換。我們正在推出OpenVINO模型轉(zhuǎn)換工具 (OVC),該工具正在取代我們眾所周知的離線模型轉(zhuǎn)換任務(wù)中的模型優(yōu)化器 (MO) 工具。該工具以O(shè)penVINO包形式提供,依靠內(nèi)部模型前端來讀取框架格式,不需要原始框架來執(zhí)行模型轉(zhuǎn)換。例如,如果您想將TF模型轉(zhuǎn)換為OpenVINO,則不需要安裝TensorFlow。同樣,如果您想簡單地在 OpenVINO運行時中讀取此模型以進行推理而無需轉(zhuǎn)換,同樣也不需要 TensorFlow。

為了在 Python 腳本中轉(zhuǎn)換模型,我們進一步改進了convert_model API。例如,它允許將模型從 PyTorch 對象轉(zhuǎn)換為 OpenVINO模型,并編譯模型以進行推理或?qū)⑵浔4娴?IR格式,請參見以下示例:

c6a191c2-5936-11ee-939d-92fbcf53809c.png

請注意,我們還簡化了我們的Python API,可以直接從OpenVINO命名空間獲得這些API,因此這一切變得更簡單了。您仍然可以從舊命名空間訪問函數(shù),如果您需要 mo 工具,可以安裝 OpenVINO-dev。這個工具本身也仍然可用,但我們建議遷移到 ovc 工具。

默認切換到 fp16 IR。隨著轉(zhuǎn)換工具的變化,我們現(xiàn)在切換到使用 fp16 精度作為 IR 中的數(shù)據(jù)類型。這允許將模型大小減小 一半(相對FP32精度的模型),并且根據(jù)我們執(zhí)行的測試對準確性沒有影響。值得一提的是,IR 精度不會影響硬件插件的執(zhí)行精度,默認情況下,插件始終以最佳性能繼續(xù)執(zhí)行。

更好的PyTorch兼容性

前面已經(jīng)提到,直接轉(zhuǎn)換PyTorch模型的功能現(xiàn)在已經(jīng)成熟,該方案已經(jīng)被集成在我們的 HuggingFace optimum-intel中進行模型轉(zhuǎn)換。因此,現(xiàn)在轉(zhuǎn)換模型更容易,因為您繞過了 ONNX 格式的額外步驟(我們?nèi)匀粺o限制地支持)。

為了使OpenVINO更接近PyTorch生態(tài)系統(tǒng),我們引入了對torch.compile和相應(yīng)后端的支持。您現(xiàn)在可以通過 OpenVINO堆棧運行您的模型,方法是通過torch.compile編譯它并指定 OpenVINO 作為后端!

如下例所示:

c6bf32b8-5936-11ee-939d-92fbcf53809c.png

此功能正在積極增強,我們期待更好的性能和操作覆蓋范圍,但它已經(jīng)在我們的集成中使用,例如Stable Diffusion WebUI。

令人興奮的新Notebook用例

為了展示您可以直接從筆記本電腦上試用的新功能,我們制作了一些Jupyter notebooks示例并更新了現(xiàn)有notebooks。以下是最令我們興奮的:

基于大語言模型的聊天機器人(LLM Chatbot):

c6f00d70-5936-11ee-939d-92fbcf53809c.png

文生圖模型StableDiffusion XL:

文生圖模型 Tiny SD

生成音樂模型 MusicGen:

生成視頻模型Text-to-video:

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10007

    瀏覽量

    172228
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31493

    瀏覽量

    270075
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13338
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    222

原文標題:介紹OpenVINO? 2023.1:在邊緣端賦能生成式AI|開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    生成AI的「七宗罪」!

    面對生成AI日漸增長的「罪惡」,我們該如何解決問題?
    的頭像 發(fā)表于 05-07 16:34 ?1805次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的「七宗罪」!

    什么是生成AI?生成AI的四大優(yōu)勢

    生成AI是一種特定類型的AI,專注于生成新內(nèi)容,如文本、圖像和音樂。這些系統(tǒng)在大型數(shù)據(jù)集上進行訓(xùn)練,并使用機器學(xué)習(xí)算法
    發(fā)表于 05-29 14:12 ?4582次閱讀

    虹軟圖像深度恢復(fù)技術(shù)與生成AI的創(chuàng)新 生成AI助力

    當前,生成人工智能(AI)技術(shù)的快速發(fā)展令人矚目。它能夠理解人類的描述,并在短時間內(nèi)生成逼真的圖像和視頻。在生成
    發(fā)表于 06-21 09:06 ?474次閱讀

    利用 NVIDIA Jetson 實現(xiàn)生成 AI

    近日,NVIDIA 發(fā)布了 Jetson 生成 AI 實驗室(Jetson Generative AI Lab),使開發(fā)者能夠通過 NVIDIA Jetson 邊緣設(shè)備在現(xiàn)實世界中探
    的頭像 發(fā)表于 11-07 21:25 ?1061次閱讀
    利用 NVIDIA Jetson 實現(xiàn)<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>

    生成AI技術(shù)的應(yīng)用前景

    生成 AI(人工智能)與我們熟知的 AI 有何不同?這篇文章將為我們一探究竟!
    的頭像 發(fā)表于 11-29 12:20 ?1416次閱讀

    Amazon Connect新增生成AI功能

    Connect Contact Lens為客戶互動添加了AI生成摘要功能,幫助管理人員評估和優(yōu)化坐席表現(xiàn); Amazon Connect中的Amazon Lex現(xiàn)已利用生成
    的頭像 發(fā)表于 12-18 17:34 ?561次閱讀

    生成AI對智能家居的影響

    電子發(fā)燒友網(wǎng)站提供《生成AI對智能家居的影響.pdf》資料免費下載
    發(fā)表于 01-02 14:50 ?17次下載

    谷歌地圖引入生成AI功能

    谷歌近日宣布,在其廣受歡迎的谷歌地圖應(yīng)用中引入了全新的生成AI功能。這一創(chuàng)新功能利用大型模型,深入分析了地圖上超過2.5億個地點的詳細信息
    的頭像 發(fā)表于 02-06 16:42 ?5130次閱讀

    博世與微軟合作開發(fā)生成AI產(chǎn)品

    全球知名科技公司博世與微軟聯(lián)合宣布,雙方已建立合作關(guān)系,共同致力于開發(fā)先進的生成AI產(chǎn)品。這一合作的核心目標在于通過利用生成
    的頭像 發(fā)表于 03-05 11:17 ?953次閱讀

    IBM與SAP深化生成AI領(lǐng)域合作

    近日,IBM與SAP宣布將進一步擴大他們的合作范圍,共同在生成人工智能(AI)領(lǐng)域進行深度探索。此次合作的核心在于,雙方將共同為SAP的RISE平臺構(gòu)建全新的生成
    的頭像 發(fā)表于 05-13 09:19 ?500次閱讀

    榮耀新品將搭載谷歌AI功能,提升生成AI體驗

    榮耀于5月22日宣布,將在新款智能手機上集成谷歌的AI功能,實現(xiàn)生成AI體驗。此外,新機還將得到谷歌云服務(wù)的支持。
    的頭像 發(fā)表于 05-23 08:51 ?531次閱讀

    原來這才是【生成AI】!!

    隨著ChatGPT、文心一言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題??墒?,為什么要在AI前面加上“
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】!!

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國佛羅里達州奧蘭多舉行的 SAP Sapphire 大會上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成 AI 合作成果,其為 S
    的頭像 發(fā)表于 09-09 09:37 ?485次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?295次閱讀

    生成AI工具好用嗎

    當下,生成AI工具正以其強大的內(nèi)容生成能力,為用戶帶來了前所未有的便捷與創(chuàng)新。那么,生成
    的頭像 發(fā)表于 01-17 09:54 ?76次閱讀