0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI文本到圖像模型套件迎來了新的發(fā)展里程碑

jf_WZTOguxH ? 來源:AI前線 ? 2023-06-26 14:34 ? 次閱讀

即使公眾對創(chuàng)始人產(chǎn)生了諸多質疑,但不影響 Stability AI 在文本生成圖像領域的持續(xù)推進。

日前,Stability AI 發(fā)布了 SDXL 0.9,這是其 Stable Diffusion 文本到圖像模型的最新版本,代表 Stability AI 文本到圖像模型套件迎來了新的發(fā)展里程碑。

繼今年 4 月成功發(fā)布 Stable Diffusion XL beta 之后,SDXL 0.9 在圖像和構圖細節(jié)方面繼續(xù)做出大幅突破。SDXL 0.9 是一款強大的工具,可用于在各種創(chuàng)意產(chǎn)業(yè)中創(chuàng)建高度逼真的圖像。與之前的版本相比,此更新的模型對生成圖像的質量和細節(jié)帶來了重大改進。

SDXL 0.9 有哪些重大升級?

現(xiàn)在用戶已可通過 ClipDrop 訪問該模型,API 也將在不久后推出。研究人員正在努力完善 1.0 版本,相關成果包括權重設置預計將在七月中旬與大家見面。

SDXL 0.9 在繼續(xù)保持通過現(xiàn)代消費級 GPU 運行的能力之外,在生成 AI 圖像的創(chuàng)意用例方面也實現(xiàn)了飛躍。SDXL 能夠為影視劇、音樂和教學視頻生成超現(xiàn)實風格的創(chuàng)作結果,也具備在設計和工業(yè)用途中一展身手的水平。

示例:

在 SDXL beta(左)和 0.9 版本上以相同提示詞進行測試,即可體現(xiàn)該模型在短短兩個月內(nèi)取得的重大進展。

25b0e954-13e3-11ee-962d-dac502259ad0.png

提示詞: 美學 外星人拉在拉斯維加斯的人群中,粗礪的膠片攝影

(左圖 - SDXL Beta, 右圖 - SDXL 0.9)

25f31d74-13e3-11ee-962d-dac502259ad0.png

提示詞: 優(yōu)勝美地國家公園的狼,冷冽的自然紀實膠片攝影

(左圖 - SDXL Beta, 右圖 - SDXL 0.9)

SDXL 系列還提供一系列超出基礎文本提示的功能。其中包括圖像到圖像提示(輸入一張圖像,以獲取該圖像的更多變體)、填充(重建圖像內(nèi)的缺失部分)和外延(根據(jù)現(xiàn)有圖像無縫向外擴展)。簡單來說,它可以讓用戶更有創(chuàng)意,以更高級有趣的方式對圖像進行更改。

SDXL 0.9 背后的力量

那么,SDXL 0.9 的底層技術到底是怎樣的?

據(jù) Stability AI 介紹,SDXL 0.9 之所以取得重大進展,核心驅動因素在于參數(shù)數(shù)量(模型訓練時神經(jīng)網(wǎng)絡中所有權重和偏差的總和)較 Beta 版本有了顯著增加。

SDXL 0.9 是目前所有開源圖像模型中參數(shù)量最大的模型之一,基礎模型擁有 35 億參數(shù),模型集成管線擁有 66 億參數(shù)(最終輸出由兩套模型的運行聚合結果創(chuàng)建而成)。管線的第二階段模型,專門用于向第一階段模型生成的輸出添加更多精巧細節(jié)。

相比之下,之前的 beta 版權擁有 31 億參數(shù)并使用單一模型。

SDXL 0.9 運行在兩個 CLIP 模型之上,其中包括迄今為止訓練的最大 OpenCLIP 模型之一 OpenCLIP ViT-G/14。它增強了 SDXL 0.9 的處理能力,使其能夠創(chuàng)建出更具深度和 1024 x 1024 更高分辨率的逼真圖像。

SDXL 團隊將很快發(fā)布一篇研究博客,詳細介紹該模型的規(guī)格和測試情況。

盡管具有強大的輸出和更先進的模型架構,但 SDXL 0.9 仍能夠在現(xiàn)代消費級 GPU 上運行。具體配置要求為:

Windows 10 或 11/Linux 操作系統(tǒng);

16 GB 內(nèi)存、英偉達 GeForce RTX 20 系列顯卡(或更高版本)且至少配備 8 GB 顯存;

Linux 用戶也可以使用配備 16 GB 顯存的 AMD 兼容顯卡。

測試版發(fā)布期間獲得積極反響

Stability AI 因于 2022 年 8 月推出開源圖像生成器 Stable Diffusion 而聞名,進一步加劇了其與 OpenAI 的 Dall-E 和 MidJourney 的競爭。

近日,Stability AI 剛被《時代》周刊評為 2023 年最具影響力的公司之一。其他出現(xiàn)在榜單上的人工智能公司還有 OpenAI(ChatGPT)、Hugging Face(協(xié)作開源人工智能平臺)、Runway AI(生成視頻)、Nvidia 和谷歌 DeepMind。

自 4 月 13 日 SDXL beta 版發(fā)布以來,Stability AI 在 Discord 社區(qū)上收到近 7000 名用戶的熱烈響應。用戶們生成了超過 70 萬張圖像,平均每天超過 2 萬張。超過 5.4 萬張圖像進入 Discord 社區(qū)的“Showdowns”評選,最終有 3521 張 SDXL 圖像被評為優(yōu)秀作品。

可用性和未來計劃

SDXL 0.9 現(xiàn)已在 Clipdrop by Stability AI 平臺上發(fā)布。Stability AI API 及 DreamStudio 客戶端將于 6 月 26 日星期一開放該模型,同時提供 NightCafe 等其他領先的圖像生成工具。

SDXL 0.9 目前暫時僅供研究學習目的使用,希望在全面發(fā)布前收集反饋并充分完善模型。相關代碼后續(xù)將在 GitHub(https://github.com/Stability-AI/generative-models)上公開。

如果研究人員希望訪問這些模型,請通過以下鏈接申請:

SDXL-0.9-Base 模型:https://huggingface.co/stabilityai/stable-diffusion-xl-base-0.9

SDXL-0.9-Refiner:https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-0.9

Stability AI 一再強調(diào),目前 SDXL 0.9 僅用于研究學習目的。

SDXL 1.0 計劃在今年七月中旬(時間選定)全面發(fā)布。SDXL 0.9 遵循非商用、僅供研究的許可證發(fā)布,并受相關使用條款的約束。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4768

    瀏覽量

    129326
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40556
  • 模型
    +關注

    關注

    1

    文章

    3298

    瀏覽量

    49183

原文標題:35 億+66 億參數(shù)雙模型,消費級顯卡上也能跑!Stability AI 發(fā)布重大升級,生成圖像真假難辨

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    破萬億!中國芯片出口迎來里程碑

    在全球科技競爭日益激烈的今天,中國芯片產(chǎn)業(yè)的發(fā)展備受矚目。根據(jù)海關總署最新公布的數(shù)據(jù),2023年前11個月,中國集成電路出口額首次突破1萬億元人民幣,同比增長20.3%,這一里程碑式的成就標志著中國
    的頭像 發(fā)表于 12-17 16:43 ?618次閱讀
    破萬億!中國芯片出口<b class='flag-5'>迎來</b><b class='flag-5'>里程碑</b>

    e絡盟實現(xiàn)重要里程碑:成功分銷 1000 萬套 micro:bit 設備

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡盟與合作伙伴 Micro:bit 教育基金會日前攜手宣布,e絡盟成功達成了制造并分銷超過 1000 萬臺 BBC micro:bit 計算機的重大里程碑,以幫助全球青少年通過物理計算發(fā)現(xiàn)編程的樂趣。
    的頭像 發(fā)表于 12-12 10:34 ?258次閱讀
    e絡盟實現(xiàn)重要<b class='flag-5'>里程碑</b>:成功分銷 1000 萬套 micro:bit 設備

    比亞迪達成新能源汽車下線千萬輛里程碑

    近日,比亞迪迎來了發(fā)展歷程中的一個重要里程碑——第1000萬輛新能源汽車正式下線。這一歷史性的時刻標志著比亞迪在新能源汽車領域的卓越成就和持續(xù)創(chuàng)新。 此次下線的車型為騰勢Z9,一款定位于D級市場
    的頭像 發(fā)表于 11-19 14:16 ?614次閱讀

    未來AI模型發(fā)展趨勢

    上得到了顯著提升。未來,算法和架構的進一步優(yōu)化將推動AI模型在性能上實現(xiàn)新的突破。 多頭自注意力機制、前饋神經(jīng)網(wǎng)絡等關鍵技術的改進,將增強模型的表達能力和泛化能力。 多模態(tài)融合 : AI
    的頭像 發(fā)表于 10-23 15:06 ?840次閱讀

    愛瑪機電突破千萬臺電機產(chǎn)量里程碑

     在電動車行業(yè)迎來里程碑的9月25日,愛瑪科技集團股份有限公司(以下簡稱“愛瑪科技”)宣布其機電事業(yè)部成功實現(xiàn)累計產(chǎn)量從300萬臺1000萬臺的飛躍。這一成就不僅標志著愛瑪機電在電動車動力領域的行業(yè)地位進一步鞏固,也充分展示
    的頭像 發(fā)表于 09-26 17:07 ?713次閱讀

    特斯拉里程碑達成:第1億顆4680電池震撼問世

    特斯拉的4680電池技術再次跨越重要里程碑,公司于9月15日欣然宣布,其第1億顆創(chuàng)新性的4680電池已成功下線,這一成就標志著特斯拉在電池制造領域的飛速進展。特斯拉首席執(zhí)行官埃隆·馬斯克通過社交媒體向辛勤工作的電池團隊致以熱烈祝賀,彰顯了公司對這一里程碑事件的自豪與重視。
    的頭像 發(fā)表于 09-18 15:30 ?1334次閱讀

    Freepik攜手Magnific AI推出AI圖像生成器

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發(fā)布標志著
    的頭像 發(fā)表于 08-30 16:23 ?1203次閱讀

    泰凌微電子:20億顆芯片里程碑,創(chuàng)新驅動物聯(lián)網(wǎng)未來

    ? ? 泰凌微電子(688591.SH)在近期迎來了一個令人矚目的里程碑——公司芯片的全球累計出貨量突破20億顆。這一數(shù)字不僅彰顯了泰凌微在低功耗物聯(lián)網(wǎng)芯片方向中的穩(wěn)健發(fā)展和行業(yè)貢獻,也激勵著公司在
    發(fā)表于 08-15 11:06 ?567次閱讀
    泰凌微電子:20億顆芯片<b class='flag-5'>里程碑</b>,創(chuàng)新驅動物聯(lián)網(wǎng)未來

    特斯拉迎來里程碑:全球第1000萬個電驅系統(tǒng)下線

    在科技日新月異的今天,電動汽車行業(yè)的領軍企業(yè)特斯拉再次以非凡的成就震撼全球。8月1日,特斯拉官方宣布了一個具有歷史意義的消息——全球第1000萬個電驅系統(tǒng)正式下線,標志著特斯拉在電動汽車核心技術的自主研發(fā)與規(guī)?;a(chǎn)上邁出了堅實的一步,迎來了發(fā)展歷程中的首個“一千萬”
    的頭像 發(fā)表于 08-01 16:40 ?1149次閱讀

    Anthropic發(fā)布最新AI模型Claude 3.5,引入Artifacts新功能

    近日,科技領域又迎來了一項引人注目的進展。Anthropic,這家OpenAI的競爭對手,于6月21日正式發(fā)布了其最新且功能強大的AI模型——Claude 3.5 Sonnet。這一里程碑
    的頭像 發(fā)表于 06-22 17:21 ?2154次閱讀

    它人機器人與俄羅斯的AVIALIFT正式攜手,達成里程碑式合作

    4月15日,它人機器人與俄羅斯的AVIALIFT正式攜手,達成里程碑式合作。這次合作不僅將我們的機器人產(chǎn)品、尖端技術和優(yōu)質服務帶到了廣袤的俄羅斯,更是它人機器人在國際舞臺上的一大飛躍。
    的頭像 發(fā)表于 04-17 09:26 ?608次閱讀
    它人機器人與俄羅斯的AVIALIFT正式攜手,達成<b class='flag-5'>里程碑</b>式合作

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張
    的頭像 發(fā)表于 03-22 10:30 ?931次閱讀

    谷歌發(fā)布AI基礎世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎世界模型Genie。這一創(chuàng)新技術允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬
    的頭像 發(fā)表于 02-28 17:41 ?891次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他
    的頭像 發(fā)表于 02-19 16:03 ?993次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>試圖通過新的<b class='flag-5'>圖像</b>生成人工智能<b class='flag-5'>模型</b>保持領先地位

    小愛同學AI助手已通過大模型備案

    小米公關部總經(jīng)理王化在微博上宣布,小愛同學AI助手已經(jīng)成功通過大模型備案。這一里程碑式的進展標志著小愛同學在人工智能領域又邁出了堅實的一步,為用戶帶來了更加全面和先進的智能體驗。
    的頭像 發(fā)表于 02-06 16:34 ?5991次閱讀