0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通義千問開源千億級(jí)參數(shù)模型

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-05-08 11:01 ? 次閱讀

通義千問近日開源了其首個(gè)千億級(jí)參數(shù)模型Qwen1.5-110B,這是其全系列中首個(gè)達(dá)到千億級(jí)別的開源模型。Qwen1.5-110B模型繼承了Qwen1.5系列的Transformer解碼器架構(gòu),并在技術(shù)上引入了分組查詢注意力方法(GQA),極大地提升了模型在推理時(shí)的效率。

這款擁有1100億參數(shù)的模型支持高達(dá)32K的上下文長度,同時(shí)展現(xiàn)出了卓越的多語言能力。無論是中文、英文、法語、德語、西班牙語、俄語,還是日語、韓語、越南語和阿拉伯語等,Qwen1.5-110B都能提供精準(zhǔn)、流暢的語言處理體驗(yàn)。這一里程碑式的開源模型,無疑將為AI領(lǐng)域的科研人員、開發(fā)者和愛好者提供更為強(qiáng)大、靈活的工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3381

    瀏覽量

    42604
  • 通義千問
    +關(guān)注

    關(guān)注

    1

    文章

    25

    瀏覽量

    266
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    阿里通義發(fā)布Qwen2.5-Turbo開源AI模型

    近日,阿里通義官方宣布,經(jīng)過數(shù)月的精心優(yōu)化與改進(jìn),正式推出了Qwen2.5-Turbo開源AI模型。這款新
    的頭像 發(fā)表于 11-19 18:07 ?636次閱讀

    阿里通義代碼模型全系列開源

    近日,阿里云通義模型團(tuán)隊(duì)宣布了一項(xiàng)重大決策:將通義代碼模型全系列正式
    的頭像 發(fā)表于 11-14 15:26 ?386次閱讀

    通義三款主力模型再降價(jià)

    阿里云百煉平臺(tái)再次掀起降價(jià)風(fēng)暴,三款通義主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價(jià)后,再次迎來價(jià)格調(diào)整。此次降價(jià)力度空前,Qwen
    的頭像 發(fā)表于 09-20 16:46 ?982次閱讀

    通義發(fā)布第二代視覺語言模型Qwen2-VL

    阿里巴巴旗下的通義近日宣布,其第二代視覺語言模型Qwen2-VL正式問世,并宣布旗艦模型Qwen2-VL-72B的API已順利接入阿里云
    的頭像 發(fā)表于 09-03 16:31 ?597次閱讀

    【附實(shí)操視頻】聆思CSK6大模型開發(fā)板接入國內(nèi)主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義

    接入文心一言、通義、豆包、智譜glm、kimi等國內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不一樣,調(diào)試驗(yàn)證會(huì)浪費(fèi)很多時(shí)間。因此本篇以聆思CSK6大
    發(fā)表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智譜glm、通義示例)

    接入文心一言、通義、豆包、智譜glm、kimi等國內(nèi)的大模型,這個(gè)是必須可以的。但由于各家接口和數(shù)據(jù)格式不一樣,有些朋友直接參考chatgpt的方式?jīng)]有走通,因此本篇以聆思CSK6
    發(fā)表于 08-21 19:13

    阿里通義Qwen2大模型發(fā)布并同步開源

    阿里巴巴集團(tuán)旗下的通義團(tuán)隊(duì)宣布,全新的Qwen2大模型正式發(fā)布,并在全球知名的開源平臺(tái)Hugging Face和ModelScope上同
    的頭像 發(fā)表于 06-11 15:33 ?1092次閱讀

    阿里通義Qwen2大模型發(fā)布

    阿里巴巴最近發(fā)布了其通義系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺(tái)上實(shí)現(xiàn)了同步開源。這
    的頭像 發(fā)表于 06-07 15:59 ?782次閱讀

    ChatGPT、Gemini、通義等一眾大語言模型,哪家更適合您?

    ]?就以“ChatGPT、Gemini、通義等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測(cè)評(píng)。開放夜現(xiàn)場(chǎng)測(cè)評(píng)
    的頭像 發(fā)表于 05-14 17:35 ?675次閱讀

    阿里云正式發(fā)布通義2.5,中文性能全面趕超GPT-4 Turbo

    通義模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義2.5版本,其性能全面超越GPT-4 Turbo,榮登中文
    的頭像 發(fā)表于 05-13 11:16 ?1017次閱讀

    阿里云發(fā)布通義2.5

    阿里云近日正式發(fā)布了通義2.5,標(biāo)志著其人工智能技術(shù)在中文語境下取得了重要突破。據(jù)阿里云智能集團(tuán)首席技術(shù)官周靖人介紹,通義
    的頭像 發(fā)表于 05-10 09:57 ?565次閱讀

    通義推出1100億參數(shù)開源模型

    通義近日震撼發(fā)布1100億參數(shù)開源模型Qwen1.5-110B,這一舉措標(biāo)志著
    的頭像 發(fā)表于 05-06 10:49 ?607次閱讀

    阿里云通義發(fā)布320億參數(shù)模型,優(yōu)化性能及效率

    與之前的模型相比,新版320億參數(shù)模型在性能、效率以及內(nèi)存占用方面取得了明顯改善。具體來說,32B在智能體場(chǎng)景下能力優(yōu)于14B模型,并且推理成本較小。
    的頭像 發(fā)表于 04-08 14:44 ?841次閱讀

    聯(lián)發(fā)科天璣9300等旗艦芯片搭載通義模型,成功實(shí)現(xiàn)

    通義模型可在離線環(huán)境下輕松應(yīng)對(duì)多輪AI對(duì)話。此外,阿里云也承諾與聯(lián)發(fā)科進(jìn)行深度合作,為全球手機(jī)制造商提供端側(cè)大模型解決方案。
    的頭像 發(fā)表于 03-28 16:35 ?832次閱讀

    聯(lián)發(fā)科天璣9300搭載通義模型,阿里云提供解決方案

    通義模型開源多項(xiàng)版本,包括18億、70億、140億及720億參數(shù)等版本伴隨視覺、音頻多模
    的頭像 發(fā)表于 03-28 09:55 ?634次閱讀