通義千問近日開源了其首個(gè)千億級(jí)參數(shù)模型Qwen1.5-110B,這是其全系列中首個(gè)達(dá)到千億級(jí)別的開源模型。Qwen1.5-110B模型繼承了Qwen1.5系列的Transformer解碼器架構(gòu),并在技術(shù)上引入了分組查詢注意力方法(GQA),極大地提升了模型在推理時(shí)的效率。
這款擁有1100億參數(shù)的模型支持高達(dá)32K的上下文長度,同時(shí)展現(xiàn)出了卓越的多語言能力。無論是中文、英文、法語、德語、西班牙語、俄語,還是日語、韓語、越南語和阿拉伯語等,Qwen1.5-110B都能提供精準(zhǔn)、流暢的語言處理體驗(yàn)。這一里程碑式的開源模型,無疑將為AI領(lǐng)域的科研人員、開發(fā)者和愛好者提供更為強(qiáng)大、靈活的工具。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
近日,阿里通義千問官方宣布,經(jīng)過數(shù)月的精心優(yōu)化與改進(jìn),正式推出了Qwen2.5-Turbo開源AI模型。這款新
發(fā)表于 11-19 18:07
?636次閱讀
近日,阿里云通義大模型團(tuán)隊(duì)宣布了一項(xiàng)重大決策:將通義千問代碼模型全系列正式
發(fā)表于 11-14 15:26
?386次閱讀
阿里云百煉平臺(tái)再次掀起降價(jià)風(fēng)暴,三款通義千問主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價(jià)后,再次迎來價(jià)格調(diào)整。此次降價(jià)力度空前,Qwen
發(fā)表于 09-20 16:46
?982次閱讀
阿里巴巴旗下的通義千問近日宣布,其第二代視覺語言模型Qwen2-VL正式問世,并宣布旗艦模型Qwen2-VL-72B的API已順利接入阿里云
發(fā)表于 09-03 16:31
?597次閱讀
接入文心一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不一樣,調(diào)試驗(yàn)證會(huì)浪費(fèi)很多時(shí)間。因此本篇以聆思CSK6大模
發(fā)表于 08-22 10:12
接入文心一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,這個(gè)是必須可以的。但由于各家接口和數(shù)據(jù)格式不一樣,有些朋友直接參考chatgpt的方式?jīng)]有走通,因此本篇以聆思CSK6
發(fā)表于 08-21 19:13
阿里巴巴集團(tuán)旗下的通義千問團(tuán)隊(duì)宣布,全新的Qwen2大模型正式發(fā)布,并在全球知名的開源平臺(tái)Hugging Face和ModelScope上同
發(fā)表于 06-11 15:33
?1092次閱讀
阿里巴巴最近發(fā)布了其通義千問系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺(tái)上實(shí)現(xiàn)了同步開源。這
發(fā)表于 06-07 15:59
?782次閱讀
]?就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測(cè)評(píng)。開放夜現(xiàn)場(chǎng)測(cè)評(píng)
發(fā)表于 05-14 17:35
?675次閱讀
在通義大模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文
發(fā)表于 05-13 11:16
?1017次閱讀
阿里云近日正式發(fā)布了通義千問2.5,標(biāo)志著其人工智能技術(shù)在中文語境下取得了重要突破。據(jù)阿里云智能集團(tuán)首席技術(shù)官周靖人介紹,通義千
發(fā)表于 05-10 09:57
?565次閱讀
通義千問近日震撼發(fā)布1100億參數(shù)的開源模型Qwen1.5-110B,這一舉措標(biāo)志著
發(fā)表于 05-06 10:49
?607次閱讀
與之前的模型相比,新版320億參數(shù)模型在性能、效率以及內(nèi)存占用方面取得了明顯改善。具體來說,32B在智能體場(chǎng)景下能力優(yōu)于14B模型,并且推理成本較小。
發(fā)表于 04-08 14:44
?841次閱讀
通義千問大模型可在離線環(huán)境下輕松應(yīng)對(duì)多輪AI對(duì)話。此外,阿里云也承諾與聯(lián)發(fā)科進(jìn)行深度合作,為全球手機(jī)制造商提供端側(cè)大模型解決方案。
發(fā)表于 03-28 16:35
?832次閱讀
通義千問大模型已開源多項(xiàng)版本,包括18億、70億、140億及720億參數(shù)等版本伴隨視覺、音頻多模
發(fā)表于 03-28 09:55
?634次閱讀
評(píng)論