0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不同版本的大模型都有哪些優(yōu)勢?

你好張江 ? 來源:你好張江 ? 2023-09-19 10:28 ? 次閱讀

從去年ChatGPT重磅發(fā)布到今年的“百模大戰(zhàn)”,大模型賽道可謂熱鬧非凡。

今年8月31日,國內(nèi)首批8家大模型公司通過《生成式人工智能服務(wù)管理暫行辦法》備案,獲批面向公眾開放服務(wù),這些大模型包括上海人工智能實驗室的書生通用大模型、商湯科技“商量”,以及百度“文心一言”等。

ChatGPT從源頭來看是自然語言理解、自然語言處理兩個技術(shù),之所以引起關(guān)注,在于它是一個大模型,對應(yīng)大數(shù)據(jù)、強(qiáng)計算、好算法。有人說,原理是這么個原理,就像踢足球都是盤帶、射門,但是做到梅西那么好也不容易。

今天,就讓我們來看看,趕上大模型這個風(fēng)口的“張江版大模型”都有哪些?各自的優(yōu)勢又有何不同?

達(dá)觀數(shù)據(jù):“曹植”大語言模型

3月,基于多年文本智能技術(shù)積累和垂直領(lǐng)域場景業(yè)務(wù)經(jīng)驗,達(dá)觀數(shù)據(jù)研發(fā)團(tuán)隊積極探索大語言模型(LLM)的實踐,研發(fā)國產(chǎn)版GPT模型——“曹植”大語言模型。

7月,在 2023 世界人工智能大會上,達(dá)觀數(shù)據(jù)正式發(fā)布了名為“曹植”的大模型。這是國內(nèi)首個垂直行業(yè)專用的自主可控的國產(chǎn)GPT大語言模型,可準(zhǔn)確完成多類型、復(fù)雜結(jié)構(gòu)的長文本寫作,自動起草多種類型的文檔,未來將實現(xiàn)多模態(tài)內(nèi)容生成,如長文檔中的表格、圖表、圖片等。

作為垂直、專用、自主可控的國產(chǎn)版ChatGPT模型,“曹植”是如何誕生的?

達(dá)觀數(shù)據(jù)成立于2015年,一直在NLP(自然語言處理)領(lǐng)域深耕,積累了大量金融、政務(wù)、制造等垂直領(lǐng)域的大量數(shù)據(jù)。2017年,谷歌在發(fā)表的論文中提出NLP關(guān)于“理解”和“生成”的兩個技術(shù)路線?;谶_(dá)觀數(shù)據(jù)當(dāng)時的優(yōu)勢資源和未來發(fā)展,他們從一開始就選擇了“理解”這條技術(shù)路線。這一年,運用知識圖譜、文字識別等技術(shù)開發(fā)的IDP智能文檔審閱系統(tǒng)進(jìn)入市場。

隨著人工智能的不斷發(fā)展,機(jī)器智能處理長文本的需求日益緊迫。隨后,達(dá)觀數(shù)據(jù)便投入到大語言模型的開發(fā)工作中,而這正是如今的“曹植”大模型誕生的起點。

“長文本”是“曹植”大模型的目標(biāo)任務(wù)。區(qū)別于一問一答的簡單短文本生成,“曹植”大模型可準(zhǔn)確完成多類型、復(fù)雜結(jié)構(gòu)的長文本寫作。

以金融信貸報告為例,銀行的金融信貸報告經(jīng)常以40頁起步,60多頁的報告也是家常便飯,靠員工“埋頭苦干”效率太低,而大模型就會自動起草多種類型的文檔,同時具有自動排版、智能糾錯、文本潤色、自動生成摘要等特色功能;支持中文、英文、法語、德語、日語、韓語等數(shù)十種語言的寫作,輔助人工大幅提高辦公效率;在長文檔翻譯方面,對原文的標(biāo)題、段落等內(nèi)容實現(xiàn)1:1版式還原,提供實時的翻譯體驗,廣泛應(yīng)用于多語言文檔密集處理的場景?!拔磥韱T工需要做的就是寫提示詞、寫大綱、核實數(shù)字,剩下的都能交給大模型來完成?!边_(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO陳運文表示。

這也是國內(nèi)大規(guī)模語言模型中首批可落地的產(chǎn)業(yè)應(yīng)用級模型,目前除了在金融領(lǐng)域應(yīng)用之外,“曹植”還掌握了撰寫白皮書、技術(shù)報告以及品牌故事的智能協(xié)作本領(lǐng)。

與此同時,為促使“曹植”大模型在各垂直領(lǐng)域中可以更低成本高效能地落地與應(yīng)用,達(dá)觀數(shù)據(jù)正式推出私有化大模型一體機(jī)。私有化“曹植”大模型一體機(jī),內(nèi)置達(dá)觀數(shù)據(jù)全棧自主研發(fā)的“曹植”大模型,支持三方開源模型庫,可在企業(yè)內(nèi)部一鍵部署大模型應(yīng)用,能同時為多種垂直大模型業(yè)務(wù)提供文檔智能審閱、智能知識管理、知識搜索與問答、文檔智能寫作、智能推薦等智能化服務(wù),支持和具備安全便捷的AI訓(xùn)練、推理、長文檔寫作、機(jī)器翻譯、語義分析審核、知識問答、text-to-sql等場景功能應(yīng)用?!安苤?”的強(qiáng)大功能讓它甫一出世就大獲好評。

云從科技:從容大模型

5月18日,由云從科技研發(fā)的從容大模型正式亮相,展現(xiàn)了在智能問答、城市管理、智能制造、智慧金融、游戲文創(chuàng)等領(lǐng)域的超級本領(lǐng)。云從科技董事長兼總經(jīng)理周曦指出,從容大模型將以問答、伴隨、托管三種遞進(jìn)的形式顛覆傳統(tǒng)交互方式。其中,“問答”即類似于當(dāng)前的GPT;“伴隨”指AI會像一個朋友伴隨你執(zhí)行很多事情;“托管”則意味著一件事主要交給AI來做,類似在網(wǎng)游中的‘掛機(jī)訓(xùn)練’。能走到托管這一步,人就可以‘解放’出來,做更多有意義、有興趣的事?!?。

從算法、算力、數(shù)據(jù)這三個大模型重要維度看,云從科技的先天優(yōu)勢幫助其建立了技術(shù)門檻。

算法上,云從科技從2020年開始就已經(jīng)陸續(xù)在NLP(自然語言處理)、OCR(光學(xué)字符識別)、機(jī)器視覺、語音等多個領(lǐng)域開展預(yù)訓(xùn)練大模型的實踐,不僅進(jìn)一步提升了公司各項核心算法的性能效果,同時也大幅提升了公司的算法生產(chǎn)效率,已經(jīng)在城市治理、金融、智能制造等行業(yè)應(yīng)用中體現(xiàn)價值。

算力上,云從科技擁有強(qiáng)大的算力資源儲備,預(yù)計未來將擴(kuò)展到上萬張卡的規(guī)模,并計劃聯(lián)合各行頭部企業(yè)打造不同的行業(yè)大模型,推動行業(yè)數(shù)智化建設(shè)。

數(shù)據(jù)上,云從科技有行業(yè)專業(yè)數(shù)據(jù)的先發(fā)優(yōu)勢。行業(yè)大模型需要的是專業(yè)領(lǐng)域的知識,如果不是一直耕耘的行業(yè)資深選手,基本很難有相關(guān)的數(shù)據(jù)積累。云從科技恰恰擁有這方面的稀缺優(yōu)勢,其多年來在多個領(lǐng)域?qū)嵺`“預(yù)訓(xùn)練大模型+下游任務(wù)遷移”的技術(shù)范式,產(chǎn)出多個百億參數(shù)以內(nèi)規(guī)模的模型。歷經(jīng)長期與各垂直領(lǐng)域企業(yè)的緊密合作,云從通過大量場景數(shù)據(jù)訓(xùn)練不斷優(yōu)化算法平臺,培育出針對不同行業(yè)特有的數(shù)據(jù)分析和應(yīng)用能力。

8月21日,云從發(fā)布從容大模型1.5版本,該版本包含十億級、百億級、千億級多種模型規(guī)格,實測性能在全球大模型綜合性考試評測(C-Eval)中位居百億級第1,總榜單第4。為解決大模型落地難題,從容1.5版本的重點是參數(shù)量為130億的行業(yè)大模型,該模型從千億大模型中蒸餾產(chǎn)生,在52類測試指標(biāo)中有44類超過ChatGPT、29類超過GPT-4,這距離從容大模型正式發(fā)布僅過去3個月,可謂是進(jìn)步神速。

百度:文心一言

8月31日,百度生成式人工智能產(chǎn)品“文心一言”正式向公眾開放服務(wù),這也意味著該應(yīng)用已通過《生成式人工智能服務(wù)管理暫行辦法》備案,成為國內(nèi)首個合規(guī)上線的生成式人工智能產(chǎn)品。

據(jù)悉,百度還將開放一批經(jīng)過全新重構(gòu)的AI原生應(yīng)用,讓用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。

文心一言在今年3月16日上線測試,隨即引發(fā)廣泛關(guān)注,截至5月,有超過300家生態(tài)伙伴參與內(nèi)測,在400多個企業(yè)內(nèi)部場景取得測試成效。8月31日開放當(dāng)天,百度的一系列AI原生應(yīng)用也“閃電”上線,并取得不錯的戰(zhàn)績:

百度文心一言首日回答用戶3342萬問題,“文心一言App”迅速登上Apple store免費應(yīng)用排行榜榜首,首日用戶量破百萬;文心一言開放首日,百度搜索就有超3億次需求由生成式智能引擎解決,百度搜索“AI伙伴”當(dāng)日訪問用戶數(shù)突破400萬;百度文庫“AI做PPT”等文檔創(chuàng)作功能超200萬人次體驗。這距離5月百度萬象大會上“用AI原生思維重構(gòu)百度移動生態(tài)”的表態(tài),才過去不過百余天,大模型時代的技術(shù)進(jìn)展可以說是日新月異。

實際上,從多年前的“All in AI”開始,百度就開始了在AI領(lǐng)域的全棧布局。近十年,百度累計研發(fā)投入超1400億元,2022年百度核心研發(fā)費用214.16億元,占百度核心收入比例達(dá)到22.4%。壓強(qiáng)式研發(fā)投入讓百度實現(xiàn)厚積薄發(fā),成為全球為數(shù)不多的、有著應(yīng)用、模型、框架、芯片四層全棧布局的AI公司,實現(xiàn)端到端優(yōu)化,并在各個層面都有行業(yè)領(lǐng)先的關(guān)鍵自研技術(shù)。

文心一言的基礎(chǔ)模型文心大模型早在2019年就在國內(nèi)率先發(fā)布,近期升級的文心大模型3.5也持續(xù)在十余個國內(nèi)外權(quán)威測評中位居首位。百度透露,文心大模型4.0預(yù)計將在年底推出。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47514

    瀏覽量

    239247
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1564

    瀏覽量

    7865
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    124

    瀏覽量

    1306
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2514

    瀏覽量

    2932

原文標(biāo)題:都有誰站在了大模型的風(fēng)口上?

文章出處:【微信號:zjpark,微信公眾號:你好張江】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「大模型啟示錄」閱讀體驗】營銷領(lǐng)域大模型的應(yīng)用

    效地制定針對不同客戶群體的營銷策略,提高營銷活動的針對性和有效性。 大模型在內(nèi)容生成方面也具有顯著優(yōu)勢。它可以快速、高效地生成高質(zhì)量的營銷文案、廣告語、海報、視頻等營銷素材。這種能力不僅提高了營銷內(nèi)容的制作效率,還增加了內(nèi)容的創(chuàng)意和多樣性,有助于吸引更多消費者的關(guān)注和興趣
    發(fā)表于 12-24 12:48

    圖森未來發(fā)布“Ruyi”視頻大模型,Ruyi-Mini-7B版本現(xiàn)已開源

    重大獻(xiàn)禮。 尤為值得一提的是,圖森未來已經(jīng)將Ruyi的Mini-7B版本正式開源,用戶現(xiàn)在可以通過huggingface平臺輕松下載并使用這一強(qiáng)大的工具。這一舉措無疑將極大地推動視頻大模型在更廣泛領(lǐng)域的應(yīng)用和發(fā)展。 “Ruyi”模型
    的頭像 發(fā)表于 12-20 15:19 ?837次閱讀

    【「大模型啟示錄」閱讀體驗】如何在客服領(lǐng)域應(yīng)用大模型

    地選擇適合的模型。不同的模型具有不同的特點和優(yōu)勢。在客服領(lǐng)域,常用的模型包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時記憶網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元(GRU)、Transformer等,以及基
    發(fā)表于 12-17 16:53

    ADS 2011.10版本無法加載lmk04828 IBIS模型,為什么?

    ADS 2011.10版本無法加載lmk04828 IBIS模型
    發(fā)表于 11-13 07:06

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強(qiáng)大的計算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像識別中優(yōu)勢
    的頭像 發(fā)表于 10-23 15:01 ?829次閱讀

    IBM發(fā)布面向企業(yè)的人工智能模型版本

    近日,IBM正式發(fā)布了其面向企業(yè)的人工智能模型——Granite 3.0的最新版本,旨在抓住當(dāng)前企業(yè)紛紛擁抱生成式AI技術(shù)的熱潮。與IBM Granite系列中的其他AI模型一樣,Granite 3.0也將采取開源策略,這與微軟
    的頭像 發(fā)表于 10-22 17:32 ?481次閱讀

    室內(nèi)精準(zhǔn)定位都有哪些亮眼的優(yōu)勢?

    室內(nèi)精準(zhǔn)定位產(chǎn)品市面上有很多,不過水平是參差不齊的,這主要是技術(shù)問題,好的產(chǎn)品自然說明研發(fā)技術(shù)過硬,但是正因為品質(zhì)不同,所以有需要的人在選擇的時候總覺得十分困擾,那么優(yōu)勢的室內(nèi)定位產(chǎn)品都有哪些優(yōu)勢
    的頭像 發(fā)表于 07-15 11:24 ?413次閱讀

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊開發(fā),與同行相比具有許多優(yōu)勢
    發(fā)表于 07-05 08:52

    模型端側(cè)部署加速,都有哪些芯片可支持?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)大模型在端側(cè)部署是指將大型神經(jīng)網(wǎng)絡(luò)模型部署在移動終端設(shè)備上,使這些設(shè)備能夠直接運行這些模型,從而執(zhí)行各種人工智能任務(wù),如圖像識別、語音識別、自然語言處理等。隨著大
    的頭像 發(fā)表于 05-24 00:14 ?4260次閱讀

    3D建模的特點和優(yōu)勢都有哪些?

    3D建模是一種用于創(chuàng)建三維對象的過程,它在許多領(lǐng)域都有著廣泛的應(yīng)用,包括動畫、游戲開發(fā)、建筑設(shè)計、工程以及制造業(yè)等。下面古河云科技將介紹一些關(guān)于3D建模的內(nèi)容詳情,包括它的特點、優(yōu)勢以及一些常見
    的頭像 發(fā)表于 05-13 16:41 ?2567次閱讀

    商湯科技即將推出日日新大模型5.0粵語版本

    在盛大的“新質(zhì)企業(yè)家聯(lián)合會”成立典禮上,商湯科技副總裁、智慧城市與商業(yè)事業(yè)群總裁張果琲宣布了一項重要消息。商湯科技即將推出日日新大模型5.0的粵語版本,這一新版本將基于大裝置和強(qiáng)大的技術(shù)能力,為粵語語言處理帶來顯著的提升。
    的頭像 發(fā)表于 05-13 10:58 ?612次閱讀

    谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領(lǐng)域發(fā)揮巨大作用。
    的頭像 發(fā)表于 05-10 11:26 ?610次閱讀

    商湯將發(fā)布日日新大模型5.0粵語版本

    商湯科技即將迎來一項重要更新,他們將發(fā)布日日新大模型5.0的粵語版本。這一版本是基于商湯科技現(xiàn)有的大裝置和日日新大模型5.0的先進(jìn)能力而打造的,旨在粵語語言處理領(lǐng)域?qū)崿F(xiàn)新的突破。據(jù)悉,
    的頭像 發(fā)表于 05-08 09:33 ?516次閱讀

    【大語言模型:原理與工程實踐】大語言模型的基礎(chǔ)技術(shù)

    的特征,并且這些特征融合了這些詞在當(dāng)前序列的上下文語義,因此能夠解決一詞多義的問題。憑借這種優(yōu)勢,基于動態(tài)詞向量語言模型進(jìn)行預(yù)訓(xùn)練的方法被廣泛應(yīng)用于自然語言處理任務(wù)中。 經(jīng)典結(jié)構(gòu)
    發(fā)表于 05-05 12:17

    SolidWorks教育版本優(yōu)勢是什么

    隨著工程設(shè)計和制造技術(shù)的不斷進(jìn)步,計算機(jī)輔助設(shè)計(CAD)軟件在教育領(lǐng)域的應(yīng)用越來越廣泛。SolidWorks教育版本作為一款專為教育機(jī)構(gòu)和學(xué)生設(shè)計的三維CAD軟件,具有許多明顯的優(yōu)勢。本文將探討SOLIDWORKS教育版本的主
    的頭像 發(fā)表于 03-26 17:28 ?442次閱讀
    SolidWorks教育<b class='flag-5'>版本</b>的<b class='flag-5'>優(yōu)勢</b>是什么