0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

度小滿軒轅:金融行業(yè)的大模型實戰(zhàn)派

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-03-12 09:12 ? 次閱讀

金融行業(yè)被廣泛認為是AI大模型技術(shù)落地的前哨站,也是“人工智能+”行動的焦點所在。面向金融場景廣泛、多樣化的大模型需求,度小滿軒轅系列全新發(fā)布了12款金融大模型。其中包括6B、13B、70B參數(shù)的基座模型、對話模型、int4/int8量化模型,并且實現(xiàn)了完全開源,供廣大開發(fā)者下載使用。

總體來看,12款金融大模型包括3種參數(shù)。2023年5月,度小滿開源了國內(nèi)首個千億級中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU兩大權(quán)威榜單上位列所有開源模型榜首。本次度小滿“軒轅”模型矩陣再次升級,十億-百億-千億參數(shù)全覆蓋,實現(xiàn)多場景任務適配。

而從效果上看,度小滿軒轅達成了18大維度金融實戰(zhàn)能力遙遙領先,多場景6B模型與72B模型表現(xiàn)相當;通用能力同樣達到開源模型TOP水平,看齊GPT-4,并且采用了獨創(chuàng)的數(shù)據(jù)處理流水線,生產(chǎn)更豐富、更安全、更符合中文場景的數(shù)據(jù)。通過首次將人類偏好對齊引入金融垂域大模型訓練,相關(guān)模型實現(xiàn)了安全性顯著提升、有用性突破瓶頸、金融任務表現(xiàn)明顯增強 。

讓我們來走進度小滿軒轅,透視金融領域的大模型變革。

度小滿「軒轅」大模型:全參數(shù)矩陣

wKgZomXvBWmAIjL5AAC0QbbZoC4267.jpg

(度小滿軒轅大模型發(fā)布時間軸)

度小滿軒轅系列已經(jīng)有17款開源大模型,適配廣泛場景任務,滿足不同開發(fā)者需要。

wKgaomXvBWqAODvoAADv-8gMgUg452.jpg

(度小滿軒轅大模型矩陣)

模型矩陣的設計考慮了不同的應用場景和性能要求:70B及以上的模型專門針對需要深度分析、復雜指令執(zhí)行以及全方位Agent調(diào)用的場景,而6B、13B的模型則更加適用于對響應速度有高要求、面向小規(guī)模場景和單任務的應用,它們也同樣能夠處理計算、編程、創(chuàng)作等一系列通用需求。特別地,最小化的XuanYuan-6B-4-bit量化Chat模型以其低推理部署成本,進一步降低了大模型的應用門檻。

模型效果:18大維度金融實戰(zhàn)能力遙遙領先

01金融能力

將軒轅系列大模型在金融自動評測集FinanceIQ測試集上進行測試,F(xiàn)inanceIQ涵蓋了注冊會計師(CPA)、稅務師、經(jīng)濟師、銀行從業(yè)資格、基金從業(yè)資格、證券從業(yè)資格、期貨從業(yè)資格、保險從業(yè)資格(CICE)、理財規(guī)劃師等十大權(quán)威金融領域考試。結(jié)果如下表,XuanYuan-70B-V2在該項評測任務上擁有超過GPT-4的水平,在知識層面展示出金融領域?qū)<?/strong>的水平。

同時,為了考察軒轅大模型在金融實際任務上的能力,軒轅團隊還特別組織了金融專家為對話大模型進行人工評測。任務的設計均是從金融行業(yè)實際應用場景出發(fā),去判斷軒轅是否在各項金融任務上具備“實戰(zhàn)能力”。

wKgZomXvBWuAJ-jYAADz_UHwVVU390.jpg

(人工金融評測集任務構(gòu)成)

最終結(jié)果顯示,軒轅大模型各個參數(shù)上均具有“以小搏大”的實力,達到自己2倍甚至5倍參數(shù)量的模型水平。在各項金融評測任務上,XuanYuan-6B表現(xiàn)超越市面最新13B中文開源模型(左圖),XuanYuan-13B表現(xiàn)超越市面最新72B中文開源模型(中圖),XuanYuan-72B-V2表現(xiàn)可以媲美GPT4(右圖),并且在金融法規(guī)、金融產(chǎn)品信息等中文場景上超越。

wKgaomXvBWuATqMFAAFiRP5fBts125.jpg

(軒轅擁有遠超同參數(shù)水平的金融能力)

02通用能力

將軒轅大模型在MMLU、CEVAL、CMMLU、GSM8K、HumanEval等中外主流評測集上進行評測,觀察大模型在知識、邏輯、代碼等通用能力上的表現(xiàn)。同時加入類似參數(shù)矩陣的LLaMA2系列進行比較,結(jié)果顯示軒轅不同參數(shù)大模型在各項榜單成績上均有優(yōu)異表現(xiàn),在CMMLU、C-Eval等多個中文評測榜單上,更是有超越GPT-4的水準。

進一步分析發(fā)現(xiàn),經(jīng)過專門優(yōu)化以增強考試能力的XuanYuan-6B和XuanYuan-13B模型,在C-Eval和CMMLU這兩個中文考試評測指標上有了顯著提升。然而,需要注意的是,“高分”并不意味著“高能力”。評測集成績可通過優(yōu)化模型考試能力來提升,不直接等同于模型在實際應用中的優(yōu)勢。因此,盡管小參數(shù)模型在某些評測中表現(xiàn)出色,這并不意味著它們的各方面真實能力均超越了同系列大參數(shù)模型。

wKgZomXvBW6AQMu9AADp6ysui6k450.jpg

(軒轅大模型在各個評測集上的分數(shù))

「軒轅」技術(shù)解析:對齊技術(shù)突破能力瓶頸,面向公眾開放自動化訓練框架

度小滿軒轅大模型團隊在過去一年,對大模型訓練的各個環(huán)節(jié)積累了豐富的經(jīng)驗。這包括建立了一套完整的數(shù)據(jù)處理流水線、采用更適配領域模型的高效訓練方法等,以及本次突破性的利用人類偏好對齊技術(shù),極大地提升了6B、13B、70B模型的對話能力,顯著增強了模型的場景適應性。

軒轅系列大模型使用DeepSpeed分布式訓練框架,引入動態(tài)評估與調(diào)整機制以優(yōu)化訓練過程。在微調(diào)階段,軒轅特別的采用了Self-QA策略來收集指令微調(diào)數(shù)據(jù)。該方法能夠在沒有人工標注的情況下生成大量高質(zhì)量的問答數(shù)據(jù),為模型提供有監(jiān)督的訓練樣本,有效提升模型的學習效率和質(zhì)量。

wKgaomXvBW6ADi9lAABpQJ7EIVY781.jpg

(軒轅大模型Self-QA數(shù)據(jù)構(gòu)造方法)

針對金融領域的特定需求,軒轅大模型還開發(fā)了一種混合微調(diào)訓練框架,旨在通過融合通用與特定領域數(shù)據(jù)來增強模型性能及適應性。這種混合微調(diào)方法不僅顯著提高了模型在特定任務的表現(xiàn),也增強了其整體的泛化能力和適應性,為金融領域任務的性能提升開辟了新途徑。

度小滿創(chuàng)新地在金融領域大模型中引入了人類偏好對齊技術(shù),開創(chuàng)了領域內(nèi)強化對齊訓練的先河。通常,領域大模型僅在微調(diào)階段引入特定領域數(shù)據(jù),但這種方法在實際應用中常常顯示出局限性。金融行業(yè)的復雜性要求模型能夠更深入地理解并適應行業(yè)特定的需求,而強化對齊訓練有助于突破僅依靠微調(diào)所能達到的性能瓶頸。

軒轅團隊精心構(gòu)建了涵蓋通用性、安全性和金融特性的Prompt數(shù)據(jù)集,并組織了專業(yè)的標注團隊對成對的回答進行偏好標注。接下來,團隊通過一系列實踐、分析和改進,成功完成了獎勵模型(Reward Model)和后續(xù)的強化(采用近端策略優(yōu)化算法)訓練。下圖以XuanYuan-6B為例展示了模型在通用性和金融能力的綜合評估結(jié)果。從圖中可以看出,在兩個領域,經(jīng)過人類偏好對齊后,模型的能力都有了極大的提升,證明了強化對齊訓練的有效性。

wKgZomXvBW6AAQTOAAA-vMIkB-Q331.jpg

(RLHF-model vs SFT-model)

wKgaomXvBW-AOn0hAACKEVPWOMg177.jpg

(通用能力:RLHF-model vs SFT-model)

wKgZomXvBW-AXXK9AAB9jXqdbfc509.jpg

(金融能力:RLHF-model vs SFT-model)

度小滿軒轅大模型團隊一向貫徹開源開放的原則。為了讓廣大開發(fā)者能夠更容易的上手使用大模型,使用真實數(shù)據(jù)和真實代碼作為示例,詳細介紹了訓練模型的每個關(guān)鍵步驟。現(xiàn)在相關(guān)代碼已經(jīng)上傳開源社區(qū),供廣大用戶實操體驗。

金融行業(yè)需要怎樣的大模型?

金融領域?qū)Υ竽P偷囊筮h超過基本的“判斷”與“生成”能力,更加強調(diào)在“分析”與“決策”過程中的高級能力,這些能力是觸及金融企業(yè)核心利益的關(guān)鍵。大模型的價值體現(xiàn)在其能否在核心業(yè)務場景中發(fā)揮實際作用,如通過綜合分析用戶信息以支持風險評估、客戶畫像繪制、精準營銷策略,或通過企業(yè)數(shù)據(jù)分析支持財務審查、智能投顧和行業(yè)研究。

金融大模型的最終目標是提高企業(yè)ROI。這意味著,高效的金融大模型應當能夠在實際應用中,如客服場景,通過提升對話處理、指令遵循和意圖理解能力,不僅短期內(nèi)提高客服效率,長期還可能實現(xiàn)機器人客服的全面替代,重塑客戶服務流程,推動金融服務向更高智能化水平邁進。

結(jié)束語:關(guān)于度小滿「軒轅」大模型

度小滿軒轅大模型系列具有以下特色:

· 多尺寸開源,開發(fā)者友好。

· 擁抱開源,免費下載使用。

· 版本快速迭代,社區(qū)持續(xù)更新。

· 持續(xù)面向金融行業(yè)伙伴交流共建。

在今年的政府工作報告中,提出了“大力發(fā)展科技金融、綠色金融、普惠金融、養(yǎng)老金融、數(shù)字金融”。在這樣的宏觀背景下,AI大模型落地金融場景,為行業(yè)帶來全新的智能化發(fā)展機遇,是金融行業(yè)本身的發(fā)展意愿,也是“新質(zhì)生產(chǎn)力”的客觀要求。

作為“實戰(zhàn)派”的度小滿軒轅,已經(jīng)應用在金融領域的各個業(yè)務場景,并且初見成效。未來,度小滿軒轅會成為金融行業(yè)的一個支點,為更多智能化探索打開大門。

欲知“軒轅”大模型詳情,可移步Github官網(wǎng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269063
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47274

    瀏覽量

    238466
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2448

    瀏覽量

    2701
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    316

    瀏覽量

    308
收藏 人收藏

    評論

    相關(guān)推薦

    魔視智能受邀參加2024軒轅年度盛典

    近日,2024軒轅年度盛典在北京751圖書館隆重登場。2024軒轅年度盛典將開啟中國著名汽車觀察家和評論家賈可博士推動中國汽車產(chǎn)業(yè)向前進的3.0時代。
    的頭像 發(fā)表于 12-20 13:55 ?159次閱讀

    鯨啟智能機器人入選多項金融銀行機器人行業(yè)報告

    日前,鯨啟智能機器人憑借專業(yè)的大語音模型技術(shù)、智能迎賓和智慧服務等方面綜合能力,成功入選多項權(quán)威機構(gòu)發(fā)布的金融行業(yè)機器人行業(yè)報告。 南京鯨啟智能科技有限公司入選的
    的頭像 發(fā)表于 12-03 14:32 ?145次閱讀
    鯨啟智能機器人入選多項<b class='flag-5'>金融</b>銀行機器人<b class='flag-5'>行業(yè)</b>報告

    軒轅智駕榮獲硬科技創(chuàng)新先鋒企業(yè)獎

    近日,由高工智能汽車主辦的2024年智能汽車產(chǎn)業(yè)鏈【硬科技】趨勢峰會在江蘇太倉隆重舉行。軒轅智駕榮獲“硬科技·創(chuàng)新先鋒企業(yè)”獎。
    的頭像 發(fā)表于 11-22 17:25 ?353次閱讀

    國產(chǎn)工控機驅(qū)動金融行業(yè)發(fā)光發(fā)大,賦能金融領域的穩(wěn)定與創(chuàng)新

    近年來,隨著物聯(lián)網(wǎng)、人工智能等新技術(shù)的不斷發(fā)展,金融行業(yè)迎來了新的發(fā)展機遇。在金融領域,工控機是一種特殊的計算機設備,主要應用于各種行業(yè),包括金融
    的頭像 發(fā)表于 11-17 16:58 ?169次閱讀

    小滿,讓“推理大模型”走向金融核心業(yè)務

    當慢思考的新風,吹入金融智能化的海洋
    的頭像 發(fā)表于 10-31 09:06 ?1970次閱讀
    <b class='flag-5'>度</b><b class='flag-5'>小滿</b>,讓“推理大<b class='flag-5'>模型</b>”走向<b class='flag-5'>金融</b>核心業(yè)務

    小滿”V24.10源代碼在AtomGit開源

    近日,由中國汽車工業(yè)協(xié)會指導,普華基礎軟件股份有限公司主辦的“小滿”安全車控操作系統(tǒng)開源發(fā)布會暨共建計劃說明會成功舉行。普華基礎軟件宣布將安全車控操作系統(tǒng)“小滿”(簡稱“小滿”)V24.10源代碼
    的頭像 發(fā)表于 10-27 14:41 ?378次閱讀

    華為如何助力金融模型開出價值之花

    2024,我們正見證金融模型走向成熟
    的頭像 發(fā)表于 07-09 13:59 ?2598次閱讀

    捷科亮相2024阿里云金融創(chuàng)新峰會,推動金融科技領域數(shù)智轉(zhuǎn)型

    5月24日,2024阿里云金融創(chuàng)新峰會在杭州隆重舉行。本屆大會以“創(chuàng)智變,新原力”為主題,聚焦金融行業(yè)與“云+大模型”技術(shù)的融合創(chuàng)新
    的頭像 發(fā)表于 05-30 11:18 ?550次閱讀
    捷科亮相2024阿里云<b class='flag-5'>金融</b>創(chuàng)新峰會,推動<b class='flag-5'>金融</b>科技領域數(shù)智轉(zhuǎn)型

    智能云推出“千帆行業(yè)增強版”

    在近日于北京舉辦的2024智能經(jīng)濟論壇上,百集團執(zhí)行副總裁、百智能云事業(yè)群總裁沈抖分享了百在人工智能領域的最新進展。他宣布,為了推動行業(yè)模型
    的頭像 發(fā)表于 05-30 09:30 ?583次閱讀

    商湯科技與海通證券攜手發(fā)布金融行業(yè)首個多模態(tài)全棧式大模型

    商湯科技與海通證券聯(lián)合研發(fā)并發(fā)布了金融行業(yè)內(nèi)首個面向多業(yè)務場景的多模態(tài)全棧式大模型。雙方計劃將這一先進技術(shù)應用于智能問答、合規(guī)風控、代碼輔助以及辦公助手等關(guān)鍵業(yè)務領域,以實現(xiàn)大模型技術(shù)
    的頭像 發(fā)表于 05-06 10:16 ?466次閱讀

    商湯科技聯(lián)合海通證券發(fā)布業(yè)內(nèi)首個面向金融行業(yè)的多模態(tài)全棧式大模型

    4月23日,商湯科技正式推出“日日新SenseNova 5.0”大模型體系,并與海通證券聯(lián)合發(fā)布業(yè)內(nèi)首個面向金融行業(yè)的多模態(tài)全棧式大模型。
    的頭像 發(fā)表于 04-26 09:48 ?472次閱讀
    商湯科技聯(lián)合海通證券發(fā)布業(yè)內(nèi)首個面向<b class='flag-5'>金融</b><b class='flag-5'>行業(yè)</b>的多模態(tài)全棧式大<b class='flag-5'>模型</b>

    AI快訊:華為助力金融行業(yè)加速擁抱AI 馬斯克xAI 展示首個多模態(tài)模型

    AI快訊:華為助力金融行業(yè)加速擁抱AI 馬斯克xAI 展示首個多模態(tài)模型 小編給大家匯總一下近期的AI資訊。 華為助力金融行業(yè)加速擁抱AI
    發(fā)表于 04-15 12:32 ?411次閱讀

    華為發(fā)布金融AICC智能云聯(lián)絡中心解決方案2.0,賦能全球金融行業(yè)

    陳君和數(shù)字金融軍團解決方案資深經(jīng)理呂晨分享了金融行業(yè)數(shù)字化未來趨勢的見解:過去一年中基于大模型的AI飛速發(fā)展,各金融機構(gòu)積極擁抱AI,在客服
    的頭像 發(fā)表于 03-06 14:33 ?527次閱讀
    華為發(fā)布<b class='flag-5'>金融</b>AICC智能云聯(lián)絡中心解決方案2.0,賦能全球<b class='flag-5'>金融</b><b class='flag-5'>行業(yè)</b>

    華為云盤古大模型通過金融模型標準符合性驗證

    近日,在中國信通院組織的可信AI大模型標準符合性驗證中,華為云的盤古大模型表現(xiàn)出色,成功通過了金融模型標準的符合性驗證,并榮獲優(yōu)秀級(4+級)評分。此評級不僅是本次
    的頭像 發(fā)表于 03-05 10:12 ?642次閱讀

    華為云盤古大模型通過金融模型標桿驗證,獲最高評級

    該驗證標準主要關(guān)注金融模型對語言,語音,視覺以及多模態(tài)任務等多元領域的適應能力,涵蓋數(shù)據(jù)合規(guī)性,模型安全性和服務穩(wěn)定性等關(guān)鍵要素。
    的頭像 發(fā)表于 03-04 15:58 ?684次閱讀