作為業(yè)界唯一的基于全國產(chǎn)算力訓練的深度推理大模型,訊飛星火X1迎來全新升級!
數(shù)學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個數(shù)量級的情況下,整體效果對標OpenAI o1和DeepSeek R1,再次證明了基于國產(chǎn)算力訓練的全棧自主可控大模型具備登頂業(yè)界最高水平的實力和持續(xù)創(chuàng)新的潛力。
全新的訊飛星火X1還有哪些升級?
融入了更多場景復雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務上展現(xiàn)出了業(yè)界領先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領先優(yōu)勢;
首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式,私有化部署簡便;全新升級模型定制優(yōu)化工具鏈,支持SFT、強化學習兩種模型定制優(yōu)化方案,定制門檻低;
三大核心技術創(chuàng)新——大規(guī)模多階段強化學習訓練方法、基于快慢思考的統(tǒng)一訓練方法、工程技術系統(tǒng)創(chuàng)新保障基于國產(chǎn)算力的高效長穩(wěn)訓練,助力星火X1全面升級。
01首發(fā)快思考、慢思考統(tǒng)一模型
開放API與微調服務
本次升級,首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式。同時在通用任務效果,星火X1實現(xiàn)顯著提升,整體效果對標OpenAI o1和DeepSeek R1,在數(shù)學、知識問答等方面表現(xiàn)突出。
測試集合來源:自建測試集主要來自真實的大模型請求任務數(shù)據(jù),來源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務數(shù)據(jù)等;公開測試集主要以數(shù)學、答題、推理、代碼等外部典型測試集為主。
從技術創(chuàng)新到應用落地,滿血版星火X1僅需4張卡(華為910B)即可部署,實現(xiàn)簡便與低成本的私有化部署。同時,星火X1 API服務與模型微調服務也已全面開放,賦能廣大開發(fā)者和企業(yè):
API服務同步開放
星火APP升級X1深度推理大模型的同時,星火X1 API同步全面開放,開發(fā)者伙伴可以無門檻快速集成星火APP同款X1深度推理大模型。
限時免費一個月
為了讓廣大開發(fā)者伙伴能夠更加從容地探索深度推理大模型的創(chuàng)新應用場景,星火X1 API限時免費一個月(截止到5月21日24:00),即刻前往星火官網(wǎng)(https://xinghuo.xfyun.cn/sparkapi)調用API服務。
首發(fā)即支持模型微調
為滿足開發(fā)者和企業(yè)客戶多元的業(yè)務需求場景,星辰MaaS平臺(https://training.xfyun.cn/modelSquare)首發(fā)“星火X1微調服務”,讓開發(fā)者聚焦業(yè)務場景的價值創(chuàng)造,自由定制專屬深度推理模型。
02從專業(yè)難題到通用任務
星火X1都能從容應答
語言理解能力提升:結合語境準確理解文字語義
首先我們用博大精深的中國話,考驗一下X1:
Prompt:如何理解“但丁真不會說中國話,但丁真會說中國話”
在思考過程中,我們能看到X1一眼識破這個“文字游戲”,然后進行了準確的人物拆分,最后在總結中還能精準分析這個網(wǎng)絡梗的幽默之處。
文本生成能力提升:輸出內容、格式更加符合用戶指令要求
文字游戲根本難不倒X1,再來試試對文字能力要求很高的駢文寫作:
Prompt:模仿《滕王閣序》寫篇駢文,描寫內容是登上安徽黃山看到雄奇壯美的景色之后,表達對安徽這片熱土的熱愛以及對祖國的驕傲自豪
X1不僅嚴格按照駢文的文體瞬間模仿成文,且對安徽的人文歷史、科技發(fā)展等描述言之有物。從中可以看到,X1在風格化遷移、創(chuàng)意寫作上已經(jīng)具備了相當出色的水準。
數(shù)學答題能力提升:可完成復雜的數(shù)理邏輯推理
上傳一道大學數(shù)學競賽水平的四棱錐隨機游走概率問題,X1準確識別,并給出了嚴謹清晰的解題步驟和正確答案。
代碼能力提升:代碼生成準確率提升顯著,復雜邏輯處理能力同步增強
Prompt:用Python幫我畫一個小球在正方形里不斷運動,小球每撞一次正方形的四邊,小球的顏色就會變化并且速度加快10%,如此反復下去
根據(jù)用戶游戲規(guī)則的需求描述,X1快速且準確地通過Pygame庫編寫功能代碼,并且將代碼復制到IDE可直接運行,最終實現(xiàn)效果精準滿足用戶要求。同理,我們可以讓X1一鍵生成代碼,實現(xiàn)簡單的登錄界面、動態(tài)卡片、小游戲等交互效果,提升開發(fā)效率。
支持多模推理能力:可針對圖片、音視頻進行深度推理問答,以及多張圖像的關聯(lián)思考
Prompt:把圖上這些不同的蔬菜按照切法進行分類,并且告訴我每一類的蔬菜怎么切是最方便和適合烹飪的
X1不僅準確識別出了蔬菜名稱,還條理分明地按照塊狀、片狀、絲狀、丁狀、段狀等給出了切法和烹飪建議,眼力和實用性拉滿。
行業(yè)任務表現(xiàn)取得進步:在教育、醫(yī)療、司法等重點行業(yè)進一步擴大領先優(yōu)勢
星火X1除了在常見通用任務取得顯著進步之外,由于融入了更多場景復雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務上展現(xiàn)出了業(yè)界領先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領先優(yōu)勢。
03星火APP極簡版發(fā)布
沉浸式「深度推理」
依托全新的X1深度推理大模型,星火App正式推出極簡版本,并完成功能升級——支持深度推理、聯(lián)網(wǎng)搜索。在煥新的極簡交互界面,打造沉浸式的“解題”過程,完整展示大模型的所思所想,生成更全面的回答。
正如X1的升級統(tǒng)一了快思考和慢思考,本次升級兼容了極簡深邃與精專多能兩種風格。對于“追求功能全面”的用戶,支持一鍵切換至專業(yè)版,解鎖智能體、語音暢聊、個人知識管理等豐富功能,實現(xiàn)快速信息獲取與慢思考深度創(chuàng)作無縫切換。
在訊飛星火網(wǎng)頁端,同樣可以體驗深度推理和聯(lián)網(wǎng)搜索在通用任務上的全新效果。也歡迎大家登錄星火APP/網(wǎng)頁端,一起探索星火X1的更多充滿想象力的用法和玩法。
04三大技術創(chuàng)新
X1突破全國產(chǎn)算力模型天花板
用戶體驗升級的背后,根植于星火X1的三大技術創(chuàng)新:
大規(guī)模多階段強化學習訓練方法:
提出基于問題難度的大規(guī)模多階段強化學習方法,在復雜推理、數(shù)學、代碼、語言理解等場景全面提升模型效果及泛化性;同時提出強化學習動態(tài)更新算法,基于樣本采樣長度動態(tài)調整強化學習更新速度,進一步提升深度思考強化學習效率及效果。
基于快慢思考的統(tǒng)一訓練方法:
提出統(tǒng)一模型下快慢思考混合訓練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進作用,實現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷的部署使用。
工程技術系統(tǒng)創(chuàng)新保障基于國產(chǎn)算力的高效長穩(wěn)訓練:
實現(xiàn)多項工程技術創(chuàng)新,顯存動態(tài)卸載技術大幅提升長文本推理并發(fā)、訓推共卡協(xié)同實現(xiàn)高效訓推資源轉換、推理引擎冬眠機制實現(xiàn)快速拉起和恢復,實現(xiàn)國產(chǎn)算力平臺上高效和穩(wěn)定的強化學習訓練全流程。
堅持自主可控的算力底座,訊飛星火X1持續(xù)升級
以規(guī)?;瘧寐涞?,助力千行百業(yè)共享智能紅利
-
科大訊飛
+關注
關注
19文章
837瀏覽量
62181 -
算力
+關注
關注
2文章
1142瀏覽量
15445 -
大模型
+關注
關注
2文章
3025瀏覽量
3825
原文標題:星火X1全新升級!首個全國產(chǎn)通用深度推理大模型
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論