作為當(dāng)前業(yè)界唯一的基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型,訊飛星火X1全新升級(jí)啦!
本次升級(jí)有這些關(guān)鍵信息
實(shí)現(xiàn)了數(shù)學(xué)、代碼、邏輯推理、文本生成、語(yǔ)言理解、知識(shí)問(wèn)答等通用任務(wù)效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下,整體效果對(duì)標(biāo)OpenAI o1和DeepSeek R1,再次證明了基于國(guó)產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實(shí)力和持續(xù)創(chuàng)新的潛力。
融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點(diǎn)行業(yè)如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢(shì)。
首發(fā)快思考、慢思考統(tǒng)一模型,由一個(gè)模型同時(shí)支持兩種思考模式,私有化部署簡(jiǎn)便;全新升級(jí)模型定制優(yōu)化工具鏈,支持SFT、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,定制門檻低。
三大核心技術(shù)創(chuàng)新——大規(guī)模多階段強(qiáng)化學(xué)習(xí)訓(xùn)練方法、基于快慢思考的統(tǒng)一訓(xùn)練方法、工程技術(shù)系統(tǒng)創(chuàng)新保障基于國(guó)產(chǎn)算力的高效長(zhǎng)穩(wěn)訓(xùn)練,助力星火X1全面升級(jí)。
星火X1 API已同步上線訊飛開放平臺(tái),面向廣大開發(fā)者和企業(yè)開放服務(wù)。
快來(lái)看看本次升級(jí)的精彩細(xì)節(jié)吧!
此次星火X1升級(jí),在多個(gè)任務(wù)上效果繼續(xù)突破,展現(xiàn)出優(yōu)異的性能。根據(jù)最新測(cè)試集評(píng)測(cè)結(jié)果,星火X1在通用任務(wù)效果評(píng)測(cè)中全面對(duì)標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識(shí)問(wèn)答等方面表現(xiàn)突出。
測(cè)試集合來(lái)源:自建測(cè)試集主要來(lái)自真實(shí)的大模型請(qǐng)求任務(wù)數(shù)據(jù),來(lái)源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務(wù)數(shù)據(jù)等;公開測(cè)試集主要以數(shù)學(xué)、答題、推理、代碼等外部典型測(cè)試集為主。
升級(jí)后的星火X1表現(xiàn)怎么樣?上題,開測(cè)!
先來(lái)看一道數(shù)學(xué)題
星火X1準(zhǔn)確識(shí)別出復(fù)雜的數(shù)學(xué)公式,不僅給出完整解題思路,輸出結(jié)果也嚴(yán)謹(jǐn)清晰。
再來(lái)看一道邏輯推理題
星火X1全方位思考,給出每一種可能的假設(shè),對(duì)所有可能性清晰謹(jǐn)慎地探討。
接下來(lái)試試代碼題
面對(duì)復(fù)雜的代碼需求,星火X1縝密思考,代碼生成的準(zhǔn)確率up!代碼能力up!
來(lái)考考星火X1的語(yǔ)言理解能力
在語(yǔ)言理解方面,星火X1在輸出內(nèi)容、格式等方面更加符合用戶指令要求,結(jié)果既連貫又準(zhǔn)確。
星火X1的長(zhǎng)思維鏈能力還支持圖像輸入
星火X1接收到圖像后,立刻開始對(duì)輸入的圖像進(jìn)行關(guān)聯(lián)思考,輕松“拿捏”并給出結(jié)果。
無(wú)論是數(shù)學(xué)解題,還是圖片理解,升級(jí)后的星火X1都能給出嚴(yán)謹(jǐn)、專業(yè)、準(zhǔn)確的回答,展示完整、清晰的推理過(guò)程,讓大家更能直觀清楚地理解星火X1的思考過(guò)程。
星火X1除了在常見通用任務(wù)取得顯著進(jìn)步之外,由于融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點(diǎn)行業(yè)如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢(shì)。
以司法行業(yè)為例
針對(duì)司法行業(yè)中的專業(yè)需求,例如根據(jù)材料總結(jié)案件事實(shí)以及判決理由,升級(jí)后的星火X1關(guān)注用戶指令需求,詳細(xì)分析案件爭(zhēng)議點(diǎn),快速定位材料中的關(guān)鍵信息,準(zhǔn)確輸出內(nèi)容。
為了讓更多企業(yè)能夠便捷用上AI,本次升級(jí)的星火X1為企業(yè)AI落地提供了雙重支持:
首發(fā)快思考、慢思考統(tǒng)一模型,由一個(gè)模型同時(shí)支持兩種思考模式,4張卡(華為910B)即可部署滿血版星火X1,私有化部署簡(jiǎn)便。
全新升級(jí)模型定制優(yōu)化工具鏈,支持SFT、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,16張卡(華為910B)即可完成行業(yè)定制優(yōu)化,定制門檻低。
星火X1此次全新升級(jí),背后有三大技術(shù)創(chuàng)新:
大規(guī)模多階段強(qiáng)化學(xué)習(xí)訓(xùn)練方法:提出基于問(wèn)題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語(yǔ)言理解等場(chǎng)景全面提升模型效果及泛化性;同時(shí)提出強(qiáng)化學(xué)習(xí)動(dòng)態(tài)更新算法,基于樣本采樣長(zhǎng)度動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,進(jìn)一步提升深度思考強(qiáng)化學(xué)習(xí)效率及效果。
基于快慢思考的統(tǒng)一訓(xùn)練方法:提出統(tǒng)一模型下快慢思考混合訓(xùn)練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進(jìn)作用,實(shí)現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷地部署使用。
工程技術(shù)系統(tǒng)創(chuàng)新保障基于國(guó)產(chǎn)算力的高效長(zhǎng)穩(wěn)訓(xùn)練:實(shí)現(xiàn)多項(xiàng)工程技術(shù)創(chuàng)新,顯存動(dòng)態(tài)卸載技術(shù)大幅提升長(zhǎng)文本推理并發(fā)、訓(xùn)推共卡協(xié)同實(shí)現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理
引擎冬眠機(jī)制實(shí)現(xiàn)快速拉起和恢復(fù),實(shí)現(xiàn)國(guó)產(chǎn)算力平臺(tái)上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。
現(xiàn)在,打開訊飛星火網(wǎng)頁(yè)端或訊飛星火APP,即可體驗(yàn)在通用任務(wù)上深度推理和聯(lián)網(wǎng)搜索的全新效果。
同時(shí),星火X1 API也已同步上線訊飛開放平臺(tái),面向廣大開發(fā)者和企業(yè)開放服務(wù)。
星火X1作為首個(gè)支持全國(guó)產(chǎn)算力的推理大模型,目前微調(diào)服務(wù)已上線訊飛星辰MaaS平臺(tái)。
即刻體驗(yàn)星火X1 API,快來(lái)試試吧!
星火X1本次升級(jí)后的更多用法,等你探索與分享。
-
科大訊飛
+關(guān)注
關(guān)注
19文章
837瀏覽量
62181 -
大模型
+關(guān)注
關(guān)注
2文章
3025瀏覽量
3825 -
DeepSeek
+關(guān)注
關(guān)注
1文章
773瀏覽量
1335
原文標(biāo)題:來(lái)了!訊飛星火X1全新升級(jí)
文章出處:【微信號(hào):iFLYTEK1999,微信公眾號(hào):科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論