0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

李開復(fù):中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

要長高 ? 2024-10-22 16:54 ? 次閱讀

10月22日上午,零一萬物公司的創(chuàng)始人兼首席執(zhí)行官李開復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢,比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎,這是推動AI應(yīng)用快速發(fā)展的關(guān)鍵因素。

根據(jù)加州大學(xué)伯克利分校SkyLab和LMSYS研究人員最新發(fā)布的大模型排名,零一萬物與Grok-2和馬斯克創(chuàng)立的xAI一同位列全球第三,僅次于OpenAI和谷歌的最新模型。李開復(fù)透露,Yi-Lightning的推理成本僅為每百萬token 0.99元人民幣(14美分),而OpenAI的較小模型o1-mini則需26美分每百萬token,其更大的GPT-4o模型更是高達(dá)4.40美元每百萬token。

此外,李開復(fù)還提到,Yi-Lightning的“預(yù)訓(xùn)練”成本為300萬美元,僅為OpenAI訓(xùn)練GPT-4成本的3%,但性能卻超越了后者。

面對尖端AI芯片供應(yīng)緊張的現(xiàn)狀,國內(nèi)AI企業(yè)過去一年紛紛致力于開發(fā)高質(zhì)量數(shù)據(jù)集,以訓(xùn)練出具有特色的“混合專家”模型。李開復(fù)指出,零一萬物采用了優(yōu)于傳統(tǒng)網(wǎng)絡(luò)抓取的數(shù)據(jù)收集方法,如掃描書籍、爬取深網(wǎng)數(shù)據(jù)以及使用創(chuàng)新的合成數(shù)據(jù)技術(shù)等。

他進(jìn)一步強(qiáng)調(diào),中國在數(shù)據(jù)標(biāo)注和排序方面擁有大量技術(shù)精湛且勤奮的工程師,這使得中國在AI應(yīng)用落地方面更具優(yōu)勢。“中國的優(yōu)勢不在于無預(yù)算限制的突破性研究,而在于能夠以更好、更快、更可靠和更低成本的方式實(shí)現(xiàn)AI技術(shù)的實(shí)際應(yīng)用?!崩铋_復(fù)表示。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269060
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1087

    瀏覽量

    6508
收藏 人收藏

    評論

    相關(guān)推薦

    使用 AMD Versal AI 引擎釋放 DSP 計(jì)算的潛力

    “Versal AI 引擎可以在降低功耗預(yù)算的情況下提高 DSP 計(jì)算密度,”高級產(chǎn)品營銷經(jīng)理 Udayan Sinha 表示。這種效率使 Versal AI 引擎能夠在嚴(yán)格的功耗預(yù)算
    的頭像 發(fā)表于 11-29 14:07 ?492次閱讀

    AI推理CPU當(dāng)?shù)?,Arm驅(qū)動高效引擎

    本應(yīng)發(fā)揮關(guān)鍵作用,但其重要性卻常常被忽視。 ? “對于那些希望將大語言模型(LLM)集成到產(chǎn)品和服務(wù)中的企業(yè)和開發(fā)者來說,CPU 通常是首選”。Arm 中國區(qū)業(yè)務(wù)全球副總裁鄒挺在接受采訪時(shí)表示。為了適應(yīng)AI推理的應(yīng)用落地,CPU
    的頭像 發(fā)表于 11-13 14:34 ?2428次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>CPU當(dāng)?shù)?,Arm驅(qū)動高效<b class='flag-5'>引擎</b>

    城西科創(chuàng)大走廊打造中國AI+”產(chǎn)業(yè)地標(biāo) “中國云谷”正式啟動建設(shè)

    全力打造中國AI+”產(chǎn)業(yè)地標(biāo),10月30日,“中國云谷”建設(shè)發(fā)展大會在杭州城西科創(chuàng)大走廊紫金港科技城召開,“中國云谷”正式啟動建設(shè),著力
    的頭像 發(fā)表于 10-31 12:29 ?163次閱讀
    城西科創(chuàng)大走廊<b class='flag-5'>打造</b>“<b class='flag-5'>中國</b><b class='flag-5'>AI</b>+”產(chǎn)業(yè)地標(biāo) “<b class='flag-5'>中國</b>云谷”正式啟動建設(shè)

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無論是在復(fù)雜的 AI 開發(fā)
    的頭像 發(fā)表于 10-27 10:03 ?216次閱讀
    NVIDIA助力麗蟾科技<b class='flag-5'>打造</b><b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b>加速解決方案

    澎峰科技高性能大模型推理引擎PerfXLM解析

    模型的高性能推理框架,并受到廣泛關(guān)注。在歷經(jīng)數(shù)月的迭代開發(fā)后,澎峰科技重磅發(fā)布升級版本,推出全新的高性能大模型推理引擎:PerfXLM。
    的頭像 發(fā)表于 09-29 10:14 ?478次閱讀
    澎峰科技高性能大模型<b class='flag-5'>推理</b><b class='flag-5'>引擎</b>PerfXLM解析

    AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

    提高成本效率。HyperAccel 針對新興的生成式 AI 應(yīng)用提供超級加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個(gè)快速、高效且低成本的推理系統(tǒng),加速了基于轉(zhuǎn)換器的大型語言模型
    的頭像 發(fā)表于 09-18 09:37 ?365次閱讀
    AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務(wù)器

    摩爾線程攜手東華軟件完成AI大模型推理測試與適配

    近日,摩爾線程與東華軟件云筑AI創(chuàng)新中心宣布,雙方已完成大模型推理測試與適配。依托摩爾線程的全功能GPU國產(chǎn)算力,東華軟件打造安全可信的基于私有化大模型的“智多型(A.I.Cogniflex)”
    的頭像 發(fā)表于 07-31 10:51 ?739次閱讀

    深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

    深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色,但它們各自的功能、應(yīng)用場景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對兩者區(qū)別的詳細(xì)探討。
    的頭像 發(fā)表于 07-17 18:12 ?1261次閱讀

    李開復(fù)展望AI未來:2025年AI或超博士水平

    在6月29日舉辦的知乎第十屆鹽Club新知青年大會上,科技巨頭李開復(fù),身兼零一萬物CEO和創(chuàng)新工場董事長雙重身份,發(fā)表了對人工智能(AI)未來的深度見解。他回顧了自己與AI相伴的40年歷程,并大膽預(yù)測,大模型技術(shù)的飛速進(jìn)步將使
    的頭像 發(fā)表于 06-29 15:56 ?898次閱讀

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

    。通過昇騰CANN軟件棧的AI編程接口,可滿足大多數(shù)AI算法原型驗(yàn)證、推理應(yīng)用開發(fā)的需求。AscendCL(AscendComputingLanguage,昇騰計(jì)算
    的頭像 發(fā)表于 06-04 14:23 ?532次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

    李開復(fù)中國須獨(dú)立研發(fā)ChatGPT?

    李開復(fù)援引“ChatGPT 時(shí)刻”概念,指出美國在約 17 個(gè)月前就已體驗(yàn)到這一波熱潮(注:ChatGPT 最早于 2022 年 12 月走紅)。然而,他認(rèn)為中國尚未達(dá)到這一階段,目前國內(nèi)的聊天機(jī)器人或工具仍有待改進(jìn)。
    的頭像 發(fā)表于 05-13 16:05 ?515次閱讀

    研華攜手群聯(lián) 共同打造邊緣運(yùn)算與工控應(yīng)用生成式AI平臺

    安全可靠且經(jīng)濟(jì)實(shí)惠的GenAI模型地端設(shè)備,以加速推進(jìn)工業(yè)4.0的發(fā)展,并引領(lǐng)工業(yè)5.0人機(jī)互動的新時(shí)代。 ? 生成式人工智能(Generative AI/GenAI)的出現(xiàn),讓AI
    發(fā)表于 04-26 17:28 ?249次閱讀
    研華攜手群聯(lián) 共同<b class='flag-5'>打造</b>邊緣運(yùn)算與工控應(yīng)用生成式<b class='flag-5'>AI</b>平臺

    開發(fā)者手機(jī) AI - 目標(biāo)識別 demo

    識別demo: JS實(shí)現(xiàn)UI界面的功能; Native接口及實(shí)現(xiàn)主要為JS提供接口進(jìn)行AI推理。通過Native方式完成推理的前處理、推理以及后處理,這里通過調(diào)用opencv、Mind
    發(fā)表于 04-11 16:14

    蘋果收購加拿大AI初創(chuàng)公司DarwinAI,積極布局生成式人工智能領(lǐng)域

    DarwinAI以研發(fā)能夠在制造環(huán)節(jié)實(shí)現(xiàn)零部件視覺檢測的AI技術(shù)見長,目前已向諸多行業(yè)接觸客戶。值得注意的是,他們擅長打造緊湊型快速的AI系統(tǒng),蘋果對此技術(shù)頗感興趣,因其正致力于研發(fā)能實(shí)現(xiàn)在移動設(shè)備上運(yùn)行
    的頭像 發(fā)表于 03-15 15:33 ?655次閱讀

    AI推理框架軟件ONNX Runtime正式支持龍架構(gòu)

    近日,知名AI推理框架開源社區(qū)ONNX Runtime正式發(fā)布支持龍架構(gòu)的版本1.17.0。
    的頭像 發(fā)表于 03-12 12:23 ?579次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>框架軟件ONNX Runtime正式支持龍架構(gòu)