0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

斯坦福團(tuán)隊(duì)抄襲國(guó)產(chǎn)大模型,主要責(zé)任人失聯(lián)

Felix分析 ? 來(lái)源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2024-06-05 00:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的Llama3-V開源模型被證實(shí)套殼抄襲國(guó)內(nèi)清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。該事件引起了業(yè)界的廣泛關(guān)注,也讓大家對(duì)于開源大模型的規(guī)范使用更加擔(dān)憂。

斯坦福Llama3V模型被證實(shí)抄襲

5月29日,斯坦福大學(xué)的一個(gè)AI團(tuán)隊(duì)在Github等平臺(tái)發(fā)布了一款大模型,名為L(zhǎng)lama3V,該模型的亮點(diǎn)是據(jù)稱只需要500美元就可以訓(xùn)練出一個(gè) SOTA多模態(tài)模型,模型效果可比肩GPT-4V、Gemini Ultra等大模型。

由于模型團(tuán)隊(duì)來(lái)自斯坦福,且效果描述非常吸引眼球,因此該模型很快在社交平臺(tái)發(fā)酵,推特上相關(guān)話題的瀏覽量超過(guò)了30萬(wàn),迅速?zèng)_到了Hugging Face首頁(yè)。

不過(guò),有用戶很快發(fā)現(xiàn),Llama3-V大模型實(shí)際上是套殼面壁智能的MiniCPM-Llama3-V 2.5,但Llama3-V在發(fā)布信息中并沒有體現(xiàn)這一點(diǎn),且稱只是使用了MiniCPM-Llama3-V 2.5的tokenizer。但這一說(shuō)法讓用戶很難認(rèn)同,隨后有用戶在Github頁(yè)面上指出了套殼的問(wèn)題,但相關(guān)言論很快被斯坦福團(tuán)隊(duì)刪除。

該用戶非常不滿隨后到MiniCPM-Llama3-V 2.5頁(yè)面下重述了這一問(wèn)題,并提醒面壁智能重視此事。面壁團(tuán)隊(duì)通過(guò)測(cè)試發(fā)現(xiàn),Llama3V與MiniCPM-Llama3-V 2.5在“胎記”般案例上的表現(xiàn)100%雷同,做實(shí)了斯坦福團(tuán)隊(duì)的抄襲行為。隨后,這一事件在國(guó)外媒體迅速發(fā)酵。

隨后不久,斯坦福Llama3-V團(tuán)隊(duì)承認(rèn)抄襲,斯坦福本科生Siddharth Sharma和Aksh Garg發(fā)布了道歉聲明,不過(guò)據(jù)稱是主要責(zé)任人的Mustafa Aljadery并沒有出現(xiàn)在道歉聲明中,這名學(xué)生來(lái)自南加利福尼亞大學(xué),目前處于失蹤的狀態(tài),是這一事件的主要過(guò)錯(cuò)方。

Aksh Garg在道歉聲明中表示,“首先,我們要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa一起發(fā)布了Llama3-V,Mustafa為這個(gè)項(xiàng)目編寫了代碼,但從昨天起就無(wú)法聯(lián)系他。我與Siddharth Sharma主要負(fù)責(zé)幫助Mustafa進(jìn)行模型推廣。我們倆查看了最新的論文,以驗(yàn)證這項(xiàng)工作的新穎性,但并未被告知或意識(shí)到OpenBMB(清華團(tuán)隊(duì)支持發(fā)起的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型庫(kù)與相關(guān)工具)之前的任何工作。我們向作者道歉,并對(duì)自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對(duì)所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉?!?br />
6月3日,面壁智能CEO李大海與聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文,回應(yīng)開源模型被斯坦福大學(xué)AI團(tuán)隊(duì)抄襲一事。李大海表示:“我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境?!薄拔覀兿M麍F(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式?!?br />
據(jù)介紹,MiniCPM-Llama3-V 2.5是MiniCPM-V系列的最新版本模型,基于SigLip-400M和Llama3-8B-Instruct構(gòu)建,共參數(shù)規(guī)模為8B,相較于MiniCPM-V 2.0性能取得較大幅度提升。MiniCPM-Llama3-V 2.5在綜合了11個(gè)主流多模態(tài)大模型評(píng)測(cè)基準(zhǔn)的OpenCompass榜單上平均得分65.1的成績(jī),超越了GPT-4o、GPT-4V、Gemini Pro、Qwen-VL-Max等商用閉源模型。

開源大模型規(guī)范使用值得關(guān)注

開源大模型是指一種基于開源技術(shù)和大規(guī)模數(shù)據(jù)集構(gòu)建的人工智能模型,具有開放性和可擴(kuò)展性的特點(diǎn)。開源大模型與傳統(tǒng)的商業(yè)人工智能模型不同,其最大的特點(diǎn)在于開放性和可擴(kuò)展性。這種模型的構(gòu)建需要利用大量的開源工具和資源,包括開源的深度學(xué)習(xí)框架、開源的數(shù)據(jù)集和開源的算法等。

開源大模型是AI大模型發(fā)展的重要分支,擁有LLaMA、Grok-1、Stable Code Instruct-3B、Mistral 8x7B和零一萬(wàn)物的Yi-34B等代表產(chǎn)品,這些大模型的發(fā)布和發(fā)展,不僅顯著增強(qiáng)了數(shù)據(jù)的安全性和隱私保護(hù),更為用戶節(jié)省了大量成本,減少了對(duì)外部依賴的需求。

不過(guò),由于是開源的,因此開源大模型一直以來(lái)都面臨著被抄襲的風(fēng)險(xiǎn)。實(shí)際上,上述提到的零一萬(wàn)物的Yi-34B在去年也是深陷抄襲的漩渦里。2023年11月14日,一位國(guó)外開發(fā)者在Hugging Face開源主頁(yè)上評(píng)論稱,創(chuàng)新工場(chǎng)董事長(zhǎng)兼CEO、零一萬(wàn)物CEO李開復(fù)旗下 AI 公司“零一萬(wàn)物”開源大模型Yi-34B,完全使用Meta研發(fā)的LIama開源模型架構(gòu),而只對(duì)兩個(gè)張量(Tensor)名稱進(jìn)行修改。

根據(jù)零一萬(wàn)物的說(shuō)明,零一萬(wàn)物在訓(xùn)練模型過(guò)程中,沿用了GPT/LLaMA的基本架構(gòu),由于LLaMA社區(qū)的開源貢獻(xiàn),讓零一萬(wàn)物可以快速起步。零一萬(wàn)物還在聲明中稱,模型結(jié)構(gòu)僅是模型訓(xùn)練其中一部分。Yi 開源模型在其他方面的精力,比如數(shù)據(jù)工程、訓(xùn)練方法、baby sitting(訓(xùn)練過(guò)程監(jiān)測(cè))的技巧、hyperparameter設(shè)置、評(píng)估方法以及對(duì)評(píng)估指標(biāo)的本質(zhì)理解深度、對(duì)模型泛化能力的原理的研究深度、行業(yè)頂尖的AI infra能力等。

實(shí)際上,在更早的2022年,智源研究院的大模型研究中心就被爆出了抄襲的問(wèn)題,一篇擁有100位作者署名的綜述研究《A Roadmap for Big Model》被質(zhì)疑抄襲了多篇論文內(nèi)容,引發(fā)國(guó)內(nèi)外學(xué)者和社區(qū)的廣泛關(guān)注與討論。另外,商湯、谷歌等公司都曾被指出存在抄襲問(wèn)題。

目前,AI大模型在防止抄襲、版權(quán)歸屬等問(wèn)題方面還存在很大的漏洞,行業(yè)法規(guī)明顯不健全,關(guān)于大模型使用已有作品進(jìn)行訓(xùn)練是否構(gòu)成侵權(quán),以及大模型生成物是否可以享有版權(quán),這類事件也已經(jīng)有案件發(fā)生。相信隨著行業(yè)的進(jìn)一步發(fā)展,杜絕抄襲和版權(quán)歸屬將逐漸有法可依,這樣會(huì)更有利于大模型的發(fā)展。

結(jié)語(yǔ)

斯坦福團(tuán)隊(duì)開源大模型抄襲事件暴露了開源大模型的濫用和監(jiān)管問(wèn)題,同時(shí)AI大模型也還有更深層次的數(shù)據(jù)和作品版權(quán)歸屬問(wèn)題,因此不難看出AI大模型尚處于野蠻生長(zhǎng)的階段,未來(lái)還需要逐步健全行業(yè)法規(guī)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2499

    瀏覽量

    2909
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    斯坦福STANFORD FS725銣鐘

    斯坦福STANFORD FS725銣鐘 SRS斯坦福FS725 10MHzRb頻率標(biāo)準(zhǔn) ? SRS斯坦福FS72510MHzRb頻率標(biāo)準(zhǔn)FS725集成了一個(gè)銣振蕩器(SRS模型PRS1
    的頭像 發(fā)表于 12-13 15:22 ?106次閱讀

    斯坦福研究:電動(dòng)汽車電池實(shí)際壽命比預(yù)估長(zhǎng)得多

    。 這項(xiàng)研究是由斯坦福大學(xué)的普考特能源研究所與美國(guó)SLAC國(guó)家加速器實(shí)驗(yàn)室共同成立的SLAC-斯坦福電池研究中心的科學(xué)家們完成的。經(jīng)過(guò)超過(guò)兩年的時(shí)間,他們對(duì)92種商用鋰離子電池進(jìn)行了詳盡的充放電測(cè)試。 結(jié)果顯示,當(dāng)放電模式模擬真
    的頭像 發(fā)表于 12-11 17:24 ?301次閱讀

    STANFORD斯坦福SR830 鎖相放大器

    原裝STANFORD斯坦福SR830 鎖相放大器 鎖相放大器是一種對(duì)交變信號(hào)進(jìn)行相敏檢波的放大器。鎖相放大器利用和被測(cè)信號(hào)有相同頻率和相位關(guān)系的參考信號(hào)作為比較基準(zhǔn),只對(duì)被測(cè)信號(hào)本身和那些與參考信號(hào)
    的頭像 發(fā)表于 11-23 16:38 ?183次閱讀

    國(guó)產(chǎn)儀器崛起:斯坦福替代方案來(lái)了!

    眾所周知,斯坦福的東西一直以來(lái),好用,貴,貨期長(zhǎng)動(dòng)輒幾個(gè)月,很苦惱 今天,他來(lái)了,他的替代來(lái)了 首先是最經(jīng)典的型號(hào)斯坦福SR830,它的頻率可以達(dá)到102.4 kHz ,18位的ADC,采樣率可以
    的頭像 發(fā)表于 07-10 17:05 ?395次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b>儀器崛起:<b class='flag-5'>斯坦福</b>替代方案來(lái)了!

    斯坦福大學(xué)研發(fā)全新AI輔助全息成像技術(shù)

    據(jù)最新消息,斯坦福大學(xué)的研究人員成功研制出全新AI輔助全息成像技術(shù),其薄度、重量及質(zhì)量均超過(guò)了當(dāng)前方案,有望推動(dòng)增強(qiáng)現(xiàn)實(shí)(AR)眼鏡領(lǐng)域的發(fā)展。
    的頭像 發(fā)表于 05-10 14:48 ?600次閱讀

    斯坦福發(fā)布《2024 AI指數(shù)報(bào)告》

    近日,斯坦福大學(xué)以人為本人工智能研究所(StanfordHAI)發(fā)布了《2024年人工智能指數(shù)報(bào)告》(ArtificialIntelligenceIndexReport2024)。據(jù)
    的頭像 發(fā)表于 04-18 08:28 ?793次閱讀
    <b class='flag-5'>斯坦福</b>發(fā)布《2024 AI指數(shù)報(bào)告》

    15 張圖,看懂人工智能現(xiàn)狀

    了一系列總結(jié)人工智能當(dāng)前狀態(tài)的圖表。今年的報(bào)告由斯坦福以人為中心的人工智能研究所(HAI)發(fā)布,增加了有關(guān)負(fù)責(zé)任人工智能的擴(kuò)展章節(jié)和有關(guān)
    的頭像 發(fā)表于 04-17 08:28 ?767次閱讀
    15 張圖,看懂人工智能現(xiàn)狀

    斯坦福、伯克利大神教授創(chuàng)業(yè)給機(jī)器人造大腦,OpenAI紅杉搶著投5億

    還記得曾火遍全網(wǎng)的ALOHA家務(wù)機(jī)器人嗎?最近該項(xiàng)目導(dǎo)師,斯坦福計(jì)算機(jī)科學(xué)與電氣工程系教授ChelseaFinn在X宣布,正式與其他幾位伯克利大牛學(xué)者、谷歌DeepMind科學(xué)家共同創(chuàng)業(yè),全力為
    的頭像 發(fā)表于 04-14 08:04 ?135次閱讀
    <b class='flag-5'>斯坦福</b>、伯克利大神教授創(chuàng)業(yè)給機(jī)器人造大腦,OpenAI紅杉搶著投5億

    廣和通發(fā)布基于高通高算力芯片的具身智能機(jī)器人開發(fā)平臺(tái)Fibot

    3月29日,為助力機(jī)器人廠商客戶快速?gòu)?fù)現(xiàn)及驗(yàn)證斯坦福Mobile ALOHA機(jī)器人的相關(guān)算法,廣和通發(fā)布具身智能機(jī)器人開發(fā)平臺(tái)Fibot。
    的頭像 發(fā)表于 03-29 11:16 ?727次閱讀

    SRS斯坦福850~鎖相放大器維修

    放大器示波器儀器儀表
    安泰儀器維修
    發(fā)布于 :2024年03月25日 10:40:48

    MCSDK 5.2電機(jī)啟動(dòng)后經(jīng)常導(dǎo)致串口聯(lián)的原因有哪些?

    我用5.2的庫(kù)生成的FOC程序?qū)﹄姍C(jī)進(jìn)行控制,上電后通過(guò)workbench 控制電機(jī),正常啟動(dòng)電機(jī)后,串口會(huì)聯(lián),電機(jī)還保持著聯(lián)前的狀態(tài)轉(zhuǎn)動(dòng)
    發(fā)表于 03-15 06:37

    英偉達(dá)CEO黃仁勛建議應(yīng)屆畢業(yè)生降低期望

    確實(shí),像斯坦福這類精英學(xué)校的學(xué)生,他們對(duì)未來(lái)的期待可能高于一般的應(yīng)屆畢業(yè)生。根據(jù)QS世界大學(xué)排名,斯坦福是美國(guó)第三好的大學(xué),學(xué)生需要支付昂貴的學(xué)費(fèi)——每年62484美元,而全美的平均學(xué)費(fèi)僅為26027美元。
    的頭像 發(fā)表于 03-14 16:22 ?738次閱讀

    斯坦福繼Flash Attention V1和V2又推出Flash Decoding

    斯坦福大學(xué)此前提出的FlashAttention算法,能夠在BERT-large訓(xùn)練中節(jié)省15%,將GPT訓(xùn)練速度提高2/3。
    的頭像 發(fā)表于 03-13 15:23 ?794次閱讀

    英偉達(dá)CEO黃仁勛:競(jìng)爭(zhēng)對(duì)手的芯片免費(fèi)也難以比肩英偉達(dá)GPU

    根據(jù)斯坦福經(jīng)濟(jì)政策研究所在會(huì)上發(fā)布的視頻,美國(guó)斯坦福大學(xué)Charles R. Schwab榮譽(yù)經(jīng)濟(jì)學(xué)教授John Shoven向黃仁勛提問(wèn): “貴公司是否能造出最尖端的芯片?
    的頭像 發(fā)表于 03-11 10:08 ?681次閱讀

    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢(shì)

    Bill Dally于2009年1月加入NVIDIA擔(dān)任首席科學(xué)家,此前在斯坦福大學(xué)任職12年,擔(dān)任計(jì)算機(jī)科學(xué)系主任。Dally及其斯坦福團(tuán)隊(duì)開發(fā)了系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、信號(hào)傳輸、路由和同步技術(shù),在今天的大多數(shù)大型并行計(jì)算機(jī)中都可
    的頭像 發(fā)表于 02-25 16:16 ?1213次閱讀
    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢(shì)