每日經(jīng)濟新聞 2024-06-04 16:17:18
每經(jīng)編輯 杜宇 每經(jīng)實習(xí)編輯 宋欣悅
5月29日,斯坦福一AI團隊發(fā)布了一個名為Llama3-V的多模態(tài)大模型,宣稱只需500美元就可訓(xùn)練出一個性能可與GPT4-V媲美的模型。但隨后,該團隊發(fā)布的模型被指抄襲,其與國內(nèi)清華系大模型相似度極高。面壁智能CEO李大海和聯(lián)合創(chuàng)始人劉知遠先后發(fā)文回應(yīng),表示這是一種受到國際團隊認(rèn)可的方式,但希望大家共建開放、合作、有信任的社區(qū)環(huán)境。目前,該團隊已公開道歉,并刪除了相關(guān)庫和官宣推文。
斯坦福大學(xué)AI團隊在2024年5月29日發(fā)布了一個名為Llama3-V的多模態(tài)大模型,聲稱只需500美元就能訓(xùn)練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢榜首頁。
圖片來源:X
然而,一名細心且熱心的網(wǎng)友發(fā)現(xiàn),該團隊發(fā)布的Llama3-V和國內(nèi)大模型MiniCPM-Llama3-V 2.5有極高的相似度,后者是由國內(nèi)大模型初創(chuàng)企業(yè)“面壁智能”和清華大學(xué)自然語言處理實驗室聯(lián)合推出的。
網(wǎng)友還在在面壁智能GitHub的項目下放出了一系列證據(jù)。
該網(wǎng)友表示,這兩個模型的結(jié)構(gòu)、代碼、配置文件都一模一樣,只有變量名被替換了。
兩個模型的代碼對比圖片來源:GitHub
隨后,面壁智能首席科學(xué)家、清華大學(xué)長聘副教授劉知遠在知乎上回應(yīng),MiniCPM-Llama3-V 2.5在研發(fā)時內(nèi)置了一個彩蛋,就是對“清華簡”的識別能力,而Llama3-V模型居然也有一模一樣的能力。
清華簡是清華大學(xué)于2008年7月收藏的一批戰(zhàn)國竹簡,為戰(zhàn)國中晚期文物。劉知遠透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓(xùn)練圖像是最近從出土文物中掃描并標(biāo)注,且尚未公開發(fā)布。
關(guān)鍵性證據(jù)這不就來了!
圖片來源:知乎
而兩個模型在識別的表現(xiàn)上,正確的結(jié)果上基本一致,錯誤的情況也頗為相似。
遭到大量質(zhì)疑后,該斯坦福團隊成員已刪除他們在X上官宣模型的推文,并將該項目在Github和HuggingFace上的庫一并刪除。
圖片來源:X
最新消息,4日,斯坦福Llama3-V團隊的兩位作者森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺上就這一學(xué)術(shù)不端行為向面壁MiniCPM團隊正式道歉,并表示會將Llama3-V模型悉數(shù)撤下。
阿克沙表示,“首先,我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪,以及穆斯塔法(Mustafa)一起發(fā)布了Llama3-V,穆斯塔法為這個項目編寫了代碼,但從昨天起就無法聯(lián)系他。我與森德哈斯·沙瑪主要負責(zé)幫助穆斯塔法進行模型推廣。我們倆查看了最新的論文,以驗證這項工作的新穎性,但并未被告知或意識到OpenBMB(清華團隊支持發(fā)起的大規(guī)模預(yù)訓(xùn)練語言模型庫與相關(guān)工具)之前的任何工作。我們向作者道歉,并對自己沒有努力驗證這項工作的原創(chuàng)性感到失望。我們對所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉。”
此外,斯坦福人工智能實驗室主任克里斯托弗·大衛(wèi)·曼寧(Christopher David Manning)也發(fā)文譴責(zé)這一抄襲行為。
圖片來源:X
據(jù)第一財經(jīng)報道,6月3日,面壁智能CEO李大海及其聯(lián)合創(chuàng)始人劉知遠相繼公開發(fā)聲,就他們公司的開源模型被斯坦福大學(xué)AI團隊疑似抄襲的問題作出了回應(yīng)。
李大海在聲明中表達了對此事的深切遺憾,并指出,盡管從某種程度上看,這種模仿可以被視為他們的成果得到了國際團隊的某種認(rèn)可,但他更強調(diào)應(yīng)該構(gòu)建一個開放、協(xié)作且充滿信任的技術(shù)社區(qū)環(huán)境。他進一步強調(diào),他們希望團隊的努力和優(yōu)秀工作能夠吸引更多人的關(guān)注和認(rèn)可,但并非以這種被模仿甚至抄襲的方式。
圖片來源:第一財經(jīng)
面壁智能首席科學(xué)家、清華大學(xué)長聘副教授劉知遠也表示,人工智能的飛速發(fā)展離不開全球算法、數(shù)據(jù)與模型的開源共享,讓人們始終可以站在SOTA的肩上持續(xù)前進。面壁開源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協(xié)議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴(yán)重破壞了這一點。他們在受到質(zhì)疑后已在Huggingface刪庫,該團隊三人中的兩位也只是斯坦福大學(xué)本科生,未來還有很長的路,如果知錯能改,善莫大焉。
天眼查APP顯示,北京面壁智能科技有限責(zé)任公司成立于2022年8月,法定代表人為曾國洋,董事長為李大海,注冊資本約52.46萬人民幣,經(jīng)營范圍包括軟件開發(fā)、人工智能基礎(chǔ)軟件開發(fā)、人工智能理論與算法軟件開發(fā)、信息系統(tǒng)集成服務(wù)等。股東信息顯示,該公司由北京清語啟航科技中心(有限合伙)、曾國洋、李大海等共同持股。知識產(chǎn)權(quán)信息顯示,該公司已申請了多項專利,如“基于人工智能自適應(yīng)的NLP大模型分析系統(tǒng)”“深度學(xué)習(xí)模型統(tǒng)一應(yīng)用方法、裝置、服務(wù)器及存儲介質(zhì)”“基于人工智能的對話預(yù)測方法、裝置及存儲介質(zhì)”,當(dāng)前部分專利已獲授權(quán)。此外,該公司還登記了“CPM模型能力展示平臺”“面壁智能模力表格文本生成系統(tǒng)”等多個軟件著作權(quán)。
面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數(shù)千萬人民幣天使輪融資;今年4月,公司宣布完成新一輪數(shù)億元融資,由春華創(chuàng)投、華為哈勃領(lǐng)投,北京市人工智能產(chǎn)業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。
據(jù)其官網(wǎng)顯示,面壁智能聯(lián)合創(chuàng)始人、CEO李大海,碩士畢業(yè)于北京大學(xué)數(shù)學(xué)系,畢業(yè)后加入Google,成為Google中國創(chuàng)始員工之一,后在云云網(wǎng)任工程總監(jiān),在豌豆莢任搜索技術(shù)負責(zé)人,連續(xù)12年創(chuàng)業(yè)經(jīng)驗。2015年加入知乎,任知乎合伙人、CTO。
面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家劉知遠,是清華大學(xué)計算機系長聘副教授,智源青年科學(xué)家。主要研究方向為自然語言處理、知識圖譜和社會計算。在人工智能領(lǐng)域著名國際期刊和會議發(fā)表相關(guān)論文200余篇,Google Scholar統(tǒng)計引用超過3.1萬次。曾獲教育部自然科學(xué)一等獎、中國中文信息學(xué)會錢偉長中文信息處理科學(xué)技術(shù)獎一等獎、入選國家青年人才計劃、《麻省理工科技評論》中國區(qū)35歲以下科技創(chuàng)新35人榜單。
圖片來源:面壁智能官網(wǎng)
每日經(jīng)濟新聞綜合第一財經(jīng)、公開消息
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP