每日經(jīng)濟(jì)新聞 2024-08-13 22:52:00
◎ ChatGPT近日驚現(xiàn)一款新的GPT-4o模型。消息一出,立即引發(fā)網(wǎng)友熱議:難道這就是傳說(shuō)中的“草莓”項(xiàng)目?
每經(jīng)記者 文巧 每經(jīng)實(shí)習(xí)記者 岳楚鵬 每經(jīng)編輯 蘭素英
當(dāng)?shù)貢r(shí)間8月13日,OpenAI的聊天機(jī)器人賬號(hào)@ChatGPTapp發(fā)文宣布,自上周以來(lái),ChatGPT上了一個(gè)新的GPT-4o模型。
根據(jù)該賬號(hào)的回帖,新上線(xiàn)的ChatGPT-4o模型并不是上周發(fā)布的API端GPT-4o 0806模型,目前該模型也對(duì)免費(fèi)用戶(hù)開(kāi)放,不過(guò)有使用次數(shù)的限制。
圖片來(lái)源:X
這一消息立刻引發(fā)了網(wǎng)友的熱議與猜測(cè):難道這就是傳說(shuō)中的“草莓”項(xiàng)目?之所以網(wǎng)友的熱情如此之高,是因?yàn)?ldquo;草莓”項(xiàng)目的前身是Q*算法模型,Q*能夠解決棘手的科學(xué)和數(shù)學(xué)問(wèn)題。如果AI模型掌握了數(shù)學(xué)能力,將擁有更強(qiáng)的推理能力,甚至與人類(lèi)智能相媲美。
然而,在隨后的測(cè)試中,網(wǎng)友們發(fā)現(xiàn)新模型與原來(lái)的版本相比,沒(méi)有太大改善,也未能通過(guò)經(jīng)典的草莓單詞測(cè)試,不過(guò)在邏輯推理方面還是有所改進(jìn)。
網(wǎng)友的激動(dòng)并非毫無(wú)緣由。
新模型發(fā)布的前一周,OpenAI CEO阿爾特曼在X上發(fā)布了一張花園里的草莓照片,網(wǎng)友隨即聯(lián)想到了OpenAI團(tuán)隊(duì)此前被爆出的一個(gè)名為“草莓(Strawberry)”的項(xiàng)目。但對(duì)于評(píng)論區(qū)的猜測(cè),阿爾特曼本人沒(méi)有證實(shí),也沒(méi)有否認(rèn),只是確認(rèn)這張照片拍的是他現(xiàn)實(shí)中的花園。
而后,ChatGPT賬號(hào)發(fā)了一個(gè)草莓表情,OpenAI員工特里弗·克里奇發(fā)了餐盤(pán)上的草莓圖片,以及爆料人@iruletheworldmo也頻繁更新,幾乎次次都與草莓相關(guān),這些似乎都指向了一個(gè)可能即將揭曉的重要時(shí)刻。
因此,當(dāng)ChatGPT賬號(hào)宣布GPT-4o家族更新,網(wǎng)友們的情緒和討論也達(dá)到了高點(diǎn),這一更新是否就是“草莓”的落地?
不過(guò),隨著測(cè)試信息的披露,網(wǎng)友發(fā)現(xiàn),這一更新并沒(méi)能滿(mǎn)足他們的預(yù)期。而且,對(duì)于新模型的具體改進(jìn)和新功能,OpenAI卻出奇地保持了沉默。
一系列測(cè)試顯示,新模型與之前的模型相比并沒(méi)有太大的改善。在經(jīng)典的草莓單詞測(cè)試中,新模型還是出現(xiàn)了錯(cuò)誤。大多數(shù)測(cè)試者反饋稱(chēng),他們并沒(méi)有感受到明顯的性能提升。有的網(wǎng)友甚至直言根本分不清楚新版本和舊版本到底有什么區(qū)別。
但本次更新并非沒(méi)有亮點(diǎn)。一些用戶(hù)指出,新模型在邏輯推理方面有所改進(jìn),例如它不再輕易陷入邏輯循環(huán)。另外,新模型的響應(yīng)速度也比之前的版本快了不少。
有網(wǎng)友還總結(jié)出了新舊模型之間的三點(diǎn)差異:一是輸出風(fēng)格略有不同,其次推理略有改進(jìn),不再陷入循環(huán),最后是更加親切,更愿意探索其存在的哲學(xué)層面(更少機(jī)器人化,更像Claude)。但是他也承認(rèn)新舊模型之間的差異不大。
對(duì)于這些評(píng)論,ChatGPT的回復(fù)是:“還有很多工作要做,我們正在努力。”至于新更新是否是備受關(guān)注的“草莓”,外界依然不得而知。
之所以網(wǎng)友們的熱情如此高漲,是因?yàn)?span>“草莓”項(xiàng)目的前身是Q*算法模型,Q*能夠解決棘手的科學(xué)和數(shù)學(xué)問(wèn)題。如果AI模型掌握了數(shù)學(xué)能力,將擁有更強(qiáng)的推理能力,甚至與人類(lèi)智能相媲美。而這一點(diǎn)是目前的大語(yǔ)言模型還無(wú)法做到的。
盡管這一方法有可能使模型在智能上實(shí)現(xiàn)質(zhì)的飛躍,但其伴隨的危險(xiǎn)性也不容忽視。正如斯坦福大學(xué)教授、STaR技術(shù)的開(kāi)發(fā)者之一Noah Goodman所言:“這種技術(shù)潛力巨大,但同時(shí)也伴隨著相當(dāng)大的風(fēng)險(xiǎn)。”
據(jù)外媒此前報(bào)道,“草莓”項(xiàng)目的訓(xùn)練涉及對(duì)經(jīng)過(guò)后期訓(xùn)練的模型(這些模型已經(jīng)針對(duì)特定用途或應(yīng)用進(jìn)行了有效的后期訓(xùn)練)進(jìn)行最終微調(diào)。這一過(guò)程類(lèi)似于斯坦福大學(xué)的自學(xué)推理機(jī)(STaR)技術(shù)。STaR技術(shù)允許AI模型通過(guò)反復(fù)創(chuàng)建自己的訓(xùn)練數(shù)據(jù),“引導(dǎo)”自己進(jìn)入更高的智能水平,理論上可以讓語(yǔ)言模型達(dá)到超越人類(lèi)的智能水平。
值得注意的是,OpenAI此前多次因安全問(wèn)題而受到質(zhì)疑。今年7月,OpenAI的一名內(nèi)部人士向美國(guó)證券交易委員會(huì)(SEC)投訴,指控公司通過(guò)非法限制性保密協(xié)議限制員工對(duì)外披露與公司技術(shù)潛在安全問(wèn)題相關(guān)的信息。更早之前,OpenAI原超級(jí)對(duì)齊團(tuán)隊(duì)負(fù)責(zé)人Jane Leike在離職后也指責(zé)公司忽視安全文化,只注重“閃亮的產(chǎn)品”而非安全。
而在8月9日,OpenAI發(fā)布了一篇關(guān)于安全性的博客文章,詳細(xì)介紹了公司在開(kāi)發(fā)ChatGPT用戶(hù)的旗艦?zāi)P虶PT-4o時(shí)所做的安全努力,并探討了這些技術(shù)可能對(duì)社會(huì)帶來(lái)的風(fēng)險(xiǎn)。
OpenAI警告稱(chēng),用戶(hù)可能會(huì)與AI建立社會(huì)關(guān)系,進(jìn)而減少對(duì)人際交往的需求——這或許對(duì)孤獨(dú)的人有益,但也可能影響健康的社會(huì)關(guān)系。與AI的長(zhǎng)期互動(dòng)甚至可能影響社會(huì)規(guī)范,比如,模型允許用戶(hù)隨時(shí)打斷和“拿走麥克風(fēng)”,這種行為雖然對(duì)AI來(lái)說(shuō)理所當(dāng)然,但在人際交往中卻顯得粗魯。
在談到GPT-4o的早期測(cè)試時(shí),OpenAI透露,他們觀察到用戶(hù)與模型的互動(dòng)語(yǔ)言開(kāi)始出現(xiàn)微妙的變化,例如,表達(dá)共同紐帶的語(yǔ)言,“這是我們?cè)谝黄鸬淖詈笠惶?rdquo;等等。這種看似無(wú)害的行為,背后可能隱藏著更大的問(wèn)題。
此外,OpenAI還提到,GPT-4o有時(shí)會(huì)無(wú)意間生成模仿用戶(hù)聲音的輸出。換句話(huà)說(shuō),它可能被用來(lái)冒充他人,從而被利用進(jìn)行犯罪活動(dòng)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP