每日經(jīng)濟(jì)新聞 2024-09-01 21:08:35
每經(jīng)記者 文巧 實(shí)習(xí)記者 岳楚鵬 每經(jīng)編輯 高涵
此前,一道低難度的數(shù)學(xué)題——9.11和9.9哪個(gè)更大,難倒了一眾海內(nèi)外AI大模型,也讓外界了解到了大模型在推理方面的局限性。
不過,情況正在迅速發(fā)生改變。當(dāng)?shù)貢r(shí)間8月27日,據(jù)The Information報(bào)道,OpenAI神秘的“草莓”(Strawberry,前身為Q*)項(xiàng)目,計(jì)劃最早于今年秋季推出。同時(shí),用“草莓”合成數(shù)據(jù)來開發(fā)的最新大模型——“獵戶座”(Orion),或于明年年初推出。
The Information援引知情人士的消息稱,今年夏天,在秘密會(huì)議上,OpenAI向美國國家安全官員展示了“草莓”模型。
外媒報(bào)道稱,今年夏天,在一些并未公開的會(huì)議上,阿爾特曼的團(tuán)隊(duì)向美國國家安全官員展示了“草莓”模型。圖為OpenAI首席執(zhí)行官阿爾特曼。 視覺中國圖
推理能力出眾
據(jù)The Information報(bào)道,參與OpenAI該項(xiàng)目的兩名人員透露,研究人員計(jì)劃在今年秋季推出代號(hào)為“草莓”的新型AI,并有可能將其作為ChatGPT的一部分。
據(jù)悉,OpenAI希望通過推出“草莓”為公司籌集更多資金,并尋找減少虧損的方法。此前,據(jù)媒體報(bào)道,OpenAI今年的虧損可能高達(dá)50億美元。
據(jù)前述外媒報(bào)道,“草莓”目前的功能極其強(qiáng)大。它可以解決此前從未見過的數(shù)學(xué)問題,這是當(dāng)前的聊天機(jī)器人無法可靠完成的任務(wù)。它還可以解決涉及編程的問題,且不局限于回答技術(shù)性問題。如果給予它更多時(shí)間“思考”,“草莓”模型還可以回答用戶更“主觀”的問題,例如產(chǎn)品營銷策略。
為了展示“草莓”在語言方面的實(shí)力,研究人員向OpenAI內(nèi)部同事展示了“草莓”如何解決《紐約時(shí)報(bào)》上刊登的復(fù)雜字謎游戲。
現(xiàn)有的人工智能并不擅長解決航空航天和結(jié)構(gòu)工程等數(shù)學(xué)密集型領(lǐng)域的問題,因此,解決棘手?jǐn)?shù)學(xué)問題的AI可能是一個(gè)潛在有利可圖的應(yīng)用。為了提高模型的推理能力,一些初創(chuàng)公司嘗試將問題分解為更小的步驟,但這些辦法既慢又貴。
數(shù)學(xué)推理能力的提升也有助于AI模型更好地處理對(duì)話查詢,例如客戶服務(wù)請(qǐng)求。這或許對(duì)OpenAI即將推出的AI代理服務(wù)將起到幫助。
不僅是OpenAI,人工智能領(lǐng)域的其他主要參與者也在數(shù)學(xué)推理方面取得了長足進(jìn)步。例如,谷歌DeepMind 最近開發(fā)了AlphaProof和AlphaGeometry 2,這是兩個(gè)用于高級(jí)數(shù)學(xué)推理的AI系統(tǒng)。兩個(gè)系統(tǒng)協(xié)同工作,在2024年國際數(shù)學(xué)奧林匹克競賽中獲得銀牌,解決了六道題中的四道。
可幫助訓(xùn)練大模型
對(duì)OpenAI,“草莓”不僅是一個(gè)即將要向外界推出的商業(yè)模型,它還被賦予了更重要的使命。
一位知情人士向The Information表示,OpenAI在使用更大版本的“草莓”來生成訓(xùn)練下一代旗艦?zāi)P?ldquo;獵戶座”(Orion)的數(shù)據(jù)。該模型旨在改進(jìn)其現(xiàn)有的旗艦?zāi)P虶PT-4并幫助OpenAI領(lǐng)先其他資金雄厚的競爭對(duì)手,爭奪對(duì)話式AI或大型語言模型的霸主地位。
GPT-4自2023年3月推出后,就成為一個(gè)改變游戲規(guī)則的大型語言模型。然而,在過去18個(gè)月中,競爭對(duì)手已基本追趕上來。在某些情況下,甚至超越了OpenAI的最新模型。
知情人士表示,這種由人工智能生成的數(shù)據(jù)被稱為“合成數(shù)據(jù)”。這意味著“草莓”可以幫助OpenAI克服獲取足夠高質(zhì)量數(shù)據(jù)的限制,從而利用從互聯(lián)網(wǎng)上提取的文本或圖像等現(xiàn)實(shí)世界數(shù)據(jù)來訓(xùn)練新模型。
代理初創(chuàng)公司Minion AI CEO、GitHub Copilot前首席架構(gòu)師亞歷克斯·格雷夫利表示,使用“草莓”生成更高質(zhì)量的訓(xùn)練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯(cuò)誤數(shù)量,即所謂的幻覺?;糜X是當(dāng)前生成式AI的一個(gè)重大限制,這會(huì)導(dǎo)致AI經(jīng)常生成看似合理但實(shí)際上不正確的數(shù)據(jù)。
“想象一下,一個(gè)沒有幻覺的模型,你問它一個(gè)邏輯難題,它第一次嘗試就能答對(duì)。”格雷夫利說道。該模型之所以能夠做到這一點(diǎn),是因?yàn)?ldquo;訓(xùn)練數(shù)據(jù)中的歧義較少,所以它猜測(cè)的次數(shù)較少”。
據(jù)The Information報(bào)道,OpenAI首席執(zhí)行官阿爾特曼在5月份的一次活動(dòng)中表示:“我們覺得我們擁有足夠的數(shù)據(jù)來開發(fā)下一個(gè)模型。我們已經(jīng)進(jìn)行了各種實(shí)驗(yàn),包括生成合成數(shù)據(jù)。”據(jù)報(bào)道,他指的可能就是用“草莓”訓(xùn)練的Orion(獵戶座)。
安全隱患烏云未散
不過,就在OpenAI高歌猛進(jìn)的同時(shí),安全隱患的烏云從未散去。
“草莓”項(xiàng)目源于前OpenAI首席科學(xué)家Ilya Sutskever的早期研究,OpenAI研究人員Jakub Pachocki和Szymon Sidor在Sutskever的工作基礎(chǔ)上開發(fā)了一種新的數(shù)學(xué)求解模型Q*。
而2023年底,有關(guān)OpenAI的Q*項(xiàng)目消息泄露時(shí),一些專家將該技術(shù)定性為人工智能(AGI)的突破,但人們對(duì)它知之甚少。這也讓一些專注于人工智能安全的研究人員感到震驚。
這件事情發(fā)生在去年OpenAI罷免阿爾特曼事件之前。據(jù)知情人士爆料,此前OpenAI員工之間就公司是否以足夠安全的方式開發(fā)人工智能展開了爭論。安全也是罷免阿爾特曼后公司內(nèi)部損害控制的一個(gè)重要主題,當(dāng)時(shí)罷免的發(fā)起人正是Sutskever。
此后,安全問題就一直困擾著OpenAI。而在阿爾特曼重返OpenAI后,負(fù)責(zé)OpenAI安全團(tuán)隊(duì)的成員也相繼離開了公司。
今年5月離職的OpenAI“超級(jí)對(duì)齊”團(tuán)隊(duì)領(lǐng)導(dǎo)人Jan Leike在社媒平臺(tái)X上寫道:“過去幾年,安全文化和流程已經(jīng)退居次要地位,而閃亮的產(chǎn)品則成為重中之重。”
鑒于今年早些時(shí)候幾位安全部門領(lǐng)導(dǎo)人離職,以及美國參議員伊麗莎白·沃倫等美國政府高官對(duì)于技術(shù)安全問題的批評(píng),OpenAI決定提升對(duì)政府官員的透明度。
The Information援引一位了解相關(guān)會(huì)議情況人士的消息稱,今年夏天,在一些并未公開的會(huì)議上,阿爾特曼的團(tuán)隊(duì)向美國國家安全官員展示了“草莓”模型。
報(bào)道指出,通過向政府官員展示一項(xiàng)尚未發(fā)布的技術(shù),OpenAI可能為人工智能開發(fā)者樹立了新標(biāo)準(zhǔn),尤其是在先進(jìn)人工智能日益成為潛在安全隱患的今天。此次演示可能是OpenAI努力向政策制定者提高透明度的一部分,但如果政策制定者認(rèn)為該項(xiàng)技術(shù)對(duì)國家安全形成威脅,那么他們可能給公司帶來麻煩。
不過,一些業(yè)界人士對(duì)此并不買賬,因?yàn)镺penAI并未向公眾提升透明度。AI初創(chuàng)公司Abacus. AI的CEO Bindu Reddy表示,OpenAI將他們最好的大模型藏在背后,以此來取得領(lǐng)先優(yōu)勢(shì)。“如果沒有開源AI,我們都會(huì)完蛋,我們可能會(huì)把文明的控制權(quán)交給1到2家公司。”Bindu Reddy說。
封面圖片來源:視覺中國
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP