每日經(jīng)濟(jì)新聞 2023-11-06 21:01:46
◎下半年,國(guó)內(nèi)大模型創(chuàng)業(yè)公司也進(jìn)入了產(chǎn)品的密集發(fā)布和融資關(guān)鍵期。不過(guò),現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶(hù)口碑中拔得頭籌,大模型企業(yè)要搶占先機(jī),推出應(yīng)用要快,要早。
每經(jīng)記者 趙雯琪 每經(jīng)編輯 劉雪梅
距離宣布親自下場(chǎng)大模型創(chuàng)業(yè)“不僅僅要做中文ChatGPT”僅僅8個(gè)月,李開(kāi)復(fù)和他的AI公司迎來(lái)實(shí)質(zhì)性進(jìn)展。
11月6日,李開(kāi)復(fù)帶隊(duì)創(chuàng)辦的AI 2.0公司零一萬(wàn)物正式開(kāi)源發(fā)布首款預(yù)訓(xùn)練大模型Yi-34B,同時(shí)宣布啟動(dòng)下一個(gè)千億參數(shù)模型的訓(xùn)練。目前該AI大模型已開(kāi)放商用申請(qǐng),并在阿里云魔搭社區(qū)ModelScope首發(fā)。
《每日經(jīng)濟(jì)新聞》記者同時(shí)獲悉,零一萬(wàn)物已完成由阿里云領(lǐng)投的10億美元融資。目前,零一萬(wàn)物估值已超10億美元,躋身獨(dú)角獸行列。這也就意味著,創(chuàng)業(yè)8個(gè)月,李開(kāi)復(fù)再收獲一家AI獨(dú)角獸公司。
今年以來(lái),生成式AI成為資本市場(chǎng)最大的熱點(diǎn)和風(fēng)口。國(guó)內(nèi)大模型創(chuàng)業(yè)賽道中涌現(xiàn)出上百家創(chuàng)業(yè)公司,多個(gè)科技大廠(chǎng)也親自下場(chǎng)。如今隨著越來(lái)越多頭部企業(yè)發(fā)布產(chǎn)品并陸續(xù)獲得融資,國(guó)內(nèi)大模型激戰(zhàn)也進(jìn)入新的階段。
浙江大學(xué)國(guó)際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤(pán)和林在接受《每日經(jīng)濟(jì)新聞》記者采訪(fǎng)時(shí)表示,大模型如今正呈現(xiàn)百舸爭(zhēng)流、千帆競(jìng)渡的景象,實(shí)質(zhì)上大模型的基礎(chǔ)算法并不難,難的是通過(guò)數(shù)據(jù)學(xué)習(xí)和參數(shù)積累形成一個(gè)通用人工智能,并被用戶(hù)廣泛認(rèn)可,現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶(hù)口碑中拔得頭籌,大模型企業(yè)要搶占先機(jī),推出應(yīng)用要快,要早。
據(jù)零一萬(wàn)物介紹,此次開(kāi)源發(fā)布的Yi系列模型,包含34B和6B兩個(gè)版本。在Hugging Face英文測(cè)試公開(kāi)榜單Pretrained預(yù)訓(xùn)練開(kāi)源模型排名中,Yi-34B各項(xiàng)性能以70.72的分?jǐn)?shù)位列全球第一,公開(kāi)資料顯示,Hugging Face是全球最受歡迎的大模型、數(shù)據(jù)集開(kāi)源社區(qū),被認(rèn)為是大模型領(lǐng)域的GitHub,在大模型英文能力測(cè)試中具有相當(dāng)權(quán)威性。
值得一提的是,作為國(guó)產(chǎn)大模型,Yi-34B更“懂”中文。對(duì)比大模型標(biāo)桿GPT-4,在CMMLU、E-Eval、Gaokao三個(gè)主要的中文指標(biāo)上,Yi-34B也具有優(yōu)勢(shì),能更好地滿(mǎn)足國(guó)內(nèi)市場(chǎng)需求。
各評(píng)測(cè)集得分:Yi模型v.s.其他開(kāi)源模型 圖片來(lái)源:零一萬(wàn)物
《每日經(jīng)濟(jì)新聞》記者從零一萬(wàn)物了解到,此次開(kāi)源的Yi-34B模型,將發(fā)布全球最長(zhǎng)、可支持200K超長(zhǎng)上下文窗口(context window)版本,可以處理約40萬(wàn)漢字超長(zhǎng)文本輸入。相比之下,OpenAI的GPT-4上下文窗口只有32K,文字處理量約2.5萬(wàn)字。
據(jù)了解,在語(yǔ)言模型中,上下文窗口是大模型綜合運(yùn)算能力的金指標(biāo)之一,對(duì)于理解和生成與特定上下文相關(guān)的文本至關(guān)重要,擁有更長(zhǎng)窗口的語(yǔ)言模型可以處理更豐富的知識(shí)庫(kù)信息,生成更連貫、準(zhǔn)確的文本。
此外,在文檔摘要、基于文檔的問(wèn)答等下游任務(wù)中,長(zhǎng)上下文的能力發(fā)揮著關(guān)鍵作用,行業(yè)應(yīng)用場(chǎng)景廣闊。在法律、財(cái)務(wù)、傳媒、檔案整理等諸多垂直場(chǎng)景里,更準(zhǔn)確、更連貫、速度更快的長(zhǎng)文本窗口功能,可以成為人們更可靠的AI助理,讓生產(chǎn)力提升。
然而,受限于計(jì)算復(fù)雜度、數(shù)據(jù)完備度等問(wèn)題,上下文窗口規(guī)模擴(kuò)充從計(jì)算、內(nèi)存和通信的角度存在各種挑戰(zhàn),因此大多數(shù)發(fā)布的大型語(yǔ)言模型僅支持幾千tokens的上下文長(zhǎng)度。為了解決這個(gè)限制,零一萬(wàn)物技術(shù)團(tuán)隊(duì)實(shí)施了一系列優(yōu)化,包括:計(jì)算通信重疊、序列并行、通信壓縮等。通過(guò)這些能力增強(qiáng),實(shí)現(xiàn)了在大規(guī)模模型訓(xùn)練中近100倍的能力提升,也為Yi系列模型上下文規(guī)模下一次躍升儲(chǔ)備了充足“電力”。
李開(kāi)復(fù)表示,零一萬(wàn)物堅(jiān)定進(jìn)軍全球第一梯隊(duì)目標(biāo),從招的第一個(gè)人,寫(xiě)的第一行代碼,設(shè)計(jì)的第一個(gè)模型開(kāi)始,就一直抱著成為‘World's No.1’(世界第一)的初衷和決心。
“我們組成了一支有潛力對(duì)標(biāo)OpenAI、Google等一線(xiàn)大廠(chǎng)的團(tuán)隊(duì),經(jīng)歷了近半年的厚積薄發(fā),以穩(wěn)定的節(jié)奏和全球齊平的研究工程能力,交出了第一張極具全球競(jìng)爭(zhēng)力的耀眼成績(jī)單。Yi-34B可以說(shuō)不負(fù)眾望,一鳴驚人。”李開(kāi)復(fù)表示。
創(chuàng)業(yè)8個(gè)月,如今隨著首款大模型的發(fā)布,大模型賽道再添新的競(jìng)爭(zhēng)力。
《每日經(jīng)濟(jì)新聞》記者在零一萬(wàn)物官網(wǎng)發(fā)現(xiàn),零一萬(wàn)物預(yù)測(cè),AI 2.0時(shí)代將誕生比移動(dòng)互聯(lián)網(wǎng)大十倍的平臺(tái)機(jī)會(huì),將把既有的軟件、使用界面和應(yīng)用重寫(xiě)一次,改寫(xiě)用戶(hù)的交互和入口。AI 2.0時(shí)代將誕生新一批AI-first(AI為先)的應(yīng)用,催生以AI為內(nèi)核的應(yīng)用生態(tài),催生未來(lái)的超級(jí)App及嶄新的商業(yè)模式。
這或許也是李開(kāi)復(fù)親自下場(chǎng)加入AI大模型創(chuàng)業(yè)并以最快速度推出首款產(chǎn)品的主要原因。
今年以來(lái),大模型賽道吸引了包括阿里、百度、字節(jié)跳動(dòng)等頭部大廠(chǎng)和李開(kāi)復(fù)、王慧文、王小川等科技大佬的關(guān)注,圍繞大模型的創(chuàng)業(yè)和競(jìng)爭(zhēng)異常激烈。根據(jù)創(chuàng)業(yè)邦研究中心發(fā)布的《2023年H1 AIGC產(chǎn)業(yè)報(bào)告》,2023年上半年,國(guó)內(nèi)AIGC領(lǐng)域的融資事件共57起,已披露融資總額63.13億元,涉及投資機(jī)構(gòu)數(shù)66家。
到了下半年,國(guó)內(nèi)大模型創(chuàng)業(yè)公司也進(jìn)入了產(chǎn)品的密集發(fā)布和融資關(guān)鍵期。公開(kāi)數(shù)據(jù)顯示,截至2023年8月,我國(guó)已發(fā)布的大模型已經(jīng)達(dá)到156個(gè),10億級(jí)參數(shù)規(guī)模以上大模型超80個(gè),“百模大戰(zhàn)”蓄勢(shì)待發(fā)。
不過(guò),在大模型創(chuàng)業(yè)浪潮下,很多業(yè)內(nèi)人士不免擔(dān)心行業(yè)泡沫的問(wèn)題,大模型創(chuàng)業(yè)公司瀾舟科技創(chuàng)始人兼CEO周明在接受媒體采訪(fǎng)時(shí)公開(kāi)表示,中國(guó)對(duì)新技術(shù)的追求和自驅(qū)能力較強(qiáng),但是行業(yè)需要注意泡沫問(wèn)題。“花很大的功夫訓(xùn)練一個(gè)不好不賴(lài)的模型,對(duì)廠(chǎng)商自己是一個(gè)學(xué)習(xí)鍛煉的過(guò)程,但對(duì)社會(huì)可能不一定有用。哪怕創(chuàng)業(yè),可能白白浪費(fèi)了很多創(chuàng)業(yè)資本和投入。”周明說(shuō)。
盤(pán)和林則認(rèn)為,當(dāng)前國(guó)內(nèi)AI大模型,雖然很多,但能夠被用戶(hù)認(rèn)可的大模型還不多,很多大模型僅僅在測(cè)試中能夠?qū)?biāo)ChatGPT等國(guó)外產(chǎn)品,且當(dāng)前國(guó)內(nèi)的大模型發(fā)展也受制于算力。
“我認(rèn)為現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶(hù)口碑中拔得頭籌,這個(gè)用戶(hù)口碑的關(guān)鍵還是C端用戶(hù),對(duì)用戶(hù)來(lái)說(shuō),好玩和有用的東西才能廣泛傳播,而一旦某個(gè)大模型用戶(hù)培養(yǎng)了使用習(xí)慣,則此大模型將成為一種新的互聯(lián)網(wǎng)生態(tài)產(chǎn)品,繼而獲得馬太效應(yīng),所以,大模型企業(yè)要搶占先機(jī),推出應(yīng)用要快,要早。”盤(pán)和林表示。
封面圖片來(lái)源:每經(jīng)記者 趙雯琪 攝
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP