每日經(jīng)濟新聞 2023-10-27 14:43:49
◎騰訊機器學(xué)習(xí)平臺算法負責(zé)人康戰(zhàn)輝表示,目前騰訊研發(fā)大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調(diào)長期投入;在小型模型上,希望能更加精細化,將不同的模型應(yīng)用到不同場景,同時更加考慮投入和產(chǎn)出的性價比和效益。
◎在能力提升方面,混元大模型一大亮點是開放“文生圖”功能?!拔纳鷪D”能夠?qū)崿F(xiàn)輸入對圖片的描述文字后,AI(人工智能)平臺根據(jù)文字描述生成對應(yīng)的圖片,是AIGC(生成式人工智能)具有廣泛應(yīng)用前景的場景之一,也是全球大模型競速下的“主戰(zhàn)場”之一。
每經(jīng)記者 王帆 每經(jīng)編輯 魏官紅
10月26日,《每日經(jīng)濟新聞》記者從騰訊方面獲悉,騰訊混元大模型迎來全新升級,升級后的騰訊混元中文能力整體超過GPT3.5,代碼能力大幅提升20%。此外,騰訊宣布正式對外開放混元大模型“文生圖”功能。
本次升級距離騰訊正式發(fā)布混元大模型不到兩個月。據(jù)騰訊透露,目前超過180個騰訊內(nèi)部業(yè)務(wù)已接入騰訊混元,已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務(wù)等多個行業(yè)的客戶通過騰訊云調(diào)用騰訊混元大模型API。
對于混元大模型前期訓(xùn)練成本投入的問題,騰訊機器學(xué)習(xí)平臺算法負責(zé)人康戰(zhàn)輝在接受采訪時表示,混元作為千億級參數(shù)規(guī)模的大模型,目前訓(xùn)練成本較高。對于適用于復(fù)雜場景的通用大模型,相比于成本投入而言,騰訊更重視效果;而一些細化場景可以使用小模型,更強調(diào)成本投入的高性價比。
9月7日,在2023騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。如今,騰訊公布了最新進展。
在內(nèi)部應(yīng)用上,超過180個騰訊內(nèi)部業(yè)務(wù)已接入騰訊混元,包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。最近,QQ瀏覽器還基于騰訊混元推出了“PDF閱讀助手”,具備智能摘要、智能問答和多輪提問等功能。記者注意到,實際上,騰訊混元通過自家應(yīng)用,也間接面向外部C端用戶。
外部用戶方面,已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務(wù)等多個行業(yè)的客戶,通過騰訊云調(diào)用騰訊混元大模型API,應(yīng)用領(lǐng)域涉及智能問答、內(nèi)容創(chuàng)作、數(shù)據(jù)分析、代碼助手等多個場景。今年9月首批通過備案后,騰訊混元大模型也已經(jīng)面向C端用戶陸續(xù)開放體驗,用戶通過小程序或網(wǎng)頁端,就能與騰訊混元對話。
在能力提升方面,一大亮點是開放混元大模型“文生圖”功能。“文生圖”能夠?qū)崿F(xiàn)輸入對圖片的描述文字后,AI(人工智能)平臺根據(jù)文字描述生成對應(yīng)的圖片,是AIGC(生成式人工智能)具有廣泛應(yīng)用前景的場景之一,也是全球大模型競速下的“主戰(zhàn)場”之一。
10月26日,騰訊混元大模型“文生圖”技術(shù)負責(zé)人蘆清林在接受包括每日經(jīng)濟新聞在內(nèi)的媒體采訪時表示,大模型“文生圖”的難點體現(xiàn)在對提示詞的語義理解、生成內(nèi)容的合理性以及生成圖片的效果。針對這三個技術(shù)難點,騰訊進行了專項的技術(shù)研究,提出了一系列原創(chuàng)算法來保證生成圖片的可用性和畫質(zhì)。目前騰訊混元“文生圖”能力,已經(jīng)被用于素材創(chuàng)作、商品合成、游戲出圖等多項業(yè)務(wù)中。
此外,騰訊也升級了混元的代碼、數(shù)學(xué)能力。記者了解到,混元大模型經(jīng)過對32種主流語言代碼文件、各類計算機書籍和博客的學(xué)習(xí)增訓(xùn),代碼處理水平提升超過20%,騰訊內(nèi)部目前已經(jīng)有多個開發(fā)平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復(fù)、表格數(shù)據(jù)處理、數(shù)據(jù)庫查詢等工作。
混元大模型擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens,相比于同行十億、百億級別的參數(shù)規(guī)模,研發(fā)與訓(xùn)練成本較高。
談到大模型的研發(fā)成本,騰訊機器學(xué)習(xí)平臺算法負責(zé)人康戰(zhàn)輝在接受媒體群訪時表示,目前騰訊研發(fā)大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調(diào)長期投入;在小型模型上,希望能更加精細化,將不同的模型應(yīng)用到不同場景,同時更加考慮投入和產(chǎn)出的性價比和效益。通俗來說,就是“大模大做,小模小做”。
出于上述邏輯,騰訊超180個內(nèi)部業(yè)務(wù)接入混元大模型的參數(shù)量規(guī)模也有所差別。“模型的選擇關(guān)鍵還要看場景,要結(jié)合業(yè)務(wù)場景給出靈活的方案,例如現(xiàn)在騰訊的業(yè)務(wù)部門有的用千億模型,有的用中小模型,有的用混合模型,我們不斷根據(jù)業(yè)務(wù)流量和商業(yè)模式去調(diào)整出我們自己的技術(shù)底座。”康戰(zhàn)輝說道。
《每日經(jīng)濟新聞》記者注意到,就在本月,多個廠商陸續(xù)發(fā)布大模型商業(yè)應(yīng)用:百度發(fā)布文心一言大模型4.0版本,并推出十余款A(yù)I原生應(yīng)用全面賦能業(yè)務(wù)生態(tài)。在垂直領(lǐng)域,美圖發(fā)布了自研AI視覺大模型MiracleVision(奇想智能)3.0版本,通過“提示詞智能聯(lián)想”“提示詞精準控制”等功能,可以讓用戶的各種奇思妙想實現(xiàn)所想即所得;宇信科技推出了首批金融行業(yè)大模型應(yīng)用產(chǎn)品和解決方案,包括4個應(yīng)用級產(chǎn)品和1個開發(fā)平臺。
大模型商業(yè)化進程正持續(xù)推進,騰訊對此也有一些思考。蘆清林以“文生圖”為例,闡述對未來應(yīng)用路徑的展望。“‘文生圖’的應(yīng)用價值在廣告場景是非常明確的,第一是能夠幫助廣告主更快地提升投放廣告的效率,第二是騰訊擁有豐富的廣告經(jīng)驗和知識,知道如何針對廣告主投放廣告的人群,生成更符合人群特點的廣告,因此廣告主愿意在這個產(chǎn)品上投入。”他說道。
據(jù)騰訊透露,目前在廣告業(yè)務(wù)下的多輪測評中,騰訊混元“文生圖”的案例優(yōu)秀率和廣告主采納率分別達到86%和26%。
封面圖片來源:每經(jīng)記者 張涵 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP