每日經(jīng)濟(jì)新聞 2024-07-04 20:51:45
每經(jīng)記者 張宏 每經(jīng)編輯 廖丹
7月2日,微眾銀行“大模型時(shí)代AI前沿與金融應(yīng)用”主題活動(dòng)在北京舉辦。
會(huì)上,微眾銀行人工智能首席科學(xué)家范力欣表示,模型越大,能力越強(qiáng),隨之而來(lái)的問(wèn)題是高成本,盡管現(xiàn)在“百模大戰(zhàn)”,用戶成本可能越來(lái)越低,但使用和訓(xùn)練大型模型的成本實(shí)際上并沒(méi)有降低,這為大模型應(yīng)用落地帶來(lái)挑戰(zhàn)。
會(huì)后,《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱“NBD”)就如何防范和糾正大模型“幻覺(jué)”、銀行業(yè)大模型落地面臨的挑戰(zhàn)、數(shù)據(jù)要素與大模型之間的關(guān)系等問(wèn)題專(zhuān)訪了范力欣。
圖片來(lái)源:每經(jīng)記者 張宏 攝
NBD:在金融機(jī)構(gòu)中,數(shù)據(jù)精準(zhǔn)度至關(guān)重要,因此有人認(rèn)為生成式AI不適合應(yīng)用在金融機(jī)構(gòu)的核心部門(mén)。針對(duì)生成式AI可能出現(xiàn)的“幻覺(jué)”問(wèn)題,你認(rèn)為可以如何進(jìn)行防范和糾正?
范力欣:在技術(shù)層面,可以基于內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫(kù)查詢和校驗(yàn)。目前,這一過(guò)程已經(jīng)在實(shí)際應(yīng)用中得到實(shí)施。
首先,在生成內(nèi)容之前,(生成式人工智能)需要先查詢信息。當(dāng)查詢來(lái)源為網(wǎng)絡(luò)時(shí),信息的可靠性參差不齊,查詢結(jié)果的準(zhǔn)確性并非總是能夠得到保證。但在(金融機(jī)構(gòu)的)實(shí)際應(yīng)用中,所依賴的是內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫(kù),這構(gòu)成了第一層保障。
其次,生成的內(nèi)容需要再次與數(shù)據(jù)庫(kù)進(jìn)行校驗(yàn),以確保生成的內(nèi)容與數(shù)據(jù)庫(kù)之間不存在矛盾。這是技術(shù)層面上的第二層校驗(yàn)。
在流程層面上,我們的系統(tǒng)并不直接面向?qū)崟r(shí)生成業(yè)務(wù)。以客服為例,客服背后有一個(gè)龐大的數(shù)據(jù)庫(kù)支撐。以往遇到的問(wèn)題是,數(shù)據(jù)庫(kù)中一個(gè)問(wèn)題對(duì)應(yīng)一個(gè)答案。隨之而來(lái)的難點(diǎn)是如何將同一問(wèn)題千變?nèi)f化的問(wèn)法與數(shù)據(jù)庫(kù)中的答案對(duì)應(yīng)?,F(xiàn)在,(有了生成式人工智能)可以擴(kuò)展問(wèn)題的表述范圍,使其能夠覆蓋用戶未來(lái)可能的表述,從而達(dá)到答案與問(wèn)題的“多對(duì)一”匹配。由于數(shù)據(jù)庫(kù)是離線的,并且可以人工審核,從應(yīng)用層面避免了“模型幻覺(jué)”問(wèn)題。
NBD:剛剛你提到的數(shù)據(jù)庫(kù)是銀行內(nèi)部的私域數(shù)據(jù)庫(kù)嗎?
范力欣:是的。實(shí)際上,包含兩個(gè)數(shù)據(jù)庫(kù):第一個(gè)是事實(shí)材料庫(kù),也稱為背景庫(kù),它用于查詢和聯(lián)合校驗(yàn)。第二個(gè)數(shù)據(jù)庫(kù)是面向服務(wù)端客服的問(wèn)答庫(kù)。這個(gè)問(wèn)答庫(kù)原本是一問(wèn)一答的模式,現(xiàn)在已經(jīng)發(fā)展為多問(wèn)一答的模式。
NBD:校驗(yàn)的過(guò)程由模型完成,還是由人工完成?模型在校驗(yàn)過(guò)程中會(huì)不會(huì)出現(xiàn)“幻覺(jué)”?
范力欣:大模型校驗(yàn)。但最終會(huì)由人工審核,就像一支人機(jī)混合的足球隊(duì),大模型是前鋒,攻城拔寨,人工審核是后衛(wèi)守門(mén)員,保證不失一球。
NBD:人工智能的發(fā)展對(duì)金融機(jī)構(gòu)人員專(zhuān)業(yè)占比有沒(méi)有影響?
范力欣:微眾銀行擁有超過(guò)50%的科技人員。在這些科技人員中,涵蓋了我們通常所說(shuō)的ABCD各個(gè)方面,即人工智能(AI)、區(qū)塊鏈(Blockchain)、云計(jì)算(Cloud)以及大數(shù)據(jù)(Big Data)。目前,這些技術(shù)領(lǐng)域已經(jīng)基本融合。
NBD:大模型落地目前還面臨哪些挑戰(zhàn)?
范力欣:雖然大模型在技術(shù)上有廣闊的想象空間,但我們必須考慮投入產(chǎn)出比。小型模型可能能力不足,而大模型可能具有質(zhì)的飛躍,但隨之而來(lái)的問(wèn)題是成本也可能有質(zhì)的飛躍。銀行是高度數(shù)字化和信息化的,理論上完全可以使用該技術(shù)。然而,銀行必須計(jì)算投入產(chǎn)出,許多小企業(yè)也同樣關(guān)注這一比率。任何企業(yè)首先考慮的是生存問(wèn)題,而成本控制是首要的考慮因素。
目前,大模型帶來(lái)的微小收益可能已經(jīng)被其額外的成本所抵消。因此,現(xiàn)階段我們只能篩選那些產(chǎn)出大于投入的業(yè)務(wù)。對(duì)于其他業(yè)務(wù),我們可能會(huì)進(jìn)行簡(jiǎn)單的嘗試或評(píng)估,以確定是否可行。當(dāng)大模型到達(dá)另一個(gè)階段,能力更強(qiáng)、成本更低的時(shí)候,將有更多可能的業(yè)務(wù)亟待拓展。
NBD:目前哪些應(yīng)用在投入產(chǎn)出比上有優(yōu)勢(shì)?
范力欣:目前在投入產(chǎn)出比上具有優(yōu)勢(shì)的應(yīng)用主要包括生成視頻、生成圖像以及營(yíng)銷(xiāo)領(lǐng)域。除此之外,還有對(duì)客戶進(jìn)行評(píng)估和判斷的相關(guān)應(yīng)用。這些都是可以進(jìn)一步開(kāi)發(fā)的領(lǐng)域,但有時(shí)候不一定要使用大模型。
NBD:你提到聯(lián)邦大模型,借助聯(lián)邦大模型似乎可以達(dá)到數(shù)據(jù)可用不可見(jiàn)。數(shù)據(jù)要素市場(chǎng)建設(shè)有沒(méi)有可能與人工智能相融合形成1+1>2的效果?
范力欣:我們的理解是,關(guān)鍵不在于數(shù)據(jù)要素,而在于模型要素。為什么這么說(shuō)呢?數(shù)據(jù)本身如同原油,可以提煉為柴油、汽油等多種形態(tài),只有當(dāng)數(shù)據(jù)被納入一個(gè)有效的模型中,數(shù)據(jù)才具有可用性。雖然這個(gè)比喻可能略顯粗糙,但可以理解為,原始數(shù)據(jù)有多種潛在用途,在具體用途不明確的情況下,我們無(wú)法對(duì)數(shù)據(jù)進(jìn)行準(zhǔn)確的定價(jià),只能根據(jù)數(shù)據(jù)的規(guī)模和大致質(zhì)量進(jìn)行初步估計(jì)。
然而,更精確的定價(jià)應(yīng)當(dāng)面向應(yīng)用。只有當(dāng)我們明確了數(shù)據(jù)的使用目的,以及它在實(shí)際應(yīng)用中帶來(lái)的幫助,我們才能評(píng)估其真正的價(jià)值。否則,同樣的數(shù)據(jù)對(duì)某些人可能毫無(wú)價(jià)值,而對(duì)另一些人可能非常有用。
這種應(yīng)用價(jià)值的評(píng)估需要通過(guò)模型來(lái)實(shí)現(xiàn),即通過(guò)訓(xùn)練或微調(diào),使數(shù)據(jù)得以有效利用,從而揭示其真正的價(jià)值。從這個(gè)角度來(lái)看,實(shí)際上是模型賦予了數(shù)據(jù)價(jià)值,就像羊吃了草之后,我們是對(duì)羊定價(jià),并向客戶提供羊的使用價(jià)值。
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1419339719
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP