亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

揭開與“湯曉鷗”重逢幕后 | 商湯:他永遠關(guān)注人,大于關(guān)注技術(shù)和商業(yè) | AI復(fù)生記②

每日經(jīng)濟新聞 2024-03-12 12:11:45

◎這場跨越時空的重逢,是AI,也是愛。

每經(jīng)記者 宋美璐  畢媛媛    每經(jīng)編輯 陳俊杰 宋紅    

“大家好,我們又見面了。”熟悉的臉龐,熟悉的聲音,熟悉的那身西裝,商湯科技創(chuàng)始人湯曉鷗如約而至走向年會的舞臺中央,說累了舉起手邊的礦泉水飲了一口。

湯曉鷗數(shù)字人參加年會 視頻截圖

每年年會,湯曉鷗都會用獨屬他的“湯式幽默”分享自己一年來的思考和感悟。在商湯科技,“有趣的靈魂”是大家對他的評價。

“最近上映的《熱辣滾燙》,我還沒看呢。”話音落畢,詼諧的氛圍瞬間沉重,因為在《熱辣滾燙》上映兩個月前,年僅55歲的湯曉鷗不幸病逝,在現(xiàn)實世界與大家告別。也是此時,大家才意識到這是數(shù)字人的世界。

這場跨越時空的重逢,是AI,也是愛;是對湯曉鷗卓越貢獻的深深緬懷,也是對其留下的AI技術(shù)的傳承與延續(xù)。

“湯老師最關(guān)注的一直是中國科技人才的培養(yǎng)”3月7日早上,在商湯科技會議室內(nèi),商湯科技數(shù)字空間事業(yè)群數(shù)字文娛事業(yè)部總經(jīng)理欒青,對《每日經(jīng)濟新聞》記者回顧湯曉鷗數(shù)字人制作的過程時表示,湯曉鷗的“中國原創(chuàng)”理念已成為每個商湯人的使命。

商湯科技數(shù)字空間事業(yè)群數(shù)字文娛事業(yè)部總經(jīng)理欒青 受訪者供圖

“《熱辣滾燙》那一段,是年會前一天徐立提出來的”

“湯老師最關(guān)注的一直是中國科技人才的培養(yǎng)”,這是欒青從個人角度對湯曉鷗的理解。作為湯曉鷗在微軟亞洲研究院的實習(xí)生,欒青多次在采訪中提及“中國原創(chuàng)”。在欒青看來,這是湯曉鷗生前堅持的事,也深深影響著每一個商湯人。

記者:9分鐘湯曉鷗教授數(shù)字人演講的想法從何而來?

欒青:每年湯老師在年會上的脫口秀都是大家期待的焦點。往年,湯老師會從生活和日常流行元素中總結(jié)并分享自己的思考和感悟,給我們的工作生活帶來很大的啟發(fā)。所以,對商湯人而言,他既是我們的老師,也是信仰一般的存在。

湯老師意外發(fā)生后,團隊和他的學(xué)生們都很傷心。在籌備年會時,大家認為如果能延續(xù)傳統(tǒng),對每個商湯人來說都非常重要。

這件事情沒有糾結(jié),我們很快達成共識。當然,有了初步想法后首先要征求其家人的同意,他們表達認可后,我們很快決定實施了。

記者:我們想聽聽湯曉鷗數(shù)字人誕生過程中的一些具體故事。

欒青:徐立(注:商湯科技董事長兼CEO)對這件事的要求很高,他希望最終的呈現(xiàn)能超越數(shù)字人本身,有更高的還原度,而不只是一個動作、表情,在同一個地方講述。所以最終呈現(xiàn)的視頻中我們可以看到湯曉鷗喝水、低頭還有一些手部動作,甚至是湯老師講話間隙的咳嗽、停頓都還原了出來。

湯曉鷗數(shù)字人在年會上喝水 視頻截圖

團隊從1月開始策劃、構(gòu)思,前前后后大概用了近兩個月。除了做內(nèi)容和后期,真正操刀執(zhí)行人物生成和聲音生成的實際上就幾個同事,第一版的生成花了一天多的時間,但后來又經(jīng)過多次調(diào)試,總共做了五、六版,其中文案調(diào)整的最多。

記者:視頻之后,商湯科技旗下數(shù)字人視頻生成平臺“如影”收到了怎樣的反饋?

欒青:外界的看法會說好逼真,都以為是之前的錄屏,直到后面《熱辣滾燙》才看出來不是預(yù)錄的。其實,加入《熱辣滾燙》那一段是年會前一天徐立提出來的。

我們做好后首先是拿給湯老師的家人看,我們最大的認可也來自他們。看完初版后,他們很感動,說像是真的湯老師。其實我們所有人在會議室看完后眼睛都是濕濕的。

湯曉鷗數(shù)字人在年會上 視頻截圖

記者:你是湯曉鷗在微軟亞洲研究院的實習(xí)生,你眼中的湯曉鷗是怎樣的?你在他身上學(xué)到了什么精神?

欒青:在微軟亞洲研究院,我有幸成為湯老師組的實習(xí)生。湯老師是一個think big(大處著眼)的人,他始終堅持“中國原創(chuàng)”,包括他堅持基礎(chǔ)技術(shù)的突破,創(chuàng)辦上海人工智能實驗室和浦江實驗室作基礎(chǔ)研究和原創(chuàng)內(nèi)容研發(fā)。

他一直焦慮中國能不能有更多的原創(chuàng)技術(shù)出現(xiàn)、能不能攏住優(yōu)秀人才?現(xiàn)在回顧起來,這是件很偉大的事??稍谒磉叺臅r候,你又不會用“偉大”來形容,只會覺得他是個很親切、很有趣的人。

我印象很深刻,他每晚會聽于謙講相聲。他常說人工智能再厲害,有趣的靈魂永遠沒辦法被替代。他關(guān)注的始終是人,關(guān)注人比關(guān)注商業(yè)和技術(shù)多很多,他希望未來每個優(yōu)秀的研究員都能堅持“中國原創(chuàng)”。這個理念貫穿我們每個人,是我們的一股力量,也成為每個商湯人的使命。

記者:以后商湯每年的年會,都可以看到“湯曉鷗”嗎?

欒青:我當然希望能夠延續(xù)下去,也許明年年會的湯老師就可以跟我們聊天、對話了。

“湯式幽默”重現(xiàn)背后聲音素材僅20秒

過去幾年發(fā)展中,數(shù)字人技術(shù)已逐漸成熟并應(yīng)用于多個場景。但當湯曉鷗的聲音、笑容、停頓、走動、喝水動作甚至湯式幽默都能夠復(fù)現(xiàn)時,也意味著數(shù)字人技術(shù)實現(xiàn)了新的突破。

“AI復(fù)活”“AI伴侶”??隨著數(shù)字人越來越逼真、自然,大家對AI在情感陪伴層面的應(yīng)用需求也隨之變高。但欒青表示,技術(shù)如今還停留在視頻層面,如果要實現(xiàn)更及時的互動、生成更復(fù)雜的動作,還要翻過“精細化控制”的技術(shù)大山。

記者:項目制作過程中使用了哪些關(guān)鍵素材和技術(shù)?

欒青:聲音是我們第一重要的事情。湯老師東北口音,帶著一種冷幽默,包括他習(xí)慣使用語氣詞和輔助詞,都是他個人魅力的一部分。我們希望做到當聲音一出來,大家就感覺到湯老師回來了。

整個制作中,我們截取了湯老師四、五段不同說話風(fēng)格的聲音作為prompt(提示),每段3—5秒,有調(diào)侃式的,有深情款款的,總共加起來的聲音素材不過20秒。整體生成比較快,基本上放進去就能即時生成,但挑選素材花費了一些力氣和時間。

這得益于我們的大模型語音,也是我們2023年底最大的突破。我們在這方面一直在投入,只是之前的數(shù)據(jù)量沒有那么大,今年上半年我們將會推出更大的大模型語音。

視頻方面,我們采用了湯老師前年年會不到30分鐘的視頻。我們認為湯老師的笑是靈魂,為了表現(xiàn)的更自然,我們在以前的視頻里不斷學(xué)習(xí)有效參數(shù),再經(jīng)過反復(fù)調(diào)整最終才抓住了那個神韻。

視頻截圖

記者:技術(shù)之外,湯曉鷗有趣的靈魂和湯式幽默的內(nèi)容是怎么生成的?

欒青:不僅僅依靠大模型學(xué)習(xí)以前他講過的內(nèi)容,坦白說,像《熱辣滾燙》這樣的新內(nèi)容,則是憑借大家對湯老師多年的理解加入的感受性內(nèi)容。這個過程中,徐立、湯老師的助理及家人都給了如影很好的建議,最終才實現(xiàn)了湯式幽默。

我們要不斷地大模型交互迭代,不斷地告訴它你要什么,最終大模型才會給我們理想的結(jié)果。

另外,我們希望內(nèi)容能和公司的價值觀、寄語進行結(jié)合,因此,后面《吃面條》的小品,也和商湯的“一碗湯面”有關(guān)。

以電影、音樂、小品來講述引導(dǎo)理念和思想,這是湯老師一貫的演講方式。視頻中,用春晚最經(jīng)典的小品告訴大家只有經(jīng)典的東西才能夠跨越時間,在各方面噪聲非常多的情況下,更要沉下心來做事情。

記者:湯曉鷗的數(shù)字人,制作成本是多少?

欒青:我們不知道怎么去定價,單純從價格角度來說,數(shù)字人制作不是非常高;但從我們所有商湯人對湯老師的懷念角度來說,這是無價的。

素材的多少,決定能產(chǎn)出的內(nèi)容有多豐富,所以親人以前留下的一些視頻是最重要的。如果能有幾分鐘連續(xù)的視頻片段,不是晃來晃去的,這就給數(shù)字人制作提供了很大便捷。沒有連續(xù)的片段也可以生成視頻,只是復(fù)雜得多。

從技術(shù)本身來講,我們只要十幾秒、二十秒的素材就可以制作視頻,只不過大家會發(fā)現(xiàn)可選的、可編輯的、可過渡生成的動作內(nèi)容會少很多。

記者:商湯在這個過程中給予了如影哪些支持?如影未來的發(fā)展重點是什么?

欒青:商湯共享底層技術(shù),包括加速平臺、算法平臺、底層訓(xùn)練平臺等。商湯的每個垂直產(chǎn)業(yè)都要基于這些技術(shù)才能做好。如影業(yè)務(wù)團隊未來還是會持續(xù)關(guān)注人物類的視頻。

記者:過去也有AI伴侶這樣基于人類情感的應(yīng)用,隨著人類情感需求的增加,未來面向消費端的應(yīng)用會不會更多?

欒青:從使用場景來看,大家用得最多的還是視頻生成和直播,本質(zhì)上沒有更大的區(qū)別。確實有人看到之后,提出了復(fù)活自己家人、偶像的需求。

隨著數(shù)字人越來越逼真、自然,AI確實可以滿足更多情感陪伴層面的需求,但想要實現(xiàn)綜合大模型的對話互動,實時生成對應(yīng)的動作,現(xiàn)在的視頻生成技術(shù)還做不到。比如你能通過描述,控制數(shù)字人走過來,但沒辦法還原他撩頭發(fā)的小動作和小表情。

現(xiàn)在海內(nèi)外各類視頻生成軟件都沒達到精細化控制,只能表達概念,這對創(chuàng)作者來說也比較痛苦。這也是我們接下來想要努力攻堅的突破點。

商湯科技AI展廳 每經(jīng)記者 畢媛媛 攝

萬元左右“復(fù)活”親人,數(shù)字人的制作與使用理應(yīng)造福人類

湯曉鷗以數(shù)字人的形象出現(xiàn),是驚喜,是震撼。

“復(fù)活”想見之人不再遙不可及,當每個人都能承擔(dān)起數(shù)字人制作的費用后,思念之情是否會被利用,是如影當下最為關(guān)注的事情。

數(shù)字人的制作與使用理應(yīng)造福人類,而不是成為傷害與痛苦的源頭。

記者:湯曉鷗數(shù)字人視頻出來后,你們有沒有接到類似“復(fù)活”家人的訴求?

欒青:我們的客戶、個人都有一些找了過來,暫時都還在對接,沒辦法透露太多的細節(jié)。

商湯在如影數(shù)字人的方向,更多還是TO B (面向企業(yè))的服務(wù)。我們?nèi)ツ曜隽艘粋€“如影繁星”計劃,希望扶持各行各業(yè)的伙伴,包括金融、教育醫(yī)療、銀行保險等。至于你們問到的和殯葬館的合作,其實還要看上下游產(chǎn)業(yè)鏈的融合,我們究竟要去哪個行業(yè)其實并不關(guān)鍵,關(guān)鍵的是解決了大家什么樣的問題。

之前我們看到有經(jīng)紀公司做明星的復(fù)活數(shù)字人去陪伴粉絲,我們也在慢慢嘗試在關(guān)鍵節(jié)日,讓親人或者偶像的數(shù)字人生成祝福型的視頻。我們希望技術(shù)能夠賦能各行各業(yè)。

記者:未來有沒有可能,普通用戶也能用較低的成本,定制逝去親人的視頻?

欒青:普通人想做,肯定是做得起的。我們現(xiàn)在有比較廣泛的渠道,我看到新聞1萬元左右就能“復(fù)活”親人,大概就在這樣的范圍,甚至有些簡單的視頻價格可以更低。

我們已經(jīng)有完整的工具鏈可以讓大家制作數(shù)字人的祝福視頻,技術(shù)上已比較成熟。但是希望有互動、更深入的服務(wù),比如讓大模型學(xué)習(xí)到家人大腦的想法,還需要技術(shù)的不斷攻破。

記者:越來越多復(fù)活數(shù)字人的視頻出現(xiàn)后,大家對于技術(shù)倫理也有了擔(dān)憂和爭議,這方面商湯有什么樣的思考?

欒青:我們在前年推出數(shù)字人的時候,第一步是跟網(wǎng)信辦旗下的幾大所一起聯(lián)合推出“可信數(shù)字人”的標準。我們在制作數(shù)字人時,首先要有他的聲明,如果不是他的家人或者當事人授權(quán)的運營團隊同意,是不可以制作這個數(shù)字人的。

我們現(xiàn)在看到有些非法機構(gòu)制作數(shù)字人,其實用了非法的方式獲取資料。技術(shù)一旦被公開后,總有一些人想方設(shè)法去做一些非法的事情,我們技術(shù)公司對此無法控制,但是我們有一個鑒定機制,商湯平臺上制作的數(shù)字人,有看不見的編碼在里面,如果是非授權(quán)的數(shù)字人,我們可以立刻發(fā)現(xiàn)。

當前國內(nèi)幾大公司的數(shù)字人都在“可信數(shù)字人”標準內(nèi),所以大家不要輕信魚龍混雜的公司去制作自己的數(shù)字人,是比較危險的一件事。

另外,AI復(fù)活逝者,可以做到形象還原、聲音還原,但是情感怎么復(fù)制?會不會對家屬帶來二次創(chuàng)傷?數(shù)字永生后會不會對人的身份認同發(fā)生變化?大家的顧慮很多,我認為這是這么多年來逝者數(shù)字人沒有形成產(chǎn)業(yè)的重要原因。

大產(chǎn)業(yè)未來如何發(fā)展,我們也在觀望,對真人的復(fù)刻其實已經(jīng)進入深水區(qū)。

每經(jīng)記者 畢媛媛 攝

中國AI企業(yè)的發(fā)展,具有劃時代的使命感

進入2024年,AI競爭的牌局已然明朗,國內(nèi)早已跨越了單憑資金就能輕易購得大模型技術(shù)的階段,中小玩家因體力不支逐漸黯然離場。

理性背后,是實力尚存的慶幸,也有堅定前行的使命。大家都鼓起勇氣做好了長期投入的準備,決心留在這場沒有硝煙的戰(zhàn)爭中。

記者:數(shù)字人方面現(xiàn)在的市場競爭如何?

欒青:幾年前大家就在做傳統(tǒng)的數(shù)字人,市場競爭非常激烈,第一技術(shù)比較成熟,第二應(yīng)用場景明確。

不過,現(xiàn)在的競爭進入到深水區(qū)了,越來越多的人意識到數(shù)字人可以做什么,哪些做不了,現(xiàn)在我們更多需要考慮的是服務(wù),如何真正解決大家的問題。現(xiàn)在的視頻生成效果或者直播動作,會覺得很假,用著用著不想用了。我認為當下階段的關(guān)鍵在于,生成型大模型的自然度和真實感的進一步突破和跨越。

我個人是樂觀主義者。整個AI行業(yè)中,當然有樂觀派和悲觀派,但綜合來說大家還是認為AI能夠帶來生產(chǎn)力的改善,給人類帶來不同的體驗。我認為,在當前場景下,AI仍然是工具。雖然它可以生成有創(chuàng)意的內(nèi)容,但目前為止它更多的工作內(nèi)容是演繹和對現(xiàn)有內(nèi)容的總結(jié)。下一步會是什么,大家在不斷的迭代研發(fā)中,也保持審慎的態(tài)度。

記者:Sora爆火,你作為從業(yè)者,看到Sora后的第一反應(yīng)是什么?

欒青:真實度上了一個臺階。這個真實度的細節(jié),我們以及一些市場競品也能做到差不多,transformer的結(jié)構(gòu)來做這件事也不是Sora最早提出的,但確實大力出奇跡,它做到了更長的時長。

從實驗成本、實驗周期、算力復(fù)雜度來講,都需要巨大的投入,大家的突破肯定晚于Sora。現(xiàn)在我反而覺得大家都被拉到同一個起跑線上了,大家知道做這件事是可行的,那么中國企業(yè)一定會在很短時間內(nèi)做出類似的產(chǎn)品來。

Sora為大家?guī)頃r長的突破,那么真實性和物理一致性也要維持得更長??墒茿I真的理解物理規(guī)律嗎?我覺得沒有。

記者:接下來大模型的突破,你認為會是哪個方向?

欒青:視頻必然是今年的主題,但永恒不變的主題一定是大腦。我們不認為大模型真正形成了智能大腦,行業(yè)仍要再突破幾輪才行。

記者:你心中的完美AI是怎樣的,距離你心中的完美AI還有多遠?

欒青:我心中的完美AI視頻生產(chǎn)產(chǎn)品,是讓每個人都是自己的導(dǎo)演,它能更可控地做出非常多的視頻,比如張藝謀說完想法后,AI能直接生成一部電影。每個人都是導(dǎo)演,那每個人都可以做出心目中想要的東西。

目前大概只做到了30%,還是屬于很早期。想要AI生成復(fù)雜的場景,比如讓它做電視劇、電影還差得遠??偨Y(jié)來說,概念性的表達夠了,交互性的表達差很遠。假以時日,一定是可以實現(xiàn)的。

記者:大力發(fā)展AI,有何關(guān)鍵意義?哪些公司能活到最后?

欒青:對于中國的人工智能來說,如果我們不能在AI方面有足夠的積累和突破,可能就是其它國家先突破。大家有種使命感,希望在技術(shù)上不斷深入研究,做到領(lǐng)先世界。

AI領(lǐng)域還在投入的階段,哪怕Open AI,也還沒有太多商業(yè)化,我認為未來很多年都還要繼續(xù)投入。Open AI最大的價值是它驗證了“大力出奇跡”,大部分公司包括谷歌,可能都沒有勇氣做這件事。

早期投入很重要,現(xiàn)在國內(nèi)市場,不是財力就能買到大模型技術(shù)。做AI,要先知先覺有儲備,這個行業(yè)已經(jīng)不適合中小玩家,容易會被耗死,接下去慢慢有越來越多的公司會被淘汰。做大模型,關(guān)鍵是拼綜合實力,包括底層架構(gòu)、人才儲備等。

記者:現(xiàn)在有足夠的基礎(chǔ)設(shè)施儲備去支撐商湯繼續(xù)在AI領(lǐng)域做技術(shù)性的突破進展嗎?

欒青:商湯在2019年建設(shè)大裝置,算是比較幸運的一件事。目前我們擁有亞洲地區(qū)比較大的算力等基礎(chǔ)設(shè)施儲備。中國AI行業(yè)的發(fā)展,需要我們這種大模型公司,一起在上下游產(chǎn)業(yè)鏈迭代突破,這也是國內(nèi)眾多優(yōu)秀企業(yè)共同的愿望。

視頻截圖

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

數(shù)字人 大模型 商湯科技

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0