每日經(jīng)濟(jì)新聞 2021-07-13 15:01:37
◎脈沖星是宇宙中較為暗淡的星體,肉眼不可見(jiàn),信號(hào)暗弱,且容易被人造電磁波干擾。之前,天文學(xué)家們每天需要從FAST拍攝的海量信號(hào)圖中,肉眼識(shí)別出脈沖星。
◎而借助AI+云計(jì)算的技術(shù)能力,3天就可以處理完原來(lái)需要人工用1年才能完成的數(shù)據(jù)工作量,照此計(jì)算,AI的數(shù)據(jù)處理效率比人工提升了120倍。
◎AI在天文領(lǐng)域的應(yīng)用的確是基礎(chǔ),有了AI的能力,脈沖星數(shù)據(jù)預(yù)處理和信號(hào)的發(fā)現(xiàn)效率會(huì)越來(lái)越高,準(zhǔn)確率也會(huì)不斷提高。
每經(jīng)記者 劉玲 每經(jīng)編輯 文多
3月27日,工作人員在“中國(guó)天眼”總控室內(nèi)。圖片來(lái)源:新華社
7月10日,2021世界人工智能大會(huì)(WAIC)在上海落下帷幕。在經(jīng)歷過(guò)三次潮起潮落后,人工智能已然褪去了神秘的外衣,這屆大會(huì)似乎也更加“務(wù)實(shí)”了。正如華為輪值董事長(zhǎng)胡厚崑逛完展覽后的最大感受:“酷炫”的技術(shù)少了,實(shí)際落地的AI應(yīng)用多了。
比如在開幕式上,李彥宏分享了AI在共享無(wú)人車、智慧助老領(lǐng)域的落地——計(jì)劃未來(lái)2~3年將共享無(wú)人車服務(wù)推廣到30個(gè)城市,同時(shí)會(huì)推出“更像機(jī)器人“的汽車;又如董明珠提到的AI對(duì)制造業(yè)帶來(lái)的顛覆性革命,可幫助打造“黑燈工廠”等等。
而騰訊則把AI的目光放到了137億光年外,與國(guó)家天文臺(tái)聯(lián)合啟動(dòng)“探星計(jì)劃”,幫助中國(guó)天眼FAST尋找脈沖星。AI行業(yè)人士表示,經(jīng)過(guò)多年的發(fā)展,AI技術(shù)的服務(wù)邊界不斷在拓寬,已從“腳踏實(shí)地”發(fā)展到“仰望星空”,越來(lái)越多行業(yè)將被重新定義。
大會(huì)結(jié)束后,《每日經(jīng)濟(jì)新聞》記者采訪了中國(guó)科學(xué)院國(guó)家天文臺(tái)研究員、FAST首席科學(xué)家李菂,騰訊云副總裁、騰訊優(yōu)圖實(shí)驗(yàn)室總經(jīng)理吳運(yùn)聲,騰訊優(yōu)圖實(shí)驗(yàn)室副總經(jīng)理黃飛躍,深入探討了AI在天文探索中的應(yīng)用和難題,以及如何拓寬AI服務(wù)邊界。
FAST的全稱為“500米口徑球面射電望遠(yuǎn)鏡”(Five-hundred-meter Aperture Spherical radio Telescope),是世界上最大的射電天文望遠(yuǎn)鏡,也是中國(guó)有史以來(lái)最大的天文工程,工程的核心目標(biāo)在于搜尋與發(fā)現(xiàn)射電脈沖星。
據(jù)了解,脈沖星會(huì)周期性發(fā)射電磁波,被稱作宇宙中的燈塔,是研究宇宙演化的理想天體。然而如何發(fā)現(xiàn)和確定脈沖星的存在,一直是天文領(lǐng)域難度較高的研究:脈沖星是宇宙中較為暗淡的星體,肉眼不可見(jiàn),信號(hào)暗弱,且容易被人造電磁波干擾。
圖片來(lái)源:騰訊提供
上圖是“中國(guó)天眼”FAST捕捉到的一張“脈沖星”信號(hào)圖,普通人很難從信號(hào)圖中看到星星的痕跡。李菂告訴《每日經(jīng)濟(jì)新聞》記者,天文學(xué)家們每天需要從FAST拍攝的海量信號(hào)圖中,肉眼識(shí)別出脈沖星。
肉眼識(shí)別的工作量有多大呢?吳運(yùn)聲表示,F(xiàn)AST每天將會(huì)產(chǎn)生500TB的數(shù)據(jù),它在一周內(nèi)產(chǎn)生的脈沖星觀測(cè)數(shù)據(jù),大約是3000多萬(wàn)張信號(hào)圖,如果完全由人工肉眼處理,即使不吃不喝,1秒一張審核,也需要一年時(shí)間才能才能處理完。
“數(shù)據(jù)是對(duì)電磁場(chǎng)的高速采量,在這上面做信號(hào)處理和頻譜分析,得到一個(gè)視頻動(dòng)態(tài)譜。一個(gè)維度是時(shí)間,一秒鐘700轉(zhuǎn),有1萬(wàn)個(gè)點(diǎn);另一個(gè)維度是頻率,1秒鐘1萬(wàn)譜。”李菂說(shuō)道,“人眼是沒(méi)辦法處理的,因?yàn)樘炝?,(所以)我們處理的大多?shù)情況是照片,把它截出來(lái)。但截出來(lái)以后可能量還是太大了,所以要做進(jìn)一步地信息提取。”
如此巨大的數(shù)據(jù)量困擾著天文學(xué)家們。在距離FSAT一千多公里的深圳,騰訊優(yōu)圖實(shí)驗(yàn)室的研究員們也在進(jìn)行頭腦風(fēng)暴,試圖尋找更多AI落地的場(chǎng)景。
黃飛躍向記者回憶道,今年初,騰訊優(yōu)圖實(shí)驗(yàn)室的幾位天文愛(ài)好者提出,可以將計(jì)算機(jī)視覺(jué)技術(shù)用于天文學(xué)中對(duì)脈沖星的搜索。于是,騰訊優(yōu)圖實(shí)驗(yàn)室便聯(lián)系了國(guó)家天文臺(tái),雙方一拍即合,達(dá)成了合作意向。
“我們是一個(gè)很小的行業(yè),雖然目前也有運(yùn)用機(jī)器學(xué)習(xí)和人工智能技術(shù),但我們?nèi)狈σ痪€的,在底層做開發(fā)的能力,這就是為什么我們?cè)敢飧袑I(yè)背景和架構(gòu)的單位合作,這種合作產(chǎn)生的效益也比較快。”李菂表示。
據(jù)吳運(yùn)聲透露,借助AI+云計(jì)算的技術(shù)能力,3天就可以處理完原來(lái)需要人工用1年才能完成的數(shù)據(jù)工作量,照此計(jì)算,AI的數(shù)據(jù)處理效率比人工提升了120倍。黃飛躍表示,AI在天文領(lǐng)域的應(yīng)用的確是基礎(chǔ),有了AI的能力,脈沖星數(shù)據(jù)預(yù)處理和信號(hào)的發(fā)現(xiàn)效率會(huì)越來(lái)越高,準(zhǔn)確率也會(huì)不斷提高。
3月29日,晚霞中的“中國(guó)天眼”全景。圖片來(lái)源:新華社
雖然AI的加入,讓脈沖星的探索效率大幅提升。但是黃飛躍告訴《每日經(jīng)濟(jì)新聞》記者,利用人工智能探星并沒(méi)有那么容易,還有幾大難點(diǎn)需要克服。
首先,AI需要進(jìn)行深度學(xué)習(xí)訓(xùn)練,其核心需求便是:擁有海量已標(biāo)注的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),用它們來(lái)調(diào)整優(yōu)化算法模型。但天文研究里,帶有標(biāo)注的訓(xùn)練數(shù)據(jù)相對(duì)偏少,會(huì)給模型訓(xùn)練帶來(lái)困難。
其次,同樣的天體信號(hào),用不同望遠(yuǎn)鏡、不同的觀測(cè)設(shè)備,得到的數(shù)據(jù)和展現(xiàn)形式并不相同。“缺少標(biāo)注的數(shù)據(jù),我們可以用自監(jiān)督的學(xué)習(xí)方法。不同設(shè)備得到的數(shù)據(jù),我們可以用跨域?qū)W習(xí)的方式來(lái)訓(xùn)練模型。”黃飛躍表示。
雙方合作后,騰訊優(yōu)圖實(shí)驗(yàn)室第一步便是對(duì)FAST采集的數(shù)據(jù)進(jìn)行預(yù)處理。黃飛躍介紹,F(xiàn)AST一天采集到的數(shù)據(jù)大約有500T,如何將這500T數(shù)據(jù)轉(zhuǎn)換成更有效的數(shù)據(jù)呢?實(shí)際上就是要做一系列的原始信號(hào)處理,處理后就能夠大幅加速篩選的效率。
“另外,對(duì)信號(hào)我們會(huì)用機(jī)器學(xué)習(xí)的方式來(lái)尋找疑似樣本,再交給專業(yè)的人員看是不是真正發(fā)現(xiàn)了信號(hào)。后續(xù)我們的新算法將會(huì)進(jìn)一步提高準(zhǔn)確率,降低后期專業(yè)人士的人為篩選的工作量。”黃飛躍表示。
據(jù)了解,除了脈沖星,騰訊還將通過(guò)AI重點(diǎn)輔助搜索輻射模式更特殊、天體運(yùn)動(dòng)更復(fù)雜的天文現(xiàn)象,例如“近密雙脈沖星”和“快速射電暴”等。其中,“近密雙脈沖星”是特殊的天體系統(tǒng),由于其復(fù)雜的運(yùn)動(dòng)模式很難被現(xiàn)有算法發(fā)現(xiàn)。
探索難度大、AI投入高,騰訊與國(guó)家天文臺(tái)“探星計(jì)劃”能不能實(shí)現(xiàn)商業(yè)化呢?對(duì)此,吳運(yùn)聲坦言,此次合作并沒(méi)有考慮收益點(diǎn),“不管是優(yōu)圖還是騰訊,我們不是每件事情都要考慮它的經(jīng)濟(jì)價(jià)值,從之前的AI尋人到這次的探星計(jì)劃,跟實(shí)際的經(jīng)濟(jì)收入都沒(méi)有什么關(guān)系,都是促進(jìn)社會(huì)的可持續(xù)發(fā)展”。
應(yīng)用于智能美育的作畫機(jī)器人 圖片來(lái)源:每經(jīng)記者 夏冰 攝
過(guò)去幾年間,在技術(shù)進(jìn)步和規(guī)?;瘧?yīng)用的推動(dòng)下,AI芯片算力成本不斷下降:TOPS(每秒可進(jìn)行一萬(wàn)億次運(yùn)算)的成本從千元降到了幾百元。而進(jìn)入2020年,AI芯片算力成本更是步入100元級(jí)。
在AI芯片算力成本降低的同時(shí),算法的效率卻大幅提升。在應(yīng)用層面上,龍頭企業(yè)在近幾年商業(yè)落地的過(guò)程中,不斷積累了大量的行業(yè)know-how,也大大開拓了AI的智能化應(yīng)用場(chǎng)景和邊界。
在2021世界人工智能大會(huì)現(xiàn)場(chǎng),可以看到坐擁130000詞條的“云上辭海”、可以體驗(yàn)探知AIWIN賽事前世今生的AR眼鏡、也可以觀摩技藝嫻熟的調(diào)酒機(jī)器人,人工智能的應(yīng)用場(chǎng)景已經(jīng)滲透到我們生活的方方面面。
正如李彥宏在演講中提到,人工智能將會(huì)是影響未來(lái)40年人類發(fā)展的變革力量。這個(gè)力量今天正在不斷地積蓄,在交通、金融、工業(yè)、能源、媒體等各行各業(yè),人工智能技術(shù)的應(yīng)用,都給出了行業(yè)數(shù)字化升級(jí)的新思路和新解法。甚至,它已經(jīng)開始重塑整個(gè)行業(yè)的面貌,進(jìn)而影響人類社會(huì)的未來(lái)。
不管是百度推出的新一代共享無(wú)人車Apollo moon,還是格力的“黑燈工廠”,抑或是騰訊與國(guó)家天文臺(tái)的“探星計(jì)劃”,實(shí)質(zhì)上都是在不斷拓寬AI的服務(wù)邊界。
胡厚崑也在演講中提出,“大膽運(yùn)用技術(shù)手段去突破當(dāng)前AI普惠的瓶頸”。不過(guò),在他看來(lái),當(dāng)前的瓶頸不是在技術(shù)和應(yīng)用的需求上,而是在開發(fā)的效率上,“現(xiàn)在AI開發(fā)的效率太低,嚴(yán)重阻礙了技術(shù)和需求的結(jié)合,現(xiàn)在的模式還是比較傳統(tǒng)的手工作坊的模式”。
對(duì)此,吳運(yùn)聲稱,AI落地的前提是要深入行業(yè)。不同的行業(yè)信息化程度不同,因此解決方案也需要調(diào)整。例如,金融客戶的信息化水平較高,無(wú)需提供完全的解決方案,而一些傳統(tǒng)的工業(yè)企業(yè)由于信息化能力較弱,則需要直接解決問(wèn)題的方案。“各個(gè)行業(yè)的階段不太一樣。我們要在不同行業(yè)洞察其適用AI的特點(diǎn)。”吳運(yùn)聲說(shuō)道。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP