2023-06-21 13:06:12
每經(jīng)AI快訊,據(jù)騰訊官微,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,在大模型的訓練和使用過程中,需要大量異構(gòu)算力的支持,對網(wǎng)絡速度與穩(wěn)定性要求也很高,加上GPU服務器比一般服務器穩(wěn)定性更低一些,服務器的運維、問題的排查更頻繁,整體運維的難度與工作量會高很多。在訓練集群中,一旦網(wǎng)絡有波動,訓練的速度就會受到很大的影響;只要一臺服務器過熱宕機,整個集群都可能要停下來,然后訓練任務要重啟,這些問題會使得訓練時間大大增加,投入在大模型的成本也會飆升。(每日經(jīng)濟新聞)
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP