-
馬斯克搶先一步后,國產(chǎn)大模型紛紛發(fā)力十萬卡集群
-
張廣凱13764468101
國內(nèi)大模型企業(yè)的十萬卡時代,真的要來了嗎?
9月25日,百度發(fā)布了全面升級的百舸AI異構(gòu)計算平臺4.0,百度智能云事業(yè)群總裁沈抖直言,百舸4.0就是部署十萬卡大規(guī)模集群而設(shè)計的。
百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖觀察者網(wǎng)
而就在幾天前,阿里云宣布其靈駿單網(wǎng)絡(luò)集群已拓展至10萬卡級別。此前,騰訊也發(fā)布了支持十萬卡集群的星脈網(wǎng)絡(luò)2.0。
一度還停留在設(shè)想層面的十萬卡集群,突然成為輿論焦點是在9月初。馬斯克突然宣布在短短122天內(nèi)建成10萬張英偉達H100顯卡的Colossus集群,意味著其算力可能已經(jīng)超過OpenAI。
由顯卡規(guī)模撐起的算力水平,是決定大模型性能的最重要指標(biāo)之一。一般認為,1萬枚英偉達A100芯片,是做好AI大模型的算力門檻。
建一個萬卡集群,單是GPU的采購成本就高達幾十億,因此國內(nèi)能夠部署萬卡規(guī)模集群的,原本就只有阿里、百度等寥寥幾家大廠。而想要部署十萬卡集群,其“燒錢”程度可想而知。
除了資金成本,十萬卡集群同樣面臨巨大的技術(shù)挑戰(zhàn)。沈抖指出,GPU是一種很敏感的硬件,連一天之內(nèi)氣溫的波動,都會影響到GPU的故障率,而且規(guī)模越大,出故障的概率就越高?!癕eta訓(xùn)練llama3的時候,用了1.6萬張GPU卡的集群,平均每3小時就會出一次故障?!?
此外,區(qū)別于傳統(tǒng)CPU集群的串行特點,大模型訓(xùn)練過程需要全部顯卡同時參與并行計算,對網(wǎng)絡(luò)傳輸能力也提出了更大的挑戰(zhàn)。
相比于美國同行,中國大模型企業(yè)還面臨一重特殊的困難,無法像馬斯克那樣全部采用英偉達方案,而是需要使用包括國產(chǎn)GPU在內(nèi)的異構(gòu)芯片。這也意味著,即使同樣十萬張顯卡,國內(nèi)企業(yè)在算力規(guī)模上也很難同美國企業(yè)匹敵。
在上述三重挑戰(zhàn)之下,國內(nèi)大模型企業(yè)的進步速度也有目共睹。
據(jù)沈抖介紹,百舸4.0在萬卡集群上實現(xiàn)了有效訓(xùn)練時長占比99.5%以上,業(yè)界領(lǐng)先,并通過在集群設(shè)計、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列創(chuàng)新,大幅提升了集群的模型訓(xùn)練效率,整體性能相比業(yè)界平均水平提升高達30%。
而阿里云CTO周靖人此前也透露,目前阿里云的萬卡算力集群可以實現(xiàn)大于99%以上連續(xù)訓(xùn)練有效時長,模型算力利用率可提升20%以上。
但隨著性能提升,大模型成本問題只會越來越引人注目。單從能耗來看,沈抖透露,十萬卡集群每天就要消耗大約300萬千瓦時的電力,相當(dāng)于北京市東城區(qū)一天的居民用電量。
一位開發(fā)者向觀察者網(wǎng)直言,盡管在過去一年中大模型廠商的降價幅度確實可觀,但這更多是平臺補貼開發(fā)者的結(jié)果,并非根本解決之道。
對此,阿里云方面強調(diào),AI發(fā)展仍然處在一個非常早期的階段,必須要靠降價帶動應(yīng)用爆發(fā),而阿里云搞AI大基建,并不會只算眼前賬。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 大模型- 責(zé)任編輯: 張廣凱 
-
上海投入5億元發(fā)消費券!首批本周六申領(lǐng),涵蓋餐飲、住宿、電影等
2024-09-25 16:39 觀網(wǎng)財經(jīng)-消費 -
小米要求印度撤回反壟斷報告:包含商業(yè)機密
2024-09-25 15:33 觀網(wǎng)財經(jīng)-科創(chuàng) -
上證指數(shù)收復(fù)2900點
2024-09-25 13:15 觀網(wǎng)財經(jīng)-金融 -
三星18億美元投資越南,加工OLED面板模組
2024-09-25 12:06 觀網(wǎng)財經(jīng)-科創(chuàng) -
亞行預(yù)計亞太地區(qū)今年經(jīng)濟增長5%,中國4.8%
2024-09-25 11:33 觀網(wǎng)財經(jīng)-宏觀 -
OpenAI全面發(fā)布類人ChatGPT語音助手,支持中文等50多種語言
2024-09-25 11:29 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
在美中概股昨夜集體大漲,華爾街稱漲勢將持續(xù)
2024-09-25 11:20 觀網(wǎng)財經(jīng)-金融 -
讀懂央行新政:為居民減負才是精準(zhǔn)藥方
2024-09-25 08:52 觀網(wǎng)財經(jīng)-宏觀 -
離岸人民幣兌美元收復(fù)7.0關(guān)口
2024-09-25 08:15 觀網(wǎng)財經(jīng)-海外 -
金融資產(chǎn)投資公司股權(quán)投資試點范圍擴大至18個城市
2024-09-24 21:25 金融觀察 -
證監(jiān)會發(fā)布《關(guān)于深化上市公司并購重組市場改革的意見》
2024-09-24 20:30 政策風(fēng)向標(biāo) -
中國糧食75年增產(chǎn)5倍,海外友人:中國大米比日本和泰國米更好吃
2024-09-24 20:10 -
-
“純血鴻蒙”即將公測,鴻蒙PC可能也快來了
2024-09-24 18:22 觀網(wǎng)財經(jīng)-科創(chuàng) -
3年超越西方30年?
2024-09-24 17:35 觀察者頭條 -
商務(wù)部:對美國PVH集團啟動不可靠實體清單調(diào)查
2024-09-24 16:30 -
專家解讀:房價觸底、緩解提前償債壓力、刺激內(nèi)需、對沖通縮
2024-09-24 16:19 -
滬指創(chuàng)4年多最大單日漲幅,兩市成交額超9700億
2024-09-24 15:34 -
印度電信巨頭簽36億美元大單,提升4G覆蓋、引入5G
2024-09-24 14:22 觀網(wǎng)財經(jīng)-海外 -
大促免傭、店播免傭、解綁運費險!今年雙11淘寶商家獲“大紅包”!
2024-09-24 13:50 雙11節(jié)
相關(guān)推薦 -
-
“眾叛親離!要是再發(fā)生911,誰還同情美國人?” 評論 173她對美放狠話,還提到歐盟的“實力地位” 評論 266圍島集結(jié)、多向抵近!現(xiàn)場視頻來了 評論 177美國學(xué)者開始“流亡” 評論 152最新聞 Hot
-
“中國對美反制,巴西看到了機會”
-
共和黨人也不滿關(guān)稅,“長期來看,我們都會死”
-
韓網(wǎng)民強扯“中國間諜”喊美軍介入,駐韓美軍急了
-
美國航運巨頭發(fā)話:我們有很多中國船,這錢得美國人掏
-
馬斯克狂撒2500萬,這場“會改變西方文明進程”的選舉還是輸了
-
俄高官有望沖突后首次訪美,“美方暫時解除制裁”
-
美防長稱日本是“前線”,日媒急了
-
美國兩黨拿出對俄制裁草案:征500%二級關(guān)稅
-
“眾叛親離!要是再發(fā)生911,誰還同情美國人?”
-
特朗普明天將在白宮開會,討論TikTok命運
-
“白宮正研究:丹麥給格陵蘭6億,我們加價”
-
美國司法部要求判他死刑:讓美國再次安全
-
她對美放狠話,還提到歐盟的“實力地位”
-
“歐美關(guān)系搞砸了,歐盟準(zhǔn)備以自己的方式應(yīng)對中國 ”
-
周一鳴接棒港警“一哥”
-
他演講超25小時,狂噴特朗普馬斯克
-