-
正對著DeepSeek狂抄?Meta被曝整個AI部門深陷恐慌
-
連政guanchazhewanxgun
最后更新: 2025-01-24 16:07:15中國人工智能公司深度求索(DeepSeek)在大模型上取得的成功,目前已經(jīng)深深撼動了硅谷同行們的信心。
1月23日,在美國匿名職場論壇TeamBlind上,一名Meta公司員工發(fā)布涉深度求索的帖子“Meta生成式人工智能部門陷入恐慌”,引起廣泛討論。該員工在文中稱,從深度求索發(fā)布DeepSeek-V3開始,就已經(jīng)讓Meta的Llama 4在各項測試中處于落后,“更糟糕的是,這家不知名中國公司僅為此花費了550萬美元?!?
550萬美元是什么概念呢?“Meta生成式AI部門里的每位‘領(lǐng)導(dǎo)’的薪資都超過了這個數(shù)字”,該Meta員工稱,“而我們卻有幾十位這樣的領(lǐng)導(dǎo),我根本無法想象該如何向公司高層證明部門目前高額成本的合理性?!?
該員工透露,目前Meta的工程師們正在瘋狂研究分析DeepSeek的成功,并試圖從中復(fù)制任何能復(fù)制到的東西,這不是夸張?!叭欢?,當(dāng)DeepSeek-R1發(fā)布時,事情變得更加可怕了”,該員工表示雖然不能透露太具體,但有些事情很快將會公開。
1月20日,深度求索發(fā)布DeepSeek-R1開源大模型,對標(biāo)OpenAI o1正式版。南華早報
最后,該員工反思稱,Meta的生成式AI部門本應(yīng)該是一個以工程為重點的小型組織,但因為很多人都想進來分一杯羹,人為膨脹了組織的規(guī)模,到最后人人都是輸家。
目前不清楚該員工所指具體為何,是否暗示該公司生成式AI部門面臨的調(diào)整或者其他情況的可能性,這還需要進一步觀察,不過Meta在大模型中競爭中腳步放緩已是事實。
公開信息顯示,帖子中提及的DeepSeek-V3于去年12月26日對外發(fā)布,該模型一經(jīng)發(fā)布就站上了開源模型No.1的位置。根據(jù)當(dāng)時深度求索公布的技術(shù)報告數(shù)據(jù),Meta公司的Llama 3.1-405B僅在大規(guī)模多任務(wù)理解數(shù)據(jù)集MMLU-Pro一項,接近DeepSeek-V3水平,其余多項幾乎都不及八成,甚至在算法類代碼場景和工程類代碼場景下,Llama 3.1-405B只有DeepSeek-V3的一半水平。
而4天前(1月20日),深度求索對外正式發(fā)布DeepSeek-R1,官方技術(shù)報告的測試所對照模型中,僅有OpenAI公司閉源的OpenAI o1 模型,以及DeepSeek-v3等自家模型。而在上一輪DeepSeek-V3測試中所對照的Meta、Anthropic等公司模型,此時早已不見蹤影。
最重要的是,DeepSeek-R1以及深度求索同期提及的DeepSeek-R1-Zero模型,首次讓整個行業(yè)清楚看到,大模型如何僅靠大規(guī)模強化學(xué)習(xí)(RL)驅(qū)動、在沒有人類標(biāo)注數(shù)據(jù)冷啟動(SFT)的情況下,實現(xiàn)持續(xù)自我成長。簡單說,DeepSeek-R1的意義就相當(dāng)于讓谷歌的圍棋軟件AlphaGo(阿法狗)從零開始自己與自己下棋,并通過試錯自學(xué)達成如今的水平,但期間卻不向AlphaGo提供任何人類大師的下棋思路信息。
而在成本方面,深度求索雖然未透露DeepSeek-R1 的訓(xùn)練花費,但DeepSeek-v3的總訓(xùn)練時長則為278.8萬GPU小時(其中預(yù)訓(xùn)練占266.4萬小時),使用2048塊英偉達H800 GPU,耗時約兩個月完成。與之相比,同樣開源的Llama 3.1-405B卻消耗了3080萬GPU小時,成本是DeepSeek-V3的11倍。甚至OpenAI公司的 GPT-4o的模型訓(xùn)練成本也達到1億美元,這與DeepSeek-V3訓(xùn)練花費的557萬美元相差巨大,也讓“花小錢辦大事”成為深度求索的重要標(biāo)簽。
對此,在該Meta員工的帖子下邊有一名三星員工評論稱,特朗普日前宣布的“星球之門計劃”預(yù)計投入總規(guī)模達到5000億美元,“但如果當(dāng)這些AI基礎(chǔ)設(shè)施僅能與深度求索極小的成本相匹配時,投資人還能有多少耐心?這個5000億美元的計劃還沒開始就將夭折?!?
而谷歌公司的一名員工也評論稱,深度求索很瘋狂,不僅僅是Meta,面對這家中國公司時,OpenAI以及谷歌/Anthropic目前同樣是“火燒屁股”。
不過這名谷歌員工也承認,對于行業(yè)來說是一件好事,“我們可以實時看到公開競爭對創(chuàng)新的推動作用”。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
多只場內(nèi)貨幣基金午后突然暴漲,離岸人民幣漲400點
2025-01-24 15:07 金融觀察 -
日本央行加息25個基點,18年來最大幅度加息
2025-01-24 14:28 金融觀察 -
用友去年預(yù)虧超17億,離職補償金同比增加1.4億
2025-01-23 22:05 觀網(wǎng)財經(jīng)-科創(chuàng) -
HBM芯片賣爆,韓國存儲巨頭營業(yè)利潤激增超20倍
2025-01-23 21:53 觀網(wǎng)財經(jīng)-科創(chuàng) -
三星首發(fā)安卓XR對標(biāo)蘋果,劇透三折疊和AI眼鏡
2025-01-23 17:49 觀網(wǎng)財經(jīng)-科創(chuàng) -
4G主力芯片打入vivo小米,紫光展銳今年能扭虧嗎?
2025-01-23 17:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
基金季報揭示神秘資金力挺A股:耗資千億增持,至今一股未賣
2025-01-23 16:43 觀網(wǎng)財經(jīng)-金融 -
國產(chǎn)“足球巨星”機器人來了
2025-01-23 16:27 人工智能 -
一箭18星!長六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財經(jīng)-科創(chuàng) -
對話|應(yīng)對卡脖子,開源是中國大模型安全的最優(yōu)解?
2025-01-23 15:30 -
字節(jié)啟動AGI長期研究計劃,代號Seed Edge
2025-01-23 11:34 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
1月136款游戲獲批,王者榮耀衍生作品拿下版號
2025-01-23 11:15 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強,高處不勝寒
2025-01-23 11:04 觀網(wǎng)財經(jīng)-消費 -
B站上線“小店”業(yè)務(wù),謀求商業(yè)化新機會
2025-01-23 10:01 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
吳清:力爭大型國有險企,每年新增保費的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
上線小程序,廣告反內(nèi)卷,?B站找到了商業(yè)化新藍海
2025-01-22 16:50 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
出售與輝同行后東方甄選虧近億元,新東方股價暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價搶票是忽悠,購票平臺為何還在賣“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年營收超500億
2025-01-22 15:12 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
最新聞 Hot
-
“中國正投入萬億美元,我們卻在這胡搞”
-
真急了!“白宮擬成立涉華關(guān)稅應(yīng)急工作組”
-
黃仁勛訪華盼繼續(xù)合作,特朗普回應(yīng)
-
中國男子在TikTok“神評”美國關(guān)稅,米爾斯海默秒答:贊同
-
“內(nèi)地電影票房過億那一刻,香港電影就被顛覆了”
-
美國稅局代理局長剛上任三天就被免,“貝森特抱怨他是馬斯克的人”
-
特朗普也直說了:不行,就放棄
-
“中國深知‘廣場協(xié)議’是致命的,特朗普別想了”
-
“中國稀土,關(guān)乎美國人生死”
-
美軍高官著急:中國速度太快了,是美國3倍
-
德銀:中國客戶減持美債,轉(zhuǎn)頭買歐洲資產(chǎn)
-
美國對中國再下黑手,“黃仁勛道出最大擔(dān)憂…”
-
跟特朗普談,拿中國當(dāng)籌碼?英財相:蠢死了
-
加總理揚言:除了中美,還有其他人
-
美方將不再斡旋?梅德韋杰夫喊話歐盟:學(xué)著點
-
特朗普“先眨眼”:很多人催我,期待和中國談成
-