-
潘攻愚:從四個角度全面駁斥美方對DeepSeek的質(zhì)疑和污蔑
【文/觀察者網(wǎng)專欄作者 潘攻愚】
DeepSeek“小扣發(fā)大鳴”,半年多的時間,不但從LLM通用模型的V2迭代到了V3,而且進一步推出了主打推理能力的R1模型。從訓(xùn)練成本、架構(gòu)調(diào)整和開源模式等多個維度技驚全球,引發(fā)了一股山呼海嘯般的贊譽。春節(jié)期間大洋彼岸資本市場的大幅震蕩以及開年后國內(nèi)“DeepSeek概念股”的大漲,讓這一現(xiàn)象持續(xù)成為坊間熱議的焦點。
DeepSeek的成功,順應(yīng)了pre-training到推理的AI大模型的必然演化過程。DeepSeek的崛起為何是順天應(yīng)時之舉?不妨先來看兩段話。
去年2月下旬,英偉達CEO黃仁勛接受美國科技媒體Wired采訪時說:“英偉達今天的業(yè)務(wù)可能是40%的推理和60%的訓(xùn)練,這是一件好事,因為這讓你意識到AI終于成功了。如果英偉達的業(yè)務(wù)是90%的訓(xùn)練和10%的推理,你可以說AI仍處于早期研究階段。”
去年12月,OpenAI的CFO Sarah Friar在接受科技媒體《信息》(The Information)采訪時說:“OpenAI的ChatGPT Pro開放給C端用戶的套餐每月200美元,實在是太便宜了,它合理的價格應(yīng)該是每月2000美元?!边M一步結(jié)合她上下文采訪的言外之意,她主要是說OpenAI“心善”,秉承一股AI為大眾平權(quán)服務(wù)的道義感,才沒把價格搞得那么高。今天,他們這種偽善的畫皮在DeepSeek R1開源模型面前徹底被撕下。
這兩段話相當(dāng)有代表性,一個指向AI技術(shù)應(yīng)用的演進方向,一個則事關(guān)AI推訓(xùn)模式落地的商業(yè)化問題,這兩個層面的問題相互纏繞,互為表里。
就在OpenAI牽頭搞“星際之門”,將算力的Scale Law延伸到了民間資本市場和國家投資領(lǐng)域,試圖把AI產(chǎn)業(yè)和美國國運綁定之時,DeepSeek對其做了一個釜底抽薪式的敘事消解。
眾聲喧嘩之下,來自大洋彼岸的質(zhì)疑,甚至是帶有惡意性質(zhì)的詆毀同樣值得關(guān)注。
分析美國AI大模型行業(yè)某些頭面人物帶有驚慌失措心理的評論,可以進一步深化我們對DeepSeek到底真正打到了對方哪些痛處的認知。大洋彼岸的詳細分析數(shù)據(jù)和質(zhì)疑聲音,以知名半導(dǎo)體咨詢機構(gòu)Semianalysis總裁Dylan Patel和Anthropic的CEO Dario Amodei為代表性,這兩家的文章在中文互聯(lián)網(wǎng)世界被翻譯后大量轉(zhuǎn)載。
Anthropic的CEO Dario Amodei
他們主要從GPU囤貨、成本測算、非技術(shù)性營銷、以及模型數(shù)據(jù)蒸餾不合規(guī)等四個角度,試圖告訴公眾DeepSeek的突破其實沒那么“硬核”。
一、搖唇鼓舌DeepSeek囤貨“敏感性”高端GPU
按照Semianaylsis的測算,“DeepSeek大致?lián)碛?0000張H800 GPU芯片、10000張H100 GPU芯片,以及大量H20 GPU芯片”。
Dario Amodei在長文中轉(zhuǎn)述了Semianaylsis的測算,認為DeepSeek手上擁有的用于訓(xùn)練和推理的Hopper架構(gòu)的英偉達GPU卡(閹割版和非閹割版都算在內(nèi))差不多有5萬張,這個量和美國主要頭部的AI模型訓(xùn)練機構(gòu)如OpenAI、Deepmind等差距在兩三倍左右,結(jié)合基于合成數(shù)據(jù)(synthetic data generation)和強化學(xué)習(xí)進行推理能力提升的后訓(xùn)練(post-training)方法,他認為DeepSeek本來就站在巨人的肩膀上,又用了巨量的GPU,才有了今天的成果。
為什么Dario Amodei要用Semianaylsis的數(shù)據(jù)給自己拉大旗扯虎皮呢?
因為Dario Amodei心中有一個所謂的AI訓(xùn)練成本的“摩爾定律法”——每一年大約能降三到四倍,如果用強化學(xué)習(xí)的方法進行推理架構(gòu)調(diào)整,可以把成本降到六至八倍,但這個就是降成本的極限了。按照這種成本測算假說推斷,DeepSeek有五萬張Hopper卡。
那么,如果我們進一步追問,Semianaylsis認為DeepSeek手上有這么多高端GPU卡,他們是怎么算出來的?他們采用了一種類似歸謬法的推理:Anthropic單單訓(xùn)練一個Claude 3.5 Sonnet的成本就高達數(shù)千萬美元,如果DeepSeek有如此神之一手能強力降本,Anthropic何必煞費苦心去找亞馬遜融資數(shù)億呢?
有關(guān)Anthropic到底是怎么花費投資人的錢的問題,也許馬斯克手下的DOGE(政府效率部)更有興趣回答。相比微軟、谷歌一派,代表云服務(wù)商亞馬遜一派的Anthropic CEO按耐不住跳出來寫長文的主要原因之一,是深刻覺察到在十萬到百萬級GPU基礎(chǔ)上的生態(tài)進行推訓(xùn),他們的Claude系列總價格是最高的,總性價比也是最低的。
DeepSeek合法擁有的H800,相比H100,主要是閹割了NVLink的通信帶寬;H20雖然也是閹割版,單卡算力僅有H100的20%,但H20可以通過多卡堆疊模式,其HBM容量(96GB)甚至高于A100/H100(80GB)。換言之,H20的顯存帶寬可以讓DeepSeek的Decode階段每生成1個Token所需時間低于A100和H100。
DeepSeek把閹割版用出了禁運版所沒有的功效,讓Dario Amodei居然發(fā)出了應(yīng)該對中國大陸進一步加強GPU管制的惡意言論,這也許才是他抨擊DeepSeek的目的。
從話語體系上講,Semianalysis用Anthropic缺乏公允性的AI模型訓(xùn)練成本反推DeepSeek有可能繞開管制,非法持有高端GPU,而Anthropic反過來用Semianalysis建立在沙堆之上的推論來論述DeepSeek在成本問題上并無過人之處,這其實是一個合謀式的循環(huán)論證。
- 原標(biāo)題:從四個角度全面駁斥美方對DeepSeek的質(zhì)疑和污蔑 本文僅代表作者個人觀點。
- 責(zé)任編輯: 李昊 
-
我國成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)低軌衛(wèi)星
2025-02-11 19:20 航空航天 -
蹭熱度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
中國半導(dǎo)體產(chǎn)業(yè)要長遠發(fā)展,這個問題必須解決好
2025-02-10 13:57 心智觀察所 -
“中國物理學(xué)研究領(lǐng)先世界,美國機構(gòu)被擠出前十”
2025-02-09 09:14 科技前沿 -
撬開日本海關(guān)的口:日本半導(dǎo)體設(shè)備對華依賴度有多高?
2025-02-06 08:06 心智觀察所 -
中國平臺,集中上線
2025-02-04 21:12 -
“人造太陽”再創(chuàng)紀錄,是中國式科研方法論又一次勝利
2025-02-04 13:05 心智觀察所 -
“大洋一號”功勛船舶將升級改造
2025-02-02 15:35 -
“霸榜全球140個市場”,拉新最多的是…
2025-02-01 22:06 觀察者頭條 -
突破70多年來的傳統(tǒng)認知!他們發(fā)現(xiàn)距地球16萬公里的“太空合聲”
2025-02-01 16:53 天文 -
中國光子毫米波雷達技術(shù)取得突破性進展
2025-01-31 22:54 科技前沿 -
果然,臺當(dāng)局又跳了出來
2025-01-31 22:01 臺灣 -
英偉達平臺上線DeepSeek
2025-01-31 18:18 -
阿斯麥CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科學(xué)家又發(fā)現(xiàn)“超級地球”
2025-01-29 19:03 -
DeepSeek超越ChatGPT,登頂美國區(qū)免費APP榜單
2025-01-27 09:02 觀網(wǎng)財經(jīng)-科創(chuàng) -
理解DeepSeek的中國式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線起源之謎再添“觀天”利器
2025-01-21 20:09 天文 -
最大載重1.9噸,國產(chǎn)大型無人機首次實現(xiàn)量產(chǎn)交付
2025-01-20 22:12 中國精造 -
我國成功發(fā)射云遙一號37~40星等5顆衛(wèi)星
2025-01-20 21:59 航空航天
相關(guān)推薦 -
全國政協(xié)十四屆三次會議閉幕 評論 0最新聞 Hot
-
“國際刑警組織對杜特爾特發(fā)紅色通緝令”
-
特朗普被潑冷水:美國造船能力不及中國1/200
-
“五眼聯(lián)盟”要變“四眼”?
-
“難道要去白宮排隊給惡霸拍馬屁?這只會更受欺凌”
-
歐洲多國驚覺:被美國掌握一個“致命開關(guān)”
-
對歐洲“感到憤怒”,“特朗普想把駐德美軍全撤走”
-
萬斯:親烏抗議者當(dāng)街騷擾,嚇到3歲女兒
-
紐約發(fā)生多起山火,紐約州進入緊急狀態(tài)
-
特朗普威脅“不談就打”,伊朗最高領(lǐng)袖表態(tài)
-
“烏克蘭半瞎了,歐洲急了”
-
尹錫悅獲釋第二天,首爾10萬民眾集會游行
-
美媒哀嘆:所謂的“西方”,已蕩然無存
-
“1500億歐元貸款計劃,法德又吵起來了”
-
“看看中國高鐵再看美鐵,尬死了”
-
特朗普怒砍哥大4億美元:打擊“反猶”不給力啊
-
“特朗普想重新劃定美加邊界”
-