-
獨家對話|戴蘭·帕特爾:誰真正低估了Deepseek?
DeepSeek如何以顛覆性訓練策略重構(gòu)大型參數(shù)模型的成本公式?
1月底,美國知名半導體咨詢機構(gòu)SemiAnalysis發(fā)布的一篇主題圍繞“給Deepseek算經(jīng)濟賬”的文章,一時間成為全球爆款。近日,心智觀察所就全球LLM模型競爭生態(tài),如何穿透算力軍備競賽的表象,剖析大模型博弈中數(shù)據(jù)、算法、資本的三重角力等問題連線了SemiAnalysis。本次對話由心智觀察所與SemiAnalysis總裁Dylan Patel,資深分析師AJ Kourabi和David Wolfson共同完成。
心智觀察所:SemiAnalysis早在去年五月就發(fā)現(xiàn)了DeepSeek在MoE、RoPE、Attention等領(lǐng)域的創(chuàng)新貢獻,你們是如何敏銳地捕捉到DeepSeek為AI模型帶來的突破性?當時行業(yè)是否低估了DeepSeek從V2到V3迭代的能力?
SemiAnalysis:我們一直密切關(guān)注AI領(lǐng)域的創(chuàng)新和進展,對DeepSeek取得的進步印象深刻。絕大多數(shù)領(lǐng)先的AI實驗室并沒有忽視DeepSeek——Anthropic的CEO公開表示,他們從V2甚至更早的時候就開始跟蹤DeepSeek的發(fā)展。我們認為,大多數(shù)實驗室都預(yù)計到了從V2到V3會有這種程度的改進,除了Meta。
早在2024年5月,SemiAnalysis就發(fā)現(xiàn)了DeepSeek V2相比同行的性價比優(yōu)勢
心智觀察所:TCO模型(總計算成本)的搭建是一個非常復(fù)雜的項目,涉及服務(wù)器資本支出(CapEx)、員工工資等。SemiAnalysis是否有特定的計算參數(shù)模型,或者是否收到來自相關(guān)企業(yè)關(guān)于計算TCO方法的反饋?
SemiAnalysis:我們開發(fā)了自己獨有的解決方案,并與多家公司合作,提供咨詢服務(wù)以支持他們的集群建設(shè)(注:可參見https://www.semianalysis.com/p/ai-cloud-tco-model)。
心智觀察所:根據(jù)你們的分析,與OpenAI相比,Meta和Google能夠更直接地接觸C端消費者。Meta AI是否可能對Google搜索造成不小的沖擊?“中國的Google”——百度搜索,是否也會遇到類似的問題?
SemiAnalysis:Meta擁有直接接觸數(shù)十億日活躍用戶的能力,使他們能夠立即將大量用戶群體調(diào)用于他們引入的任何AI功能。
心智觀察所:未來DeepSeek將會繼續(xù)增強其多模態(tài)能力,你們?nèi)绾卧u估他們與OpenAI(ChatGPT)、Google(Gemini)、Meta(Llama)和Anthropic(Claude)的競爭態(tài)勢?
SemiAnalysis:我們預(yù)計OpenAI在可預(yù)見的未來,憑借其在人才、基礎(chǔ)設(shè)施和資本方面的卓越資源,將保持對DeepSeek的領(lǐng)先地位。DeepSeek正在利用一種新范式,通過瞄準低垂果實實現(xiàn)快速且成本效益高的進展。然而,隨著格局的演變,保持這種勢頭將變得越來越具有挑戰(zhàn)性。同樣,我們也預(yù)計Google將保持領(lǐng)先地位。
在競爭格局內(nèi)部,Anthropic擁有顯著優(yōu)于DeepSeek的模型,我們預(yù)計他們將在不久的將來會公開發(fā)布這些模型。另一方面,Meta處于更具挑戰(zhàn)性的位置,因為它是唯一一個致力于開源其模型的主要實驗室。據(jù)我們了解,他們正在開發(fā)一個新模型,預(yù)計其性能將超過DeepSeek,但改進的程度是否足以證明推遲發(fā)布是合理的,這一點仍不確定。我們在下面這個鏈接中更詳細地探討了DeepSeek的進展:
https://semianalysis.com/2025/01/31/deepseek-debates/
心智觀察所:DeepSeek的崛起促使行業(yè)重新考慮Scale Law和“算力”的概念。你認為這將對英偉達H200的銷售預(yù)期產(chǎn)生什么影響?
SemiAnalysis:DeepSeek推動了AI擴展的創(chuàng)新,證明了戰(zhàn)略性優(yōu)化可以帶來有競爭力的結(jié)果。他們的進展增加了對AI基礎(chǔ)設(shè)施和計算資源的需求,同時加劇了頂級實驗室之間的競爭,進一步加速了該領(lǐng)域的進展。
心智觀察所:推理成本的下降是AI進步的一個標志。從訓練到推理,總體而言,像GPT、Gemini和Claude這樣的產(chǎn)品如何應(yīng)對持續(xù)降低推理成本的挑戰(zhàn),以及他們?nèi)绾握{(diào)整其API定價策略?“杰文斯悖論”是否被過度炒作?
SemiAnalysis:許多頂級AI實驗室正在積極開發(fā)針對降低成本的創(chuàng)新,這些AI實驗室往往從這些創(chuàng)新中受益最多。當競爭對手提供更低的價格時,供應(yīng)商不得不通過調(diào)整定價來應(yīng)對。通常,API定價策略會根據(jù)市場壓力和推動成本下降的內(nèi)部進展進行調(diào)整。然而,在某些情況下,供應(yīng)商并沒有降低價格,而是擴大了對替代性模型的訪問——例如OpenAI在DeepSeek取得突破后不久發(fā)布了o3-mini。我們認為“杰文斯悖論”并沒有被低估,并且我們之前的研究已經(jīng)廣泛覆蓋了這個話題。
心智觀察所:你如何評估由OpenAI領(lǐng)導的“Stargate”計劃?該計劃需要動員大量人力和物力資源。這個計劃能否與“芯片法案”這樣的計劃形成聯(lián)動?
SemiAnalysis:OpenAI的“Stargate”計劃與芯片法案完全獨立,因為它專注于擴展AI基礎(chǔ)設(shè)施,而不是對半導體制造端的激勵。雖然兩者都涉及大量資源動員,但Stargate是一項私有部門的努力,旨在構(gòu)建先進的AI系統(tǒng),而芯片法案是一項政府計劃,旨在提升國內(nèi)芯片產(chǎn)量。兩者之間沒有直接聯(lián)系。
DeepSeek-V3競爭性分析
心智觀察所:SemiAnalysis正在吸引越來越多來自中國產(chǎn)業(yè)部門的關(guān)注,近來幾乎每篇文章都會引發(fā)廣泛討論。能否談?wù)凷emiAnalysis在市場研究和行業(yè)觀察方面是否有一套獨特的方法論?能否介紹一下你們團隊的規(guī)模和盈利模式?
SemiAnalysis:我們的方法并不是什么“秘密配方”——而是對制造業(yè)、供應(yīng)鏈、技術(shù)部署以及AI基礎(chǔ)設(shè)施戰(zhàn)略進行嚴格研究的結(jié)果。這項工作需要一個高度敬業(yè)的團隊,他們對技術(shù)和分析充滿熱情。隨著我們服務(wù)的擴展,我們的團隊也在不斷壯大,從最初的幾個人發(fā)展到全球約25名分析師,目前分布于北美、歐洲和亞洲等區(qū)域。
SemiAnalysis沒有“中央辦公室”,我們的盈利模式基于銷售行業(yè)和金融研究。我們的客戶范圍覆蓋從初創(chuàng)公司到全球財富100強公司,技術(shù)公司和投資公司各占一半。我們的業(yè)務(wù)范圍包括從簡單的新聞通訊訂閱到與專門分析師進行為期數(shù)月的咨詢服務(wù)等。
本文系觀察者網(wǎng)獨家稿件,文章內(nèi)容純屬作者個人觀點,不代表平臺觀點,未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標簽 心智觀察所-
本文僅代表作者個人觀點。
- 責任編輯: 李昊 
-
韓國報告:韓半導體關(guān)鍵技術(shù)兩年內(nèi)全面落后中國
2025-02-23 21:49 三八線之南 -
我國最新成果!量子直接通信有望進入實際應(yīng)用
2025-02-22 22:04 科技前沿 -
我國成功發(fā)射中星10R衛(wèi)星
2025-02-22 21:19 航空航天 -
“中美同日宣布新突破,高下立判”
2025-02-21 22:45 觀察者頭條 -
日本喊疼:很難遵守中方出口管制,這不止針對美國啊…
2025-02-21 17:37 日本 -
我國自主研制AS700D載人飛艇完成首次科研試飛
2025-02-21 13:21 科技前沿 -
填補關(guān)鍵技術(shù)空白!我國量子科技研究迎突破性進展
2025-02-20 13:30 科技前沿 -
多地政務(wù)服務(wù)系統(tǒng)接入DeepSeek大模型
2025-02-20 06:46 -
虞仁榮的亮相,窺見中國經(jīng)濟更深處的變革
2025-02-19 17:37 心智觀察所 -
“搞一堆新名詞,十有八九是騙子”,項目能不能落地,問三個問題
2025-02-18 22:42 -
國際首個!我國腦機接口取得新突破
2025-02-18 10:03 科技前沿 -
事關(guān)高溫超導,中國科學家有突破性發(fā)現(xiàn)!
2025-02-18 09:46 科技前沿 -
百度搜索:將全面接入DeepSeek及文心大模型深度搜索功能
2025-02-16 21:42 大公司 -
馬斯克宣布:即將發(fā)布新AI模型,地球上最聰明
2025-02-16 19:55 -
“中國科技飛躍,未來已來!”
2025-02-14 23:04 觀察者頭條 -
OpenAI奧特曼:GPT-5標準版將免費無限使用
2025-02-13 10:48 人工智能 -
首爾大學屏蔽DeepSeek,稱有“安全隱患”
2025-02-13 09:20 三八線之南 -
看了這個游戲中的古建筑設(shè)定,想到林徽因說的“乾隆taste”
2025-02-13 09:08 心智觀察所 -
鋰電池“打一針”就能“重生”!《自然》刊登我國科研團隊新發(fā)現(xiàn)
2025-02-13 06:42 -
從四個角度全面駁斥美方對DeepSeek的質(zhì)疑和污蔑
2025-02-12 07:34 心智觀察所
相關(guān)推薦 -
全國政協(xié)十四屆三次會議閉幕 評論 0最新聞 Hot
-
歐洲多國驚覺:被美國掌握一個“致命開關(guān)”
-
對歐洲“感到憤怒”,“特朗普想把駐德美軍全撤走”
-
萬斯:親烏抗議者當街騷擾,嚇到3歲女兒
-
紐約發(fā)生多起山火,紐約州進入緊急狀態(tài)
-
特朗普威脅“不談就打”,伊朗最高領(lǐng)袖表態(tài)
-
“烏克蘭半瞎了,歐洲急了”
-
尹錫悅獲釋第二天,首爾10萬民眾集會游行
-
美媒哀嘆:所謂的“西方”,已蕩然無存
-
“1500億歐元貸款計劃,法德又吵起來了”
-
“看看中國高鐵再看美鐵,尬死了”
-
特朗普怒砍哥大4億美元:打擊“反猶”不給力啊
-
“特朗普想重新劃定美加邊界”
-
“魯比奧與馬斯克干架了”,特朗普忙滅火
-
“因為我是美國人,在臺積電被罵又懶又蠢”,下月開庭
-
“普京愿意,但有條件”
-
“最大受害者是波音,中國要么用國產(chǎn),要么買空客”
-