-
熊節(jié)、塞爾吉奧·阿馬德烏:DeepSeek為什么要開源?這可能與人工智能的領(lǐng)導(dǎo)權(quán)息息相關(guān)
【導(dǎo)讀】 本文由deepseek翻譯,經(jīng)觀察者網(wǎng)編輯加工潤(rùn)色后發(fā)布。
【文/觀察者網(wǎng)專欄作者 熊節(jié)、塞爾吉奧·阿馬德烏】
人工智能領(lǐng)導(dǎo)權(quán)之爭(zhēng)——中國(guó)與開源
為什么技術(shù)領(lǐng)導(dǎo)權(quán)如此重要?如何定義人工智能(AI)領(lǐng)域的技術(shù)領(lǐng)導(dǎo)權(quán)?人工智能是一項(xiàng)橫跨多個(gè)領(lǐng)域的技術(shù),其進(jìn)步會(huì)對(duì)經(jīng)濟(jì)、社會(huì)和國(guó)家安全產(chǎn)生深遠(yuǎn)影響。技術(shù)領(lǐng)導(dǎo)權(quán)首先提供了一系列競(jìng)爭(zhēng)優(yōu)勢(shì),因?yàn)榘l(fā)明和創(chuàng)新賦予開發(fā)者其他人所不具備的收益和利益。其次,技術(shù)領(lǐng)導(dǎo)權(quán)是一個(gè)關(guān)鍵的地緣政治因素,因?yàn)樗軌蛴绊懭驑?biāo)準(zhǔn)、規(guī)范和法規(guī)的制定。第三,技術(shù)領(lǐng)導(dǎo)權(quán)可以推動(dòng)創(chuàng)新生態(tài)系統(tǒng)的形成,鞏固長(zhǎng)期發(fā)展。第四,領(lǐng)導(dǎo)權(quán)可以在國(guó)際威脅(包括軍事威脅)的背景下增強(qiáng)安全性。第五,領(lǐng)導(dǎo)權(quán)能夠引導(dǎo)技術(shù)發(fā)展,以實(shí)現(xiàn)社會(huì)、環(huán)境和政治目標(biāo)。
從技術(shù)政治的角度來看,技術(shù)科學(xué)并非中立,它對(duì)權(quán)力關(guān)系和社會(huì)組織具有深遠(yuǎn)影響(Winner,2020)[1]。人工智能的領(lǐng)導(dǎo)權(quán)不僅僅是開發(fā)最先進(jìn)的技術(shù),還包括創(chuàng)建一個(gè)能夠?qū)崿F(xiàn)更廣泛社會(huì)價(jià)值和目標(biāo)的社會(huì)技術(shù)環(huán)境,確保創(chuàng)新遵循特定的目的。人工智能的發(fā)展軌跡可能會(huì)優(yōu)先考慮提高經(jīng)濟(jì)系統(tǒng)的生產(chǎn)力,或者旨在尋找社會(huì)公正和環(huán)境可持續(xù)的解決方案。它可能尋求集中權(quán)力并加強(qiáng)國(guó)際不對(duì)稱性,或者促進(jìn)知識(shí)的傳播和公平發(fā)展。它可能抑制人口和文化的創(chuàng)造力,或者確保技術(shù)多樣性。它可能與權(quán)力的集中或分散密切相關(guān)。
目前,人工智能的領(lǐng)導(dǎo)權(quán)掌握在美國(guó)手中,主要由所謂的“科技巨頭”主導(dǎo)。這些公司控制著開發(fā)現(xiàn)有人工智能(尤其是以深度學(xué)習(xí)為主導(dǎo)的人工智能)不可或缺的資源。
我們都知道,深度學(xué)習(xí)方法基于統(tǒng)計(jì)學(xué)和概率學(xué),用于從大量數(shù)據(jù)中分類和提取模式。為了執(zhí)行這些操作,人工智能開發(fā)者依賴于強(qiáng)大的計(jì)算能力。訓(xùn)練一個(gè)像ChatGPT這樣先進(jìn)的人工智能模型需要數(shù)百萬美元,并且需要大量時(shí)間使用專用硬件進(jìn)行處理,例如專為這些任務(wù)設(shè)計(jì)的芯片。這些芯片被稱為“AI推理芯片”或“推理加速器”,它們能夠在更短的時(shí)間內(nèi)取得更好的結(jié)果。例如,谷歌的Tensor Processing Units(TPUs)專為推理和訓(xùn)練優(yōu)化;神經(jīng)處理單元(NPUs)或神經(jīng)網(wǎng)絡(luò)加速器常用于移動(dòng)設(shè)備和邊緣計(jì)算;圖形處理單元(GPUs)則用于訓(xùn)練和推理。
目前,這些芯片對(duì)于圖像識(shí)別、自然語言處理和其他實(shí)時(shí)人工智能任務(wù)至關(guān)重要。
美國(guó)政府長(zhǎng)期以來一直采取限制尖端芯片獲取的政策,主要目的是延緩中國(guó)和其他被視為對(duì)手國(guó)家的AI發(fā)展,目標(biāo)是保持美國(guó)在AI領(lǐng)域的領(lǐng)導(dǎo)地位。隨著唐納德·特朗普于2025年1月就職,技術(shù)封鎖政策進(jìn)一步加劇。此外,美國(guó)總統(tǒng)宣布了一項(xiàng)5000億美元的“星際之門”項(xiàng)目投資。特朗普的計(jì)劃是與甲骨文、OpenAI和軟銀等公司合作,在美國(guó)開發(fā)物理和虛擬的AI基礎(chǔ)設(shè)施,以“推動(dòng)下一代AI的發(fā)展”[2]。英偉達(dá)、Arm和微軟等公司是該項(xiàng)目的合作伙伴,該項(xiàng)目已在德克薩斯州開始實(shí)施,并將在未來四年內(nèi)在美國(guó)各個(gè)地區(qū)建設(shè)“巨型數(shù)據(jù)中心”[3]。
以埃隆·馬斯克為代表的美國(guó)科技精英認(rèn)為,人工智能正在接近“奇點(diǎn)”——即人工通用智能(AGI)的出現(xiàn)。他們聲稱,AGI將完全超越并取代人類在所有智力領(lǐng)域的勞動(dòng),如果美國(guó)率先實(shí)現(xiàn)AGI,其技術(shù)霸權(quán)將不可撼動(dòng)。然而,無論是ChatGPT還是DeepSeek,都沒有顯示出接近AGI的跡象。它們是處理自然語言的有用工具,并在特定領(lǐng)域展示了有限的推理能力,但沒有證據(jù)表明它們——或任何已知的AI研究——正在接近AGI。
AGI比起一般的AI擅長(zhǎng)以更像人類的方式去執(zhí)行任務(wù)
開源的轉(zhuǎn)折點(diǎn)
2024年5月,一家名為DeepSeek的中國(guó)小公司推出了其大型語言模型(LLM),該模型受到Llama的啟發(fā),Llama是一個(gè)禁止商業(yè)使用的受限研究協(xié)議下的模型。開源模型DeepSeek V2的突出之處在于其前所未有的成本效益。DeepSeek將推理成本降低至每百萬個(gè)token僅1元人民幣,約為L(zhǎng)lama3 70B的七分之一,遠(yuǎn)低于GPT-4。
Token是語言模型用于處理和理解人類語言的基本文本單位,根據(jù)上下文和語言,token可以被視為單詞、音節(jié)甚至單個(gè)字符的“塊”。AI模型將文本轉(zhuǎn)換為token,并以數(shù)字形式表示。這些數(shù)字隨后由模型處理以生成響應(yīng)或執(zhí)行任務(wù)。因此,文本中的token數(shù)量直接影響成本和處理時(shí)間。token越多,推理越復(fù)雜且耗時(shí)。
與所有中國(guó)公司一樣,DeepSeek也受到美國(guó)政府尖端芯片封鎖的限制。這促使DeepSeek的領(lǐng)導(dǎo)者及其團(tuán)隊(duì)更加專注于研究和優(yōu)化。梁文鋒在2024年7月的一次采訪中表示:“我們的出發(fā)點(diǎn)不是抓住機(jī)會(huì)發(fā)財(cái),而是推進(jìn)到技術(shù)前沿,以促進(jìn)整個(gè)生態(tài)系統(tǒng)的發(fā)展?!盵4] 這家中國(guó)公司試圖引領(lǐng)AI發(fā)展的意圖顯而易見。為了實(shí)現(xiàn)這一目標(biāo),DeepSeek并沒有局限于組織數(shù)據(jù)并在現(xiàn)有云平臺(tái)上運(yùn)行。團(tuán)隊(duì)努力在尖端芯片稀缺的情況下尋找解決方案。這需要改變架構(gòu)、嘗試新程序以及廣泛的應(yīng)用數(shù)學(xué)。
DeepSeek的年輕領(lǐng)導(dǎo)者梁文鋒表示:“我們?cè)趧?chuàng)新方面缺乏的絕對(duì)不是資本,而是信心和如何組織高密度人才以實(shí)現(xiàn)有效創(chuàng)新的知識(shí)?!盵5] 他繼續(xù)說道:“創(chuàng)新并不完全由商業(yè)驅(qū)動(dòng),還需要好奇心和創(chuàng)造力。我們陷入了過去的慣性,但這也是暫時(shí)的?!盵6] 梁文鋒的理念是減少模仿,增加研究。他主張押注開源模型,不是為了使用它們,而是為了改進(jìn)它們,并找到需要更少計(jì)算資源的路徑。
開源是DeepSeek戰(zhàn)略的核心,但對(duì)騰訊、百度和阿里巴巴等其他中國(guó)公司來說可能并非如此。然而,開源允許知識(shí)在全球范圍內(nèi)傳播,從而以更快、更包容的速度產(chǎn)生新發(fā)現(xiàn)的可能性。梁文峰表示:“實(shí)際上,開源和論文的發(fā)表并沒有損失。對(duì)于技術(shù)團(tuán)隊(duì)來說,被追隨是一種巨大的成就感。事實(shí)上,開源更像是一種文化行為,而不是商業(yè)行為,因?yàn)榻o予實(shí)際上是一種額外的榮譽(yù),這樣做的公司也會(huì)更具有文化吸引力?!盵7]
開源不是一種技術(shù),而是一個(gè)基于知識(shí)共享的開發(fā)過程。通常,它鼓勵(lì)組織愿意協(xié)作解決問題并通過更新維護(hù)解決方案的社區(qū)。像Mistral 7B(Mistral AI)和Falcon(技術(shù)創(chuàng)新研究所)這樣的語言模型是開源的,并在Apache 2.0許可下發(fā)布;強(qiáng)化學(xué)習(xí)模型Stable-Baselines3也是開源的,采用MIT許可證。
那么,為什么DeepSeek的模型如此重要?因?yàn)樗嵏擦巳駻I領(lǐng)導(dǎo)權(quán)的競(jìng)爭(zhēng)。如何做到的?通過大幅降低大型語言模型的計(jì)算成本。
開源對(duì)于知識(shí)傳播至關(guān)重要,但并不能解決訓(xùn)練和運(yùn)行模型所需的計(jì)算基礎(chǔ)設(shè)施問題。DeepSeek展示了一個(gè)高性能且處理需求較低的開源模型。
DeepSeek-R1已經(jīng)展示了比OpenAI的ChatGPT o1更強(qiáng)的推理能力,而其成本(包括訓(xùn)練和使用)顯著降低。通過開源其模型,DeepSeek促進(jìn)了大型語言模型的民主化——使技術(shù)基礎(chǔ)設(shè)施欠發(fā)達(dá)的小公司、國(guó)家甚至個(gè)人能夠基于DeepSeek訓(xùn)練自己的“主權(quán)AI”,而無需依賴科技巨頭的產(chǎn)品或?qū)?shù)據(jù)交給這些公司。印度尼西亞和印度已經(jīng)開始使用DeepSeek作為基礎(chǔ)構(gòu)建自己的AI基礎(chǔ)設(shè)施[8]。在此之前,只有美國(guó)和中國(guó)有能力訪問如此高水平的大型語言模型。
上表展示了在lighteval上OpenR1-Qwen-7B、DeepSeek-Distill-Qwen-7B和OpenThinker-7B的性能對(duì)比,可以看出在數(shù)學(xué)成績(jī)上,OpenR1-Qwen-7B和DeepSeek-Distill-Qwen-7B差距不是非常明顯。36氪
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 鄭樂歡 
-
鋰電池“打一針”就能“重生”!《自然》刊登我國(guó)科研團(tuán)隊(duì)新發(fā)現(xiàn)
2025-02-13 06:42 -
從四個(gè)角度全面駁斥美方對(duì)DeepSeek的質(zhì)疑和污蔑
2025-02-12 07:34 心智觀察所 -
我國(guó)成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)低軌衛(wèi)星
2025-02-11 19:20 航空航天 -
蹭熱度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
中國(guó)半導(dǎo)體產(chǎn)業(yè)要長(zhǎng)遠(yuǎn)發(fā)展,這個(gè)問題必須解決好
2025-02-10 13:57 心智觀察所 -
“中國(guó)物理學(xué)研究領(lǐng)先世界,美國(guó)機(jī)構(gòu)被擠出前十”
2025-02-09 09:14 科技前沿 -
撬開日本海關(guān)的口:日本半導(dǎo)體設(shè)備對(duì)華依賴度有多高?
2025-02-06 08:06 心智觀察所 -
中國(guó)平臺(tái),集中上線
2025-02-04 21:12 -
“人造太陽”再創(chuàng)紀(jì)錄,是中國(guó)式科研方法論又一次勝利
2025-02-04 13:05 心智觀察所 -
“大洋一號(hào)”功勛船舶將升級(jí)改造
2025-02-02 15:35 -
“霸榜全球140個(gè)市場(chǎng)”,拉新最多的是…
2025-02-01 22:06 觀察者頭條 -
突破70多年來的傳統(tǒng)認(rèn)知!他們發(fā)現(xiàn)距地球16萬公里的“太空合聲”
2025-02-01 16:53 天文 -
中國(guó)光子毫米波雷達(dá)技術(shù)取得突破性進(jìn)展
2025-01-31 22:54 科技前沿 -
果然,臺(tái)當(dāng)局又跳了出來
2025-01-31 22:01 臺(tái)灣 -
英偉達(dá)平臺(tái)上線DeepSeek
2025-01-31 18:18 -
阿斯麥CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科學(xué)家又發(fā)現(xiàn)“超級(jí)地球”
2025-01-29 19:03 -
-
理解DeepSeek的中國(guó)式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線起源之謎再添“觀天”利器
2025-01-21 20:09 天文
相關(guān)推薦 -
“果然,中國(guó)說對(duì)了” 評(píng)論 47“特朗普會(huì)讓世界團(tuán)結(jié)起來,減少對(duì)美依賴” 評(píng)論 194“剛剛,我看到了未來,它不在美國(guó)” 評(píng)論 154特朗普竟對(duì)中國(guó)征收34%“對(duì)等關(guān)稅” 評(píng)論 951解放日?“對(duì)于市場(chǎng)而言這是‘屠戮日’” 評(píng)論 71最新聞 Hot
-
當(dāng)著內(nèi)塔尼亞胡的面,歐爾班宣布匈牙利退出ICC
-
美國(guó)被曝禁止在華公務(wù)人員與中國(guó)公民戀愛
-
“地球上沒一個(gè)地方是安全的”,無人島也要被征稅
-
“美國(guó)是特朗普關(guān)稅政策下的最大輸家”
-
“對(duì)臺(tái)灣地區(qū)沖擊明顯,非??膳隆?/a>
-
“剛剛,我看到了未來,它不在美國(guó)”
-
誰被征了50%的最高關(guān)稅?
-
四名共和黨議員倒戈阻止對(duì)加關(guān)稅,特朗普破口大罵
-
“特朗普會(huì)讓世界團(tuán)結(jié)起來,減少對(duì)美依賴”
-
特朗普發(fā)動(dòng)全球關(guān)稅戰(zhàn),美國(guó)VS全世界
-
結(jié)束全球化?“不是按個(gè)開關(guān),美國(guó)就能搖身一變”
-
諾獎(jiǎng)得主克魯格曼:特朗普在貿(mào)易上已經(jīng)徹底瘋了
-
特朗普“汽車關(guān)稅”也落地了,“日本GDP將萎縮0.3%”
-
“白宮已接近批準(zhǔn)”,美方想租用算法?
-
提到日本關(guān)稅還念念不忘:我說的話,安倍秒懂
-
“沒有美國(guó)這么對(duì)朋友的!但…”
快訊- 來自美國(guó)的背刺,或令日本車企失去“最后堡壘”
- 歷經(jīng)5年推動(dòng),美參議院為女性駕駛安全設(shè)立法案
- 特朗普“關(guān)稅大棒”或重創(chuàng)“歐洲底特律”
- 鴻蒙5“萬能卡片”助力清明出行,華為Pura X解鎖效率新體驗(yàn)
- 新車看點(diǎn)|海獅05EV售價(jià)11.78萬起,比亞迪鞏固A級(jí)純電SUV地位
- 茶咖日?qǐng)?bào)|古茗龍井系列貼上“身份證”;關(guān)稅恐推高美國(guó)咖啡價(jià)格
- 4月3日《新聞聯(lián)播》主要內(nèi)容
- 車企敘述的“智駕烏托邦”,遠(yuǎn)遠(yuǎn)未至
-