-
對(duì)話|應(yīng)對(duì)卡脖子,開源是中國(guó)大模型安全的最優(yōu)解?
-
張廣凱13764468101
最后更新: 2025-01-23 16:49:09文/觀察者網(wǎng) 張廣凱
2025開年伊始,國(guó)內(nèi)大模型行業(yè)似乎正醞釀著一場(chǎng)劇烈的格局變動(dòng)。
一邊是零一萬物與阿里云達(dá)成合作,不再獨(dú)立追求超大模型的預(yù)訓(xùn)練;另一邊,以豆包為代表的大廠模型仍在快速進(jìn)化,“不差錢”的DeepSeek更是以創(chuàng)新架構(gòu),讓人看到超越OpenAI的可能性。
這似乎印證了一段時(shí)間以來的流言:國(guó)內(nèi)大模型企業(yè)將進(jìn)一步收斂,一些過去的頭部玩家也開始掉隊(duì)?
另一個(gè)有趣的現(xiàn)象是,此前一直走閉源路線的MiniMax,最近突然發(fā)布了自己的開源模型。開源是弱勢(shì)方爭(zhēng)奪市場(chǎng)的捷徑,還是本身就具備比閉源更好的商業(yè)邏輯閉環(huán)?
當(dāng)然,美國(guó)對(duì)中國(guó)愈加嚴(yán)厲的政策限制,一直都是不容忽視的巨大風(fēng)險(xiǎn)。國(guó)產(chǎn)大模型行業(yè)準(zhǔn)備好迎接進(jìn)一步脫鉤了嗎?
圍繞上述話題,我們邀請(qǐng)AI生態(tài)專家、曾任零一萬物開源及開發(fā)者生態(tài)負(fù)責(zé)人的林旅強(qiáng),以及Hugging Face工程師王鐵震進(jìn)行對(duì)話,收獲了不少新穎的觀點(diǎn)。
林旅強(qiáng)
王鐵震
摘要如下:
·中國(guó)大模型行業(yè)的研發(fā)能力與OpenAI沒有明顯差距,即使放棄預(yù)訓(xùn)練的團(tuán)隊(duì),也并非因?yàn)橛?xùn)練效果不佳,只是更好的商業(yè)選擇。
·隨著主流模型能力基本夠用,一味追求模型能力最強(qiáng)或許是個(gè)誤區(qū)。以操作系統(tǒng)為例,性價(jià)比才是大規(guī)模應(yīng)用的決定性因素。
·當(dāng)算力成本進(jìn)一步降低,開源模型的性價(jià)比將更加突出。
·開源的優(yōu)勢(shì)還在于更容易成為行業(yè)標(biāo)準(zhǔn)。
·開源的AI開發(fā)工具鏈,對(duì)大模型的國(guó)產(chǎn)化替代意義巨大。
以下為對(duì)話全文:
放棄預(yù)訓(xùn)練,不是能力不夠
觀察者網(wǎng):可以聊聊最近零一萬物預(yù)訓(xùn)練團(tuán)隊(duì)并入阿里的事嗎?這是不是意味著,國(guó)內(nèi)頭部大模型公司之間的能力已經(jīng)在分化,零一發(fā)現(xiàn)自己預(yù)訓(xùn)練的效果不夠好?
林旅強(qiáng):完全不是這樣的。零一的團(tuán)隊(duì)很強(qiáng),預(yù)訓(xùn)練出來的東西也很強(qiáng),去年5月發(fā)布的Yi-Large,10月發(fā)布的Yi-Lightning都很好,尤其是Yi-Lightning,可以說是當(dāng)時(shí)時(shí)間點(diǎn)上最強(qiáng)的之一。
但是模型強(qiáng)不強(qiáng),跟商業(yè)上能不能走通是兩回事。零一絕對(duì)不是沒能力做預(yù)訓(xùn)練,而是作為一個(gè)小公司,必須面對(duì)現(xiàn)實(shí)——你投入巨大的資源去做預(yù)訓(xùn)練,能不能做到self sustainable?是不是對(duì)投資人負(fù)責(zé)?
所以一個(gè)公司最終還是要去找到符合商業(yè)規(guī)律的生存之道。
王鐵震:對(duì),我非常同意。我要補(bǔ)充一下,其實(shí)中國(guó)的research非常強(qiáng),這兩年中國(guó)的大模型追得非??欤ㄗ罱腄eepSeek,甚至讓OpenAI都感到一些危機(jī)。
如果說中國(guó)跟美國(guó)的頭部模型存在一些差距,我覺得不能說是人的問題,主要還是因?yàn)橘Y金的分配、公司的政策方向等等。像零一這樣的中國(guó)公司,有最優(yōu)秀的團(tuán)隊(duì),有開復(fù)老師的領(lǐng)導(dǎo),那么如果給它像OpenAI一樣的資金,它絕對(duì)也能做出同樣好的產(chǎn)品。但是這樣的條件在中國(guó)是很稀缺的。
大部分中國(guó)公司,不可能把無止境的資金投入到一個(gè)非常燒錢的項(xiàng)目里。在“六小虎”中,所有人一開始都是to b也要做,to c也要做,to developer也要做,foundamental research也要做,但是很快大家就會(huì)發(fā)現(xiàn),我不可能每一件事情都做得好,每一件事情的競(jìng)爭(zhēng)都是非常激烈的,我需要把所有的精力放到某一個(gè)自己很擅長(zhǎng)的事情上面,才能做出最好的效果。
可能零一也經(jīng)歷了這樣一波周期,發(fā)現(xiàn)必須把全部精力集中在做APP,或者專注做to b。我覺得這完全沒有問題,因?yàn)楹苌儆泄灸軌蛳馜eepSeek或者阿里巴巴一樣,有另外賺錢的業(yè)務(wù)去養(yǎng)活不賺錢的foundamental research。
所以我覺得國(guó)內(nèi)做預(yù)訓(xùn)練的公司會(huì)越來越少,其實(shí)是一個(gè)好事,是更好的資源調(diào)配。想做預(yù)訓(xùn)練的人也可以更集中,資金也可以更集中,可能最后只有四五家模型,但每家都可以得到非常多的資金支持,可以走得更遠(yuǎn)更好。
中國(guó)很多行業(yè)都走過了類似的路,比如說電動(dòng)汽車、光伏,都經(jīng)歷了自然淘汰的過程,從無序競(jìng)爭(zhēng)到有序收斂,這是一個(gè)市場(chǎng)比較理想的狀態(tài)。
觀察者網(wǎng):也就是說國(guó)內(nèi)的大廠也好,“六小虎”也好,在大模型能力上還沒有顯著差距。
王鐵震:我認(rèn)為還在牌桌上的玩家,水平都沒有太大的差距,有差距的自己已經(jīng)放棄了,所以牌桌上的玩家確實(shí)在減少。
林旅強(qiáng):很多行業(yè)應(yīng)用,也未必非要去做預(yù)訓(xùn)練。例如百川很早就宣布把重點(diǎn)放在醫(yī)療,那么醫(yī)療大模型是不是一定需要做預(yù)訓(xùn)練?基于別人的基座大模型,拿行業(yè)數(shù)據(jù)去做后訓(xùn)練是不是足夠了?
所以退出牌桌的人,也不一定是失敗,而是調(diào)整。所有公司都要找到適合自己的路。
觀察者網(wǎng):那么當(dāng)初為什么大家一擁而上都去做預(yù)訓(xùn)練?是戰(zhàn)略選擇錯(cuò)誤,還是擔(dān)心使用別人的模型,不是好的商業(yè)模式?
林旅強(qiáng):首先,你要向資本市場(chǎng)講一個(gè)故事。2023年上半年,資本市場(chǎng)會(huì)覺得一個(gè)團(tuán)隊(duì)能做預(yù)訓(xùn)練,代表團(tuán)隊(duì)的能力是很扎實(shí)的。
另一個(gè)原因是當(dāng)時(shí)的基座模型還不夠強(qiáng),后續(xù)去做fine-tune的效果也不好,所以只能自己去做基座。
現(xiàn)在,很多大模型效果已經(jīng)好到一定的程度,甚至10B以下的小模型都比當(dāng)時(shí)強(qiáng)很多了,對(duì)很多場(chǎng)景來說完全夠用了。所以大家不會(huì)再盲目追求超大模型。
王鐵震:對(duì),剛開始的時(shí)候,你必須向資本市場(chǎng)證明自己的團(tuán)隊(duì)實(shí)力。只做fine-tune的團(tuán)隊(duì),估值不會(huì)很高,后續(xù)做很多事情就會(huì)非常受限。而且最開始的那段時(shí)間,市場(chǎng)上資金是最充裕的,越往后融資越難,如果開始拿不到足夠資金,后面可能很快就死了。
還有很重要的一點(diǎn),是對(duì)人才的爭(zhēng)奪。那個(gè)時(shí)候大模型人才是相當(dāng)稀缺的,很多公司都需要開出非常高的薪水挖人。
做預(yù)訓(xùn)練更有利于去培養(yǎng)自己的團(tuán)隊(duì)。如果只是做微調(diào),你只能看到世界的一小部分,只有懂預(yù)訓(xùn)練的人才能告訴你,一個(gè)問題到底應(yīng)該用預(yù)訓(xùn)練解決,還是后訓(xùn)練解決。
但在今天這個(gè)時(shí)間點(diǎn),基于很多開源模型去做后訓(xùn)練,已經(jīng)能達(dá)到比較好的效果,預(yù)訓(xùn)練可能就更多是一種情懷了。
最好的大模型,未必要最強(qiáng)
觀察者網(wǎng):那么在今天這個(gè)時(shí)間點(diǎn)上,開源模型跟閉源模型的能力還有差距嗎?
林旅強(qiáng):我想先correct一下這個(gè)問題本身。模型就是模型,不會(huì)因?yàn)樗情_源或者閉源就更強(qiáng)或更弱,模型強(qiáng)弱跟是否開源是完全兩個(gè)維度的事情。
觀察者網(wǎng):但是最早Llama之所以選擇做開源,可能是因?yàn)樗粔驈?qiáng),要通過開源來搶市場(chǎng)。
林旅強(qiáng):開源確實(shí)有利于搶占市場(chǎng),但是它想搶市場(chǎng),跟它夠不夠強(qiáng),不能建立直接關(guān)系?,F(xiàn)在DeepSeek也是開源,難道是因?yàn)樗粔驈?qiáng)?所以我個(gè)人覺得Llama只是開源中一種情況,并不代表開源的本質(zhì)。
開源和閉源的參與者也是動(dòng)態(tài)變化的,比如之前一直閉源的MiniMax,最近突然也做開源了,這并不只是取決于模型強(qiáng)弱。
王鐵震:這是一個(gè)經(jīng)常被問到的問題,最近我剛好也有一些新的想法。
首先就像前面提到的,沒有開源強(qiáng)的閉源模型已經(jīng)死掉了,所以結(jié)果就變成,閉源模型永遠(yuǎn)是大于等于開源模型。
之前我也覺得,開源模型跟最頭部的閉源模型相比,還是有非常大的差距。但是最近DeepSeek發(fā)布的成果,以及國(guó)內(nèi)在推理模型上面的進(jìn)展,都讓我覺得差距沒有那么大了,反而是OpenAI更應(yīng)該感到焦慮。
視頻生成模型也是一個(gè)很好的觀察角度。Sora是一個(gè)閉源模型,它剛出來的時(shí)候大家都驚嘆,中國(guó)跟它的差距非常大。但是現(xiàn)在大家驚嘆的反而是,Sora怎么一直都像個(gè)期貨,好像還不如中國(guó)的開源模型給力。
所以開源模型是可以很強(qiáng)的。但這個(gè)問題仍然很有價(jià)值,我會(huì)想問,如果開源模型廠商真的做出了比OpenAI更好的模型,它們還會(huì)不會(huì)繼續(xù)開源?整個(gè)開源生態(tài)本身已經(jīng)在收斂,如果再有更多廠商放棄開源預(yù)訓(xùn)練,對(duì)行業(yè)將是巨大損失,因?yàn)闆]有市場(chǎng)競(jìng)爭(zhēng)的話,很難保證大家都還愿意在這個(gè)牌桌上玩。
觀察者網(wǎng):所以仍然可以說,閉源模型大于等于開源模型?究竟有沒有哪家開源模型,能夠達(dá)到跟OpenAI差不多的能力?
林旅強(qiáng):其實(shí)對(duì)于開發(fā)者跟行業(yè)來說,很多開源模型的能力是足夠的。那么在同等能力情況下,如果有開源的選擇,我一定選開源,因?yàn)樾詢r(jià)比就是開源強(qiáng)。
所以你怎么去評(píng)判強(qiáng)不強(qiáng)?論性價(jià)比開源超強(qiáng)。你的問題其實(shí)暗含了一個(gè)假設(shè),認(rèn)為模型能力一定要達(dá)到最強(qiáng),這件事情是很重要的。如果從科研角度或者公司估值的角度,追求最強(qiáng)確實(shí)是有意義的,但是從我們開發(fā)者角度,性價(jià)比高才能普及。
我舉個(gè)例子,PC端操作系統(tǒng),最強(qiáng)的肯定是Windows或者macOS,但是Linux對(duì)于全球行業(yè)的影響力或許更大。你看得到的機(jī)器上跑的都是Windows或者macOS,你看不到的機(jī)器上跑的基本都是Linux,后者的數(shù)量可能更多。
Linux甚至根本不需要一家公司去推動(dòng),它成立一個(gè)基金會(huì),IBM、谷歌都會(huì)捐錢。每家捐幾百萬美元,就能換來持續(xù)可用的操作系統(tǒng),而且不會(huì)被人卡脖子。
所以究竟是Linux最強(qiáng),還是macOS比較強(qiáng),現(xiàn)在已經(jīng)沒有人care這一點(diǎn)了。
觀察者網(wǎng):有支持閉源的人,說開源模型是“智商稅”,認(rèn)為即使從成本來看,閉源也比開源要低。
林旅強(qiáng):我尊重他們的選擇,但我不認(rèn)同這個(gè)結(jié)論,開源相比閉源成本一定是低的。因?yàn)橘?gòu)買一個(gè)閉源模型本身就是很大的支出,在此之外,開源不會(huì)比閉源增加任何成本。
王鐵震:一些現(xiàn)在做閉源的公司,其實(shí)在過去的時(shí)代也在做開源,對(duì)NLP、OCR等領(lǐng)域都有很大幫助。后來在大模型領(lǐng)域轉(zhuǎn)向閉源,雖然很可惜,但是一定是經(jīng)過了深思熟慮,甚至可能也有激烈的內(nèi)部討論。那么一旦選定了技術(shù)路線,對(duì)外也只能這樣說。
- 責(zé)任編輯: 張廣凱 
-
基金季報(bào)揭示神秘資金力挺A股:耗資千億增持,至今一股未賣
2025-01-23 16:43 觀網(wǎng)財(cái)經(jīng)-金融 -
國(guó)產(chǎn)“足球巨星”機(jī)器人來了
2025-01-23 16:27 人工智能 -
一箭18星!長(zhǎng)六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
1月136款游戲獲批,王者榮耀衍生作品拿下版號(hào)
2025-01-23 11:15 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強(qiáng),高處不勝寒
2025-01-23 11:04 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
吳清:力爭(zhēng)大型國(guó)有險(xiǎn)企,每年新增保費(fèi)的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對(duì)抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
出售與輝同行后東方甄選虧近億元,新東方股價(jià)暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價(jià)搶票是忽悠,購(gòu)票平臺(tái)為何還在賣“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年?duì)I收超500億
2025-01-22 15:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
特朗普都提名了哪些人來管理五角大樓?
2025-01-22 14:42 特朗普 -
超越協(xié)和,國(guó)產(chǎn)的超音速客機(jī)要來了?
2025-01-22 10:10 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
寒武紀(jì)遭前CTO訴訟索賠42.87億
2025-01-21 22:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
萬億券商合并新進(jìn)展:海通證券、國(guó)泰君安宣布2月6日起停牌
2025-01-21 21:14 金融觀察 -
DeepSeek又有重大突破?一款未公開大模型展現(xiàn)驚人能力
2025-01-21 18:13 人工智能 -
餓了么推出九項(xiàng)舉措:讓“算法”成為騎手的“辦法”
2025-01-21 18:04 大公司
相關(guān)推薦 -
-
DeepSeek將沖擊美股,刺破英偉達(dá)市值泡沫? 評(píng)論 160“這太酷了,美國(guó)決策者要反思…” 評(píng)論 177巴勒斯坦、約旦、埃及全都反對(duì)!哈馬斯回懟 評(píng)論 194TikTok支棱之后,局面開始變化 評(píng)論 95加防長(zhǎng)外長(zhǎng)站臺(tái),他有望接替特魯多? 評(píng)論 25最新聞 Hot
-
“這太酷了,美國(guó)決策者要反思…”
-
被特朗普狠踹一腳的丹麥,曾這樣緊抱美國(guó)
-
哥倫比亞還是讓步了
-
加拿大媒體炮轟:我們都快被特朗普蛐蛐死了,你人呢?
-
美國(guó)務(wù)院下死令
-
“我永遠(yuǎn)不會(huì)反華,美國(guó)收買不了我”
-
“伊朗還盯著呢!怎么能把他們安保撤了?”
-
巴勒斯坦、約旦、埃及全都反對(duì)!哈馬斯回懟
-
他又挑撥!越南總理表態(tài)
-
“美中如果有更多的雙贏元素,那就太好了”
-
丹麥被貼臉開大:笑死,多搞幾條狗,你也好意思…
-
芝加哥、亞特蘭大、洛杉磯……美國(guó)開始非法移民大抓捕
-
軍機(jī)遣返移民被拒后,特朗普加稅25%!哥倫比亞硬剛
-
歷史性一刻!DeepSeek超越ChatGPT,登頂美區(qū)蘋果應(yīng)用榜
-
DeepSeek時(shí)刻來了,“美國(guó)全球AI領(lǐng)先地位還保得住嗎?”
-
特朗普大嘴一張,就要決定150萬加沙人的命運(yùn)
-