-
DeepSeek“偷偷”發(fā)布新版本,最新測(cè)評(píng)來(lái)了
-
張廣凱13764468101
(文/張廣凱 編輯/呂棟)
昨晚,DeepSeek 以非常低調(diào)的方式,帶來(lái)了最新版本的大模型 V3-0324。
沒(méi)有官方新聞稿,沒(méi)有技術(shù)報(bào)告,甚至在Hugging Face上傳的最初文件中,連README文檔都是空的,看上去,這只是V3模型的一次版本升級(jí)。
不過(guò)由于DeepSeek自帶的極高話題性,這次版本升級(jí)還是引發(fā)了大量討論和測(cè)評(píng),并且果然沒(méi)有令人失望——很多專(zhuān)業(yè)人士都指出,V3-0324模型在編程能力上有了顯著提升。
在大模型編程能力測(cè)試Aider LLM中,V3-0324的多語(yǔ)言基準(zhǔn)測(cè)試得分為55%,相較于此前版本不到50%的水平有明顯進(jìn)步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以編程見(jiàn)長(zhǎng)的Claude 3.7 sonnet。
考慮到V3-0324并非推理模型,能夠在編程能力上接近R1,算得上是自身短板的精準(zhǔn)補(bǔ)強(qiáng)。
另一位博主Xeophon自建的測(cè)試集上,V3-0324在綜合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通義的qwq-32b則都是推理模型。
知名的大模型競(jìng)技場(chǎng)Chatbot Arena也已經(jīng)開(kāi)始將V3-0324納入測(cè)試,但還具體成績(jī)還要等待幾天時(shí)間。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1則排在第6位。
隨著今年以來(lái)OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升級(jí),再加上Grok、Claude和Gemini等模型的持續(xù)迭代,外界對(duì)于DeepSeek何時(shí)能夠再次升級(jí)也有了更高期待。
此前路透社消息稱,DeepSeek下一代推理模型R2可能會(huì)比預(yù)期的5月更早發(fā)布。
考慮到DeepSeek R1是以V3作為基礎(chǔ)模型訓(xùn)練而來(lái),此次V3-0324的亮相,或許也意味著R2愈發(fā)臨近了。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 張廣凱 
-
騰訊等巨頭攜手入股智元機(jī)器人
2025-03-25 13:29 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
消息稱京東入局具身智能賽道
2025-03-25 13:28 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
原華為副總裁擔(dān)任智元機(jī)器人董事長(zhǎng)兼CEO
2025-03-25 12:36 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
蔡崇信:企業(yè)家信心明顯增強(qiáng),阿里巴巴將重啟招聘
2025-03-25 11:05 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
上海發(fā)布2025重點(diǎn)產(chǎn)業(yè)布局圖
2025-03-25 10:31 觀網(wǎng)財(cái)經(jīng)-宏觀 -
“讓機(jī)器服務(wù)于人,而不是人為機(jī)器服務(wù)”
2025-03-25 09:29 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
茶咖日?qǐng)?bào)|茉莉奶白被曝喝出完整塑料袋,官方回應(yīng):已閉店
2025-03-24 21:00 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
京東外賣(mài)上線40天,日訂單首破百萬(wàn)
2025-03-24 18:12 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
宣布斥資15億布局香港后,京東要把家電價(jià)格打到全港最低
2025-03-24 18:12 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
2元一根的妙可藍(lán)多奶酪,去年又掙了1.13億
2025-03-24 17:34 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
控量挺價(jià)成效待考,舍得酒業(yè)2024年凈利驟降80%
2025-03-24 17:25 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
教培跑路頻發(fā),美團(tuán)這招行不行?
2025-03-24 17:24 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
2024年中國(guó)財(cái)政政策執(zhí)行情況報(bào)告發(fā)布
2025-03-24 16:23 -
-
五大芯片巨頭來(lái)華參會(huì),高通三星高管到訪小米汽車(chē)工廠
2025-03-24 11:44 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
絲芙蘭迷失在中國(guó),全球CEO緊急“救火”
2025-03-23 09:39 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
華為楊超斌:已有超80家伙伴基于昇騰打造大模型一體機(jī)
2025-03-22 21:40 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
“打中國(guó)牌討好美國(guó),還有用嗎?” 評(píng)論 71特朗普聲稱“政治迫害”,白宮攻擊:他是反特朗普黑子 評(píng)論 67美媒好愁:說(shuō)了這是送中國(guó)的大禮,你不聽(tīng),現(xiàn)在咋辦 評(píng)論 128兩件“國(guó)之重器”,同一個(gè)幕后功臣! 評(píng)論 158直播:AI與國(guó)運(yùn)——中華文明與人工智能的歷史性相遇 評(píng)論 22最新聞 Hot
-
“打中國(guó)牌討好美國(guó),還有用嗎?”
-
美財(cái)長(zhǎng)放風(fēng),“金融核彈”要撤回?
-
特朗普還沒(méi)死心,竟稱:用TikTok換減稅,中國(guó)不虧
-
美教授直說(shuō):看到中國(guó)領(lǐng)頭,美國(guó)嫉妒了
-
砸了30億歐元造的最現(xiàn)代化發(fā)電廠,德國(guó)炸了,還炸呲了…
-
特朗普聲稱“政治迫害”,白宮攻擊:他是反特朗普黑子
-
下載量激增!“快加入吧,有機(jī)會(huì)被副總統(tǒng)拉進(jìn)群哦”
-
加總理耍狠:這個(gè)價(jià)值觀,無(wú)法與中國(guó)共享
-
北約秘書(shū)長(zhǎng):別單干,美國(guó)人還能信
-
加拿大、歐盟火速“譴責(zé)”
-
美媒好愁:說(shuō)了這是送中國(guó)的大禮,你不聽(tīng),現(xiàn)在咋辦
-
魯比奧“唱反調(diào)”:顯然是個(gè)大錯(cuò)誤
-
哈馬斯發(fā)言人被以軍打死
-
特朗普:對(duì)所有進(jìn)口車(chē)加稅25%,對(duì)馬斯克有利
-
美防長(zhǎng)嘴硬,被最新公開(kāi)的群聊原文“打臉”了
-
“美國(guó)人批評(píng)歐洲有道理,這不是侮辱”
快訊- 2025蘋(píng)果學(xué)者名單公布,華人占半壁江山
- 淘寶率先打擊AI假圖,倡議全行業(yè)參與共同治理
- 濟(jì)民健康公告:副總裁涉嫌偽造公章長(zhǎng)達(dá)一年,虛增銷(xiāo)售1.17億
- 時(shí)尚果真是個(gè)圈?爸媽“玩剩下”的康普茶,開(kāi)始征服年輕人
- 昊海生科2024年業(yè)務(wù)分化趨勢(shì)明顯:醫(yī)美板塊崛起,眼科骨科承壓
- 丹寧高速水陽(yáng)段橋梁垮塌災(zāi)害相關(guān)責(zé)任單位及人員追責(zé)問(wèn)責(zé)情況通報(bào)
- 中國(guó)銀行副行長(zhǎng)蔡釗宣布2025年計(jì)劃投入百億級(jí)消費(fèi)補(bǔ)貼與減費(fèi)讓利
- 43名公職人員被問(wèn)責(zé)!丹寧高速水陽(yáng)段橋梁垮塌災(zāi)害調(diào)查評(píng)估報(bào)告公布
-