-
OpenAI推出GPT-4o mini,號稱“最具成本效益的小模型”
最后更新: 2024-07-19 11:44:46美東時(shí)間7月18日,OpenAI推出GPT-4o mini,并聲稱這是“最具成本效益的小型模型”。GPT-4o mini預(yù)計(jì)將通過讓智能變得更加實(shí)惠,顯著擴(kuò)大使用AI構(gòu)建的應(yīng)用程序范圍。
據(jù)OpenAI發(fā)布的消息,GPT-4o mini在MMLU(大規(guī)模多任務(wù)語言理解,衡量模型廣泛的世界知識和解決問題的能力)上的得分為82%,比另外兩款低成本競品更高——Google的Gemini Flash得分為77.9%,Anthropic的Claude Haiku得分為73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面優(yōu)于GPT-4.
GPT-4o mini已經(jīng)在幾個(gè)關(guān)鍵基準(zhǔn)上進(jìn)行了評估,涉及文本和視覺的推理任務(wù)、數(shù)學(xué)推理和編碼任務(wù)、多模態(tài)推理,結(jié)果均優(yōu)于其他小型模型。
各種評估基準(zhǔn)下的模型評估分?jǐn)?shù)OpenAI官方網(wǎng)站
GPT-4o mini還在API中支持文本和視覺功能,未來還將支持文本、圖像、視頻和音頻的輸入和輸出,并且擁有截至2023年10月的知識。得益于與GPT-4o共享的改進(jìn)的tokenizer(編譯器),GPT-4o mini處理非英語文本方面也更具成本效益。
GPT-4o mini成本更低、延遲更低,能夠完成更多的任務(wù),例如調(diào)用多個(gè)API(應(yīng)用程序編程接口)、傳遞和記錄大量完整的代碼庫或?qū)υ捰涗洝⒏焖?、?shí)時(shí)地與使用者聊天等。
作為模型開發(fā)過程的一部分,OpenAI 已經(jīng)與一些值得信賴的合作伙伴合作,以更好地了解GPT-4o mini的使用場景和局限性。目前已與Ramp和超人等公司進(jìn)行了合作,反饋發(fā)現(xiàn)在執(zhí)行從收據(jù)文件中提取結(jié)構(gòu)化數(shù)據(jù)或在提供線程歷史記錄時(shí)生成高質(zhì)量電子郵件響應(yīng)等任務(wù)時(shí),GPT-4o mini的表現(xiàn)明顯優(yōu)于GPT-3.5 Turbo。
考慮到價(jià)格因素,輕量化且廉價(jià)的“小而精”AI模型可能更受企業(yè)歡迎,小模型的相關(guān)開發(fā)競爭激烈。談及為何沒有更早地推出“小而精”的模型時(shí),OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement說,“我們的使命是使用最前沿技術(shù),構(gòu)建最強(qiáng)大、最有用的應(yīng)用程序,我們當(dāng)然希望繼續(xù)做前沿模型,推動(dòng)技術(shù)進(jìn)步……但我們也希望擁有最好的小模型,我認(rèn)為它會(huì)非常受歡迎?!?
OpenAI稱,開發(fā)過程中的每一步都考慮了安全性。開發(fā)時(shí)會(huì)過濾掉仇恨言論、色情信息、個(gè)人隱私信息等不宜模型學(xué)習(xí)和輸出的內(nèi)容,并采用自動(dòng)和人工(超過70位來自社會(huì)心理學(xué)和錯(cuò)誤信息等領(lǐng)域的外部專家)對模型進(jìn)行了評估,以識別潛在風(fēng)險(xiǎn)。GPT-4o mini是第一個(gè)應(yīng)用指令層次結(jié)構(gòu)的模型,有助于提高模型抵抗越獄、即時(shí)注入和系統(tǒng)即時(shí)提取的能力,這使得模型的響應(yīng)更加可靠,并有助于使其在大規(guī)模應(yīng)用中更安全地使用。
自2022年推出功能較弱的模型text-davinci-003以來,GPT-4o mini的每token成本已下降99%。GPT-4o mini定價(jià)比之前的Frontier型號便宜一個(gè)數(shù)量級,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免費(fèi)版、Plus版和團(tuán)隊(duì)版用戶已經(jīng)能夠使用GPT-4o mini替代GPT-3.5,企業(yè)用戶也將從下周開始使用。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 李亞麗 
-
被歐盟法院裁定為“守門人”,字節(jié)跳動(dòng):失望
2024-07-18 17:54 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
去年虧損近40億元,東風(fēng)汽車集團(tuán)仍難回歸A股
2024-07-18 17:22 觀出行 產(chǎn)業(yè)新聞 -
開售3個(gè)月,華為Pura70官宣降價(jià)
2024-07-18 13:32 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
20多座高鐵站“閑置”,還有救嗎?
2024-07-18 13:28 高鐵世紀(jì) -
“實(shí)現(xiàn)中國式現(xiàn)代化,需要三大區(qū)域共挑大梁”
2024-07-18 11:36 中國經(jīng)濟(jì) -
陳文玲:開放就是最大的改革
2024-07-18 10:33 2024中國經(jīng)濟(jì)季度觀察 -
陳文玲:這是中國在大國競爭博弈中的底氣
2024-07-18 10:33 2024中國經(jīng)濟(jì)季度觀察 -
香港消委會(huì)就農(nóng)夫山泉事件致歉
2024-07-18 09:22 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
飲用水跌回“1元時(shí)代”
2024-07-18 07:34 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
31省份上半年人均可支配收入:10省份超兩萬元
2024-07-17 20:20 觀網(wǎng)財(cái)經(jīng)-宏觀 -
管濤:人民幣國際化加速的原因是……?
2024-07-17 18:14 中國經(jīng)濟(jì) -
普華永道將裁掉一半在中國的金融審計(jì)員工?回應(yīng)稱,調(diào)整是艱難的決定
2024-07-17 17:29 金融觀察 -
中國經(jīng)濟(jì)發(fā)展有獨(dú)門法寶
2024-07-17 15:34 2024中國經(jīng)濟(jì)季度觀察 -
楊建文:產(chǎn)業(yè)層面要能夠推出“新新三樣”
2024-07-17 15:22 2024中國經(jīng)濟(jì)季度觀察 -
財(cái)政部擬再發(fā)總額550億元超長期特別國債
2024-07-17 15:20 金融觀察 -
“如果讓購房者感受到,之后再也沒有這么低的按揭利率…”
2024-07-17 13:50 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
連平:房地產(chǎn)企穩(wěn)將是重要的積極信號
2024-07-17 13:40 2024中國經(jīng)濟(jì)季度觀察 -
特朗普稱臺灣應(yīng)交“保護(hù)費(fèi)”,臺積電應(yīng)聲大跌超2%
2024-07-17 11:47 特朗普 -
一夜之間,黃金價(jià)格再創(chuàng)新高!有人一次下單近20萬元金條
2024-07-17 09:57 黃金游戲
相關(guān)推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 20美國政府“逃過一劫” 評論 125最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進(jìn)現(xiàn)實(shí),將贏得史詩般競爭”
-
被災(zāi)民暴罵到當(dāng)場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報(bào)復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發(fā)文嚴(yán)厲質(zhì)問央企,怎么回事?
-
“最后一道貿(mào)易障礙,中國解除了!”
-