-
中國(guó)大模型圖鑒:深度解讀《2023大模型落地應(yīng)用案例集》
最后更新: 2023-12-31 09:12:2702. 大模型應(yīng)用拐點(diǎn)已至
圖靈獎(jiǎng)獲得者Yann LeCun說過:AI大模型的技術(shù)都是公開的,算不上底層技術(shù)上的創(chuàng)新,如果你愿意一探究竟的話,可以發(fā)現(xiàn)它背后沒有任何秘密可言。
但借著這些“過時(shí)”的技術(shù),在中國(guó)擁有龐大的人才基數(shù)和數(shù)據(jù)集的情況下,可以發(fā)展出更適合本土環(huán)境和語(yǔ)境的大模型。
那么如何形象理解大模型?前科技部長(zhǎng)王志剛從高維度表示,大模型,就是大數(shù)據(jù)、大算力、強(qiáng)算法。形象一些:大模型事實(shí)上就是算法、數(shù)據(jù)、算力上的有效結(jié)合。傳統(tǒng)巨頭在大模型領(lǐng)域的技術(shù)投入普遍都是在積極防御,而中國(guó)企業(yè)在非常積極地推動(dòng)向應(yīng)用中的落地。
目前,業(yè)界除了把AI大模型商業(yè)落地模式統(tǒng)分為 toB 和 toC之外,在市場(chǎng)劃分上則遵循通用與垂直兩大路徑,兩者在參數(shù)級(jí)別、應(yīng)用場(chǎng)景等方面差異正在顯性化。
通用大模型往往是指具備處理多種不同類型任務(wù)的AI模型,這些模型通常是通過大規(guī)模的數(shù)據(jù)訓(xùn)練而成,能夠在多個(gè)領(lǐng)域和應(yīng)用中表現(xiàn)出良好的效能。大家耳熟能詳?shù)膸讉€(gè)通用大模型均來財(cái)力雄厚的企業(yè):
1.書生浦語(yǔ)開源大模型:由上海人工智能實(shí)驗(yàn)室研發(fā),涵蓋 70 億參數(shù)的輕量級(jí)版本 InternLM-7B,以及 200 億參數(shù)的中量級(jí)版本和 InternLM-20B,以及完整的開源工具鏈體系。InternLM-7B 在包含 40 個(gè)評(píng)測(cè)集的全維度評(píng)測(cè)中展現(xiàn)出卓越且平衡的性能,它在兩個(gè)被廣泛采用的基準(zhǔn) MMLU 和 CEval 上分別取得了 50.8 和 52.8 的高分,開源一度刷新了 7B 量級(jí)模型的紀(jì)錄。
2.昆侖萬(wàn)維天工大模型:“天工”是一個(gè) AI 搜索引擎,一個(gè)對(duì)話式 AI 助手?!疤旃ぁ睋碛袕?qiáng)大的自然語(yǔ)言處理和智能交互能力,能夠?qū)崿F(xiàn)個(gè)性化 AI 搜索、智能問答、聊天互動(dòng)、文本生成、編寫代碼、語(yǔ)言翻譯等多種應(yīng)用場(chǎng)景并且具有豐富的知識(shí)儲(chǔ)備,涵蓋科學(xué)、技術(shù)、文化、藝術(shù)、歷史等領(lǐng)域。
3.通義千問 2.0:由阿里云研發(fā)的超大規(guī)模的語(yǔ)言模型,具備多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語(yǔ)言支持等功能。通義千問 2.0 在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識(shí)記憶、幻覺抵御等能力上均比上代有顯著提升。
4.MiniMax-abab:由科技創(chuàng)業(yè)公司MiniMax研發(fā)。據(jù)悉,“Max-abab”是文本、語(yǔ)音、視覺三模態(tài)的千億參數(shù)大語(yǔ)言模型,在中、英文服務(wù)領(lǐng)域均已超過GPT-3.5 的水平。今年8月份,“MiniMax-abab”大模型通過了國(guó)家首批大模型服務(wù)備案,面向社會(huì)公眾提供服務(wù)。
5.言犀基礎(chǔ)大模型:由京東科技研發(fā),該模型融合了70%的通用數(shù)據(jù)和30%的數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有更高的產(chǎn)業(yè)屬性。
6.百靈語(yǔ)言大模型:由螞蟻集團(tuán)基于Transfromer架構(gòu)研發(fā)。該模型基于萬(wàn)億級(jí)Token語(yǔ)料訓(xùn)練而成,支持窗口長(zhǎng)度達(dá)32K,在主流推理類榜單中排名前列。據(jù)悉,螞蟻百靈大模型已完成備案,基于百靈大模型的多款產(chǎn)品已陸續(xù)完成內(nèi)測(cè),正陸續(xù)向公眾開放。
通用大模型示例,數(shù)據(jù)來自:《2023大模型落地應(yīng)用案例集》
這些通用大模型包含千億甚至萬(wàn)億參數(shù),覆蓋自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等方面的任務(wù),已在知識(shí)問答、醫(yī)療咨詢、娛樂領(lǐng)域、視頻生成等數(shù)十個(gè)行業(yè)場(chǎng)景領(lǐng)域,展現(xiàn)出廣闊的落地應(yīng)用潛力。
與通用大模型相比,垂類大模型參數(shù)量相對(duì)較小。但是因?yàn)橛幸恍┬袠I(yè)的核心數(shù)據(jù)和業(yè)務(wù)系統(tǒng)的生產(chǎn)數(shù)據(jù)參與,所以在相應(yīng)行業(yè)解決問題更為高效、直接。
從《案例集》來看,在金融、教育、醫(yī)療等領(lǐng)域,已經(jīng)有不少公司發(fā)布了相應(yīng)產(chǎn)品。
垂類大模型示例,數(shù)據(jù)來自:《2023大模型落地應(yīng)用案例集》
根據(jù)《案例集》入選案例的應(yīng)用場(chǎng)景,垂類大模型更針對(duì)于企業(yè)級(jí)應(yīng)用場(chǎng)景的垂直性和專業(yè)性要求,而在模型部署層面,更少的模型參數(shù)、訓(xùn)練數(shù)據(jù)意味著更少的成本,因此垂直應(yīng)用領(lǐng)域有望實(shí)現(xiàn)“萬(wàn)模齊發(fā)”。
《案例集》公布的名單,也恰恰驗(yàn)證了目前垂類大模型發(fā)展的一些趨勢(shì):
1. 加注端側(cè)、邊緣側(cè)應(yīng)用。輕量化參數(shù)能讓手機(jī)助手接入AI大模型能力。目前已有案例包括OPPO的小布助手、華為的智能助手小藝等等。
2. 更傾向于“解決方案”式的交付方式。由于垂類大模型接受了大量特定領(lǐng)域的數(shù)據(jù)和知識(shí),因此可以基于領(lǐng)域知識(shí)生成更具深度的解決方案。例如ChatDD 新一代對(duì)話式藥物研發(fā)助手,面向游戲行業(yè)的圖像內(nèi)容生成式大模型等等。
3. 大模型開始向多模態(tài)領(lǐng)域發(fā)展。多模態(tài)意味著豐富的數(shù)據(jù)形式,包含視覺、聽覺和時(shí)序信息。對(duì)于大模型模型來說,這意味著可以從多模態(tài)中提取和學(xué)習(xí)更多維度的信息。類似于《案例集》中的單晶爐自動(dòng)化工藝識(shí)別多模態(tài)模型,相信未來將會(huì)出現(xiàn)更多。
4. “通用+垂直”模型互相融通的態(tài)勢(shì)。隨著AI技術(shù)的發(fā)展,不同類型的模型之間的界限變得越來越模糊。例如,一些通用模型開始整合垂直領(lǐng)域的知識(shí),而一些垂直模型也開始利用通用模型的技術(shù)來增強(qiáng)其功能。例如百川大模型在娛樂領(lǐng)域的應(yīng)用。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 史岱君 
-
“中國(guó)首艘、遠(yuǎn)超美日”,力爭(zhēng)率先鉆穿地殼
2023-12-29 15:42 科技前沿 -
陸地探測(cè)一號(hào)01組衛(wèi)星正式投入使用
2023-12-29 13:57 航空航天 -
以軍殺害3名人質(zhì)前,誤認(rèn)為“求救聲是哈馬斯伏擊”
2023-12-29 08:12 巴以恩仇錄 -
我國(guó)學(xué)者首次建立從端粒到端粒的中國(guó)人全基因組
2023-12-29 07:44 -
能夠拍攝天體“彩色紀(jì)錄片”的巡天望遠(yuǎn)鏡“夢(mèng)飛”來了
2023-12-28 10:00 天文 -
面向太空的“超級(jí)CT”!最大空間環(huán)境地基監(jiān)測(cè)網(wǎng)如何建成?
2023-12-27 18:17 -
我國(guó)單體規(guī)模最大漂浮式光伏電站并網(wǎng)發(fā)電
2023-12-27 15:31 科技前沿 -
把星光變成照片,墨子巡天望遠(yuǎn)鏡運(yùn)行百天獲16500幅圖像
2023-12-27 11:31 科技前沿 -
我國(guó)最新一代深遠(yuǎn)海一體化大型風(fēng)電安裝船試航
2023-12-27 08:29 -
全球首創(chuàng)!我國(guó)成功研制可注射溶栓納米機(jī)器人
2023-12-26 10:28 科技前沿 -
幾分鐘成功復(fù)現(xiàn)諾獎(jiǎng)成果!AI科研機(jī)器要來了?
2023-12-26 07:37 -
我國(guó)成功發(fā)射天目一號(hào)氣象星座11~14星
2023-12-25 09:38 航空航天 -
逆轉(zhuǎn)催化劑“熟化”,中國(guó)科學(xué)家用新思路實(shí)現(xiàn)突破
2023-12-23 17:46 科技前沿 -
華為云CTO:云原生與AI疊加,將帶來七大技術(shù)“躍遷”
2023-12-23 10:16 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
美駐華大使稱“中國(guó)沒打算合作”,國(guó)家航天局發(fā)聲
2023-12-22 10:04 中美關(guān)系 -
祝賀!神舟十七號(hào)航天員乘組圓滿完成第一次出艙活動(dòng)
2023-12-21 21:56 航空航天 -
續(xù)集?“發(fā)現(xiàn)LK-99存在超導(dǎo)相的明確證據(jù)”
2023-12-21 09:39 -
2023全球十大工程:ChatGPT、中國(guó)空間站、鴻蒙…
2023-12-20 11:40 科技前沿 -
我國(guó)科學(xué)家開創(chuàng)新理論,研發(fā)出超薄高能效光學(xué)晶體
2023-12-19 14:44 -
應(yīng)對(duì)AI安全風(fēng)險(xiǎn),OpenAI要搞分級(jí)
2023-12-19 11:56 人工智能
相關(guān)推薦 -
美媒竟來碰瓷:解放軍這次演訓(xùn),“是在考驗(yàn)美國(guó)決心” 評(píng)論 57圍島集結(jié)、多向抵近!現(xiàn)場(chǎng)視頻來了 評(píng)論 160美國(guó)學(xué)者開始“流亡” 評(píng)論 126“中國(guó)走在這場(chǎng)國(guó)際救援最前線,美國(guó)呢?” 評(píng)論 133“再不打錢,歐洲在這個(gè)領(lǐng)域也會(huì)輸給中國(guó)” 評(píng)論 140最新聞 Hot
-
“斯塔默這么努力地討好特朗普,但沒回報(bào)”
-
特朗普最新對(duì)朝表態(tài)
-
美媒竟來碰瓷:解放軍這次演訓(xùn),“是在考驗(yàn)美國(guó)決心”
-
“一些政府打電話來問:中國(guó)已深耕十年,我們咋追?”
-
圍島集結(jié)、多向抵近!現(xiàn)場(chǎng)視頻來了
-
龍應(yīng)臺(tái):賴清德錯(cuò)了,留給臺(tái)灣的時(shí)間不多了
-
她又來:美歐相爭(zhēng),中國(guó)得利
-
“說好的補(bǔ)貼不作數(shù)了,美商務(wù)部長(zhǎng)還讓學(xué)學(xué)臺(tái)積電…”
-
美國(guó)學(xué)者開始“流亡”
-
美媒質(zhì)疑:這事真怪得著中國(guó)么?
-
“中國(guó)走在這場(chǎng)國(guó)際救援最前線,美國(guó)呢?”
-
“‘AI末日論’是美國(guó)的誤導(dǎo),我們的命運(yùn)要自己把握”
-
特朗普:4月2日將是“解放日”
-
馬斯克5月底離任?特朗普:我會(huì)挽留他
-
“馮德萊恩罵我半小時(shí),說我是白癡,就因?yàn)椤?/a>
-
“再不打錢,歐洲在這個(gè)領(lǐng)域也會(huì)輸給中國(guó)”
-