-
“超級(jí)有用”的AI,被百度做成了
-
張廣凱13764468101
大模型,怎么才叫成了?
11月12日的2024百度世界大會(huì)上,李彥宏拋出這樣一個(gè)問(wèn)題。
“沒(méi)有應(yīng)用,基礎(chǔ)模型不值一提”,是李彥宏一貫的觀點(diǎn)。在他看來(lái),應(yīng)用落地是衡量大模型的最佳標(biāo)準(zhǔn),當(dāng)一個(gè)大模型的API日均調(diào)用量達(dá)到20億,就可以說(shuō)它成了。
而今年9月以來(lái),百度文心大模型的日均API調(diào)用量出現(xiàn)爆發(fā)式增長(zhǎng),已達(dá)到15億水平,短短半年增長(zhǎng)7.5倍。
如此看來(lái),百度大模型真的快成了。
百度在AI大模型落地應(yīng)用上的領(lǐng)先地位,也得到第三方數(shù)據(jù)支持。
IDC報(bào)告顯示,2024年上半年,百度智能云以32.4%的市場(chǎng)份額,位居中國(guó)MaaS市場(chǎng)第一。與此同時(shí),2024年上半年中國(guó)AI大模型解決方案市場(chǎng),百度智能云營(yíng)收占比達(dá)17.0%,位居市場(chǎng)第一。
談到大模型,外界往往有種誤解,認(rèn)為基礎(chǔ)大模型、GPU硬件的研發(fā)才是硬科技,做應(yīng)用只是跟隨;但深入到技術(shù)層面就會(huì)發(fā)現(xiàn),想要實(shí)現(xiàn)大模型的落地應(yīng)用,挑戰(zhàn)并不比大模型本身更小。
“快成了”的百度大模型,做對(duì)了什么?
“大模型已基本解決幻覺(jué)問(wèn)題”
當(dāng)兩年前ChatGPT-3橫空出世,盡管其能力已經(jīng)足夠讓人驚艷,但“一本正經(jīng)地胡說(shuō)八道”仍然時(shí)有出現(xiàn)。
這種現(xiàn)象被稱為“幻覺(jué)”,如果不能把“幻覺(jué)”概率降到足夠低,大模型就無(wú)法真正從一個(gè)好用的工具變成真正的智能伙伴。
為了解決幻覺(jué)問(wèn)題,百度憑借搜索引擎的技術(shù)積累,較早引入了檢索增強(qiáng)機(jī)制。即通過(guò)搜索互聯(lián)網(wǎng)上已有的人類知識(shí),來(lái)幫助大模型給出更準(zhǔn)確的回答。
如今,檢索增強(qiáng)在文本生成領(lǐng)域的應(yīng)用已經(jīng)較為成熟,而百度又將精力投向了文生圖。
從下圖可以看出,普通AI大模型生成的物體(左側(cè))相比于現(xiàn)實(shí)物體(右側(cè)),往往還會(huì)存在明顯幻覺(jué),將天壇的三層結(jié)構(gòu)變成了四層。
為此,百度開(kāi)發(fā)了檢索增強(qiáng)的文生圖技術(shù)iRAG(image based RAG),將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,可以生成各種超真實(shí)的圖片,“整體效果遠(yuǎn)遠(yuǎn)超過(guò)文生圖原生系統(tǒng),去除了機(jī)器味兒”。
李彥宏現(xiàn)場(chǎng)展示了一幅由文心大模型生成的大眾攬巡汽車飛躍長(zhǎng)城的圖片。通過(guò)文心iRAG技術(shù),無(wú)論是這款特定型號(hào)汽車的車型車標(biāo)、還是作為背景的長(zhǎng)城,均未出現(xiàn)錯(cuò)誤或變形的幻覺(jué)問(wèn)題。同時(shí)展示的“愛(ài)因斯坦環(huán)游世界”圖片中,愛(ài)因斯坦和各個(gè)背景景點(diǎn)的結(jié)合也與真實(shí)世界高度相似,質(zhì)感接近照片。
?李彥宏指出:“過(guò)去24個(gè)月,AI行業(yè)的最大變化是什么?是大模型基本消除了幻覺(jué)?!?
解決幻覺(jué)問(wèn)題以后,AI大模型終于可以快速走向智能體,迎接AI原生應(yīng)用的大爆發(fā)。
例如百度文庫(kù)和百度網(wǎng)盤聯(lián)合打造的工具類智能體“自由畫布”,讓用戶可以在一塊類似“畫布”的界面上自由拖拽文檔、音視頻等富媒體素材,迅速生成多模態(tài)內(nèi)容。
更讓人驚艷的,是李彥宏提前劇透的無(wú)代碼編程工具“秒噠”,由大模型直接生成代碼,不需要人寫一行代碼。
“一個(gè)人通過(guò)自然語(yǔ)言交互,就可以完成一套系統(tǒng)的搭建,”李彥宏指出,這意味著每個(gè)人自己就能指揮多個(gè)智能體來(lái)協(xié)同完成任務(wù),“只要有想法,你就可以心想事成,我們將迎來(lái)一個(gè)前所未有的,只靠想法就能賺錢的時(shí)代。”
AI算力的另一場(chǎng)硬實(shí)力競(jìng)爭(zhēng)
AI幻覺(jué)的大幅降低,不僅讓百度自身的AI應(yīng)用快速進(jìn)化,也能夠讓更多行業(yè)放心用上大模型。不過(guò)對(duì)于行業(yè)落地而言,便宜好用的算力同AI能力本身一樣重要。
因此在談應(yīng)用之前,我們不妨先談?wù)劵A(chǔ)設(shè)施。
得算力者得天下,是大模型時(shí)代的共識(shí)。
這樣的共識(shí)讓GPU企業(yè)一飛沖天,也讓單卡算力成為市場(chǎng)追逐的熱點(diǎn)。不過(guò)人們往往忽視了,整個(gè)算力集群的實(shí)際性能,并不簡(jiǎn)單等于單卡算力之和。
如果說(shuō)CPU 是一個(gè)很復(fù)雜的大腦,GPU就是數(shù)量巨大的機(jī)械臂組合。GPU內(nèi)的每一個(gè)計(jì)算核心所做的工作都很簡(jiǎn)單,但真正的難度在于如何同時(shí)指揮這么多“機(jī)械臂”。
正如戰(zhàn)場(chǎng)上需要及時(shí)把指令傳達(dá)給每一個(gè)士兵,GPU核心之間的通信效率才是發(fā)揮性能的關(guān)鍵。
單個(gè)GPU內(nèi)的通信已經(jīng)會(huì)延緩計(jì)算速度,而在萬(wàn)卡集群之中,GPU之間的通信效率還會(huì)有數(shù)量級(jí)的下降,如果說(shuō)機(jī)內(nèi)通信帶寬是50的話,機(jī)間可能就只有2或3。
顯卡加速一直都是GPU應(yīng)用中不容忽視的部分,如果做不好加速,萬(wàn)卡集群的利用率甚至可能低至10%,90%的算力都被白白浪費(fèi)。
英偉達(dá)70%的人力都用于軟件開(kāi)發(fā),人們說(shuō),英偉達(dá)真正的壁壘是基于 CUDA的龐大加速庫(kù)。
因此,除了單卡算力之外,集群效率也是中美之間圍繞算力的另一場(chǎng)硬實(shí)力競(jìng)爭(zhēng)。
在這場(chǎng)競(jìng)爭(zhēng)中,百度已經(jīng)用百舸4.0平臺(tái)給出了萬(wàn)卡規(guī)模上的優(yōu)異答卷。
百度集團(tuán)執(zhí)行副總裁沈抖在不久前的云智大會(huì)上曾表示,百舸4.0預(yù)置了主流的大模型訓(xùn)練工具,能夠?qū)崿F(xiàn)工具層面的秒級(jí)部署,并將萬(wàn)卡集群運(yùn)行準(zhǔn)備時(shí)間從幾周縮減至1小時(shí),極大地提升部署效率,縮短業(yè)務(wù)上線周期。
穩(wěn)定性方面,百舸4.0有效訓(xùn)練時(shí)長(zhǎng)占比99.5%以上,業(yè)界領(lǐng)先,極大地節(jié)約了客戶算力與時(shí)間成本。此外,通過(guò)在集群設(shè)計(jì)、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列創(chuàng)新,百舸4.0大幅提升了集群的模型訓(xùn)練效率,整體性能相比業(yè)界平均水平提升高達(dá)30%。
而在美國(guó)的算力限制下,中國(guó)算力平臺(tái)還不得不面臨一個(gè)特殊難題——需要使用不同規(guī)格的顯卡搭建異構(gòu)集群,進(jìn)行多芯混訓(xùn)
為此,百舸將不同地點(diǎn)、不同規(guī)模的異構(gòu)算力進(jìn)行統(tǒng)一管理,構(gòu)建起多芯資源池。當(dāng)業(yè)務(wù)提交工作負(fù)載時(shí),可自動(dòng)進(jìn)行芯片選型,依據(jù)集群剩余的芯片資源,選擇性價(jià)比最高的芯片來(lái)運(yùn)行任務(wù),從而最大化地利用集群的剩余資源。最終,可實(shí)現(xiàn)高達(dá)95%的萬(wàn)卡多芯混合訓(xùn)練效能。
做好國(guó)產(chǎn)大模型的基礎(chǔ)設(shè)施
憑借高效的百舸AI異構(gòu)算力平臺(tái),百度不僅持續(xù)升級(jí)自己的文心大模型,也在為更多中國(guó)AI企業(yè)提供服務(wù)。
教育無(wú)疑是AI應(yīng)用最有意義的領(lǐng)域,但是對(duì)AI的準(zhǔn)確率也提出了更高要求,這就需要深耕教育領(lǐng)域的企業(yè)基于垂直數(shù)據(jù)來(lái)訓(xùn)練模型。
對(duì)于好未來(lái)這樣的企業(yè)來(lái)說(shuō),自己去購(gòu)買顯卡搭建算力集群的投入是難以承受的,而百度百舸為好未來(lái)自研“九章大模型(MathGPT)”早期高效低成本“跑起來(lái)”提供了關(guān)鍵支撐作用。
基于百度百舸平臺(tái),好未來(lái)可以快速、方便的創(chuàng)建出千卡級(jí)別的訓(xùn)推任務(wù)集群。算力方面,集群最大可支撐 16000 GPU卡的規(guī)模;存儲(chǔ)方面,適用于大規(guī)模深度學(xué)習(xí)訓(xùn)練場(chǎng)景,可提供亞毫秒級(jí)(300us)的時(shí)延,支持百萬(wàn)級(jí) IOPS,服務(wù)可用性不低于99.95%。
百舸還提供了強(qiáng)大的加速能力,LLaMA2系列、GLM系列等多尺寸模型都實(shí)現(xiàn)了訓(xùn)練指標(biāo)的最佳實(shí)踐,千卡任務(wù)加速比保持在90%,訓(xùn)練吞吐與大模型訓(xùn)練理論值相當(dāng)。
百度自身利用百舸訓(xùn)練文心大模型的成熟經(jīng)驗(yàn),也能夠幫助其它大模型企業(yè)快速訓(xùn)練。
成立于2023年3月的生數(shù)科技,僅僅一年后就發(fā)布了被稱為“國(guó)產(chǎn)Sora”的視頻生成大模型Vidu。
在影響用戶體驗(yàn)的推理速度層面,Vidu實(shí)現(xiàn)了業(yè)界最快的實(shí)測(cè)推理速度,生成一段4秒片段只需30秒。而市面上的主流 AI視頻工具在生成4秒左右的視頻片段時(shí),用戶通常需要等待1到5分鐘,甚至更長(zhǎng)。
傳統(tǒng)行業(yè)的生產(chǎn)力飛升
在大模型落地層面,直接由大模型催生的AI原生應(yīng)用看上去酷炫,但是不要忽視了,AI對(duì)千行百業(yè)傳統(tǒng)生產(chǎn)流程的改造可能會(huì)創(chuàng)造更大價(jià)值。
李彥宏曾舉例說(shuō),“Microsoft 365 Copilot 一年?duì)I收 50 億美元,比 OpenAI 全年的收入都大很多倍。僅就對(duì)現(xiàn)有產(chǎn)品的改造而言,就已經(jīng)創(chuàng)造出來(lái)這么多新的價(jià)值。”
因此在李彥宏看來(lái),“百度不是要推出一個(gè)‘超級(jí)應(yīng)用’,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)百萬(wàn)‘超級(jí)有用’的應(yīng)用?!?
在中國(guó),典型的AI應(yīng)用場(chǎng)景是智能客服,但是傳統(tǒng)的智能客服普遍需要人工提前準(zhǔn)備好現(xiàn)成的FAQ,對(duì)用戶問(wèn)題的理解能力也非常有限。而在大模型的加持下,智能客服對(duì)自然語(yǔ)言的理解能力出現(xiàn)了質(zhì)的飛躍,無(wú)論是應(yīng)用范圍還是部署成本都明顯改善,是大模型對(duì)于現(xiàn)有產(chǎn)品改造的絕佳案例。
百勝中國(guó)是國(guó)內(nèi)最大的餐飲公司,其基于文心大模型打造的AI智能客服系統(tǒng),已經(jīng)在為旗下包括肯德基在內(nèi)的多個(gè)品牌提供服務(wù)。
目前,AI客服每天能夠?yàn)榘賱僦袊?guó)處理超過(guò)15萬(wàn)次客服溝通任務(wù),問(wèn)題解決率高達(dá)90%;輔助人工客服快速總結(jié)溝通歷史,整理歸納訴求,提供建議回復(fù)話術(shù)、一鍵發(fā)送等功能,提升客服員工產(chǎn)能效率10%。
杭州全診醫(yī)學(xué)基于千帆平臺(tái)和文心大模型打造了AI醫(yī)療助理應(yīng)用,則能夠在導(dǎo)診、預(yù)診、診間、入院、手術(shù)、隨訪等全階段服務(wù)醫(yī)生患者。以輔助醫(yī)生撰寫病歷為例,全診醫(yī)學(xué)通過(guò)使用20萬(wàn)份精標(biāo)病歷數(shù)據(jù)對(duì)大模型進(jìn)行了精調(diào),使AI醫(yī)療助理的醫(yī)學(xué)用語(yǔ)更準(zhǔn)確、更規(guī)范,大幅提升病歷內(nèi)容質(zhì)量。病歷生成的準(zhǔn)確度提升了45%,醫(yī)生的接診量提高了20%,造福更多病患。
大模型的應(yīng)用不僅限于自然語(yǔ)言理解,也能夠深入改造傳統(tǒng)企業(yè)的生產(chǎn)環(huán)節(jié)。
在能源電力行業(yè),國(guó)家電網(wǎng)正在圍繞文心大模型、千帆平臺(tái),結(jié)合電力行業(yè)高質(zhì)量數(shù)據(jù),聯(lián)合百度共創(chuàng)電力行業(yè)大模型基礎(chǔ)底座,并在調(diào)度、設(shè)備、營(yíng)銷等六大專業(yè)領(lǐng)域深入探索。目前,已經(jīng)在電力設(shè)備運(yùn)檢、供電服務(wù)等電力行業(yè)核心場(chǎng)景成功完成應(yīng)用落地。
得益于在全棧AI技術(shù)、產(chǎn)品創(chuàng)新和產(chǎn)業(yè)落地方面的持續(xù)投入,百度智能云擁有中國(guó)最廣最深的大模型產(chǎn)業(yè)落地規(guī)模,超60%的央企正在使用百度智能云進(jìn)行AI創(chuàng)新。百度智能云千帆大模型平臺(tái)已經(jīng)幫助客戶精調(diào)了3.3萬(wàn)個(gè)模型、開(kāi)發(fā)了77萬(wàn)個(gè)企業(yè)應(yīng)用、文心大模型日均調(diào)用量超過(guò)15億次。
這就是李彥宏說(shuō)出“應(yīng)用來(lái)了”的底氣:“我是軟件工程師出身,國(guó)外有一種說(shuō)法叫‘軟件吞噬世界’。但我認(rèn)為,這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。AI時(shí)代,應(yīng)用創(chuàng)造世界。所以請(qǐng)大家和我一起見(jiàn)證,AI applications creating the world。”
- 責(zé)任編輯: 張廣凱 
-
普通人就能寫程序!百度將推出無(wú)代碼工具“秒噠”
2024-11-12 19:14 -
為避免海外“相殘”,這些中企正在行動(dòng)起來(lái)
2024-11-12 19:00 觀察者頭條 -
全紅嬋:巴黎周期長(zhǎng)胖了,多虧……
2024-11-12 17:35 -
中美競(jìng)爭(zhēng)壓力下,日本擬砸10萬(wàn)億日元扶持半導(dǎo)體
2024-11-12 17:11 觀網(wǎng)財(cái)經(jīng)-海外 -
滬指震蕩調(diào)整跌1.39%,保險(xiǎn)、軍工股走弱,醫(yī)療、醫(yī)藥股集體反彈
2024-11-12 15:29 金融觀察 -
傳蘋果將進(jìn)軍智能家居網(wǎng)絡(luò)攝像頭市場(chǎng)
2024-11-12 15:05 觀網(wǎng)財(cái)經(jīng)-海外 -
中國(guó)內(nèi)地買家可使用支付寶進(jìn)行eBay購(gòu)物
2024-11-12 14:00 觀網(wǎng)財(cái)經(jīng)-海外 -
2024珠海論壇之商業(yè)航天發(fā)展論壇成功舉辦
2024-11-12 12:54 -
長(zhǎng)江存儲(chǔ)“雙11戰(zhàn)績(jī)”首超三星
2024-11-12 11:19 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
雙11成績(jī)單公布,天貓、京東刷新紀(jì)錄
2024-11-12 11:15 雙11節(jié) -
在浙江這座小城里,窺見(jiàn)京東又便宜又好的秘密
2024-11-12 08:22 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
外商熱議進(jìn)博會(huì):國(guó)家館搶手不夠分,“每家企業(yè)只能用9平米”
2024-11-11 20:45 進(jìn)博會(huì) -
人均客單價(jià)400元,知名日料赤坂亭被曝門店全關(guān)
2024-11-11 18:21 -
臺(tái)官員:臺(tái)積電目前不能在海外生產(chǎn)2nm芯片
2024-11-11 17:58 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
你的快遞已經(jīng)起飛,杭州投用多條無(wú)人機(jī)物流配送線
2024-11-11 17:30 -
政策效果顯現(xiàn),10月M1、M2增速企穩(wěn)回升
2024-11-11 16:58 觀網(wǎng)財(cái)經(jīng)-宏觀 -
消息稱LG與SpaceX達(dá)成協(xié)議,將為星艦開(kāi)發(fā)電池
2024-11-11 16:52
相關(guān)推薦 -
-
“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…” 評(píng)論 70“日企抱團(tuán)是絕望之舉,中國(guó)工廠效率質(zhì)量都是第一” 評(píng)論 113“她下月訪華,盡管特朗普?qǐng)F(tuán)隊(duì)表達(dá)了擔(dān)憂” 評(píng)論 53最新聞 Hot
-
“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國(guó)工廠效率質(zhì)量都是第一”
-
“中國(guó)有能力讓夢(mèng)想照進(jìn)現(xiàn)實(shí),將贏得史詩(shī)般競(jìng)爭(zhēng)”
-
被災(zāi)民暴罵到當(dāng)場(chǎng)破防,馬克龍發(fā)飆:你該慶幸你在法國(guó)!
-
美高校敦促國(guó)際學(xué)生抓緊回來(lái):萬(wàn)一把中印拉黑名單呢
-
美國(guó)政府“逃過(guò)一劫”
-
“澤連斯基要求歐盟新外長(zhǎng):對(duì)華批評(píng)要降調(diào)”
-
澳大利亞來(lái)了,中國(guó)就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國(guó)剛公布新任大使,特朗普顧問(wèn)就痛罵:傻X
-
“來(lái)自中國(guó)的老大哥能確保我們…”
-
俄羅斯的報(bào)復(fù)來(lái)了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國(guó),“涉華條款全刪了”
-
中國(guó)“光伏OPEC”發(fā)文嚴(yán)厲質(zhì)問(wèn)央企,怎么回事?
-
“最后一道貿(mào)易障礙,中國(guó)解除了!”
-