-
騰訊吳運聲:大模型訓練正在簡化,一張照片就能生成數(shù)智人
-
周毅是故意的還是不小心?
最后更新: 2025-01-21 12:58:14以下為本次演講全文:
尊敬的各位嘉賓、媒體朋友們,大家好,歡迎來到騰訊論壇!
我是騰訊的吳運聲,今天我想和大家分享下大模型等技術的發(fā)展,以及如何更快、更好地普惠給更多人。
作為國內(nèi)規(guī)格最高、影響力最大的技術盛會,世界人工智能大會已經(jīng)連續(xù)舉辦七屆,很多新的技術趨勢、創(chuàng)新方案、產(chǎn)業(yè)成果在這里發(fā)布,已經(jīng)成為人工智能技術發(fā)展的風向標。
接下來,我將從技術的發(fā)展、模型的迭代、工具的優(yōu)化以及場景的落地四個層面來分享下我們的一些思考和實踐。
在技術的發(fā)展這塊,有三個趨勢想和大家分享一下。
過去一段時間,大模型的發(fā)展,將人工智能技術推到了一個新的制高點。但在實際落地中,我們發(fā)現(xiàn),雖然單模態(tài)技術在某些場景下表現(xiàn)良好,但通過引入多模態(tài)能力,我們能夠擴展其應用范圍,使其在更廣泛的場景中同樣表現(xiàn)出色。
比如在識別和交互上,多模態(tài)大模型通過結合視覺與語言理解等能力,有效突破了此前的局限,實現(xiàn)了更精準的語義分析和全面的原因歸因。在實際場景中,這種技術能夠處理多樣化的用戶輸入,如文字、圖片等,尤其在汽車助手等企業(yè)知識服務等領域,提供了更深入的圖像內(nèi)容理解和更高質(zhì)量的交互體驗。
其次,在學習范式方面,傳統(tǒng)模型訓練受限于任務獨立性,和對大量標注數(shù)據(jù)的依賴,而通過零樣本/小樣本學習能夠很好地解決這類問題,簡化研發(fā)流程并加速AI技術的普惠。
舉個例子,以前我們?nèi)绻胍梢粋€數(shù)智人,必須錄制一段視頻,做一些高定制化的工作才能得以實現(xiàn)。而今天,利用zero-shot生成技術,僅需一張照片,無需任何定制,就可以得到一個栩栩如生的數(shù)智人。
而這個技術應用到工業(yè)質(zhì)檢等場景中,通過一個缺陷詞匯提示或一張缺陷圖片提示,即可實現(xiàn)缺陷質(zhì)檢,能夠大大提高檢測效率和準確性。比如,我們?yōu)槟除堫^新能源企業(yè)提供電池自動檢測機,解決質(zhì)檢難題。項目上線后,顯著提高了產(chǎn)品檢測能力,大大降低了該用戶的企業(yè)運營成本。
第三,在內(nèi)容呈現(xiàn)方面,隨著3D生成和視頻生成技術的不斷發(fā)展,用戶可以獲得更加沉浸式的體驗。
比如,3D生成技術通過模型不斷自學習,不再依賴人工調(diào)參,能夠打破傳統(tǒng)物理仿真的局限性,顯著提升生成內(nèi)容的速度和質(zhì)量。更豐富的3D生成內(nèi)容能夠為用戶帶來更加生動和真實的沉浸式體驗,比如單圖3D頭像生成等能力,能夠廣泛應用于電影動畫、增強現(xiàn)實、虛擬現(xiàn)實和視頻游戲等領域。
與此同時,視頻生成技術也在不斷進化,生成時長大幅增加的同時,品質(zhì)也得到了有效提升。比如,我們聯(lián)合《人民日報》打造的原創(chuàng)視頻《珍AI地球》,生成的視頻內(nèi)容真實、精細,在內(nèi)容理解、邏輯推理和畫面生成等方面表現(xiàn)都很不錯。
底層技術的不斷探索,也讓我們的模型不斷進化。去年9月,騰訊發(fā)布了全鏈路自研的騰訊混元大模型。目前,騰訊混元大模型已經(jīng)實現(xiàn)了較大的升級,架構也從稠密模型轉為MoE(混合專家模型),模型參數(shù)達到萬億級別,預訓練語料超過7萬億tokens。綜合算力、工程和算法上的自研創(chuàng)新,騰訊混元大模型已經(jīng)穩(wěn)居國內(nèi)大模型第一梯隊。混元的生圖、生視頻、生3D等多模態(tài)能力也處于業(yè)界領先地位。
目前,騰訊混元大模型的單日調(diào)用Tokens已經(jīng)達到千億級別。此前,我們也在騰訊云上開放了括混元-pro、混元-standard、混元-lite和混元standard 256k版本。
接下來,我們的混元-lite 256k版本以及vision多模態(tài)版本也會跟大家見面。同時,我們也將陸續(xù)上線代碼生成、角色扮演、functioncall等子模型和接口,滿足不同企業(yè)和開發(fā)者的需求。
具體到模型工具產(chǎn)品方面,大模型的研發(fā)、應用必須關注、解決具體業(yè)務場景,必須關注可用性和性價比。今年5月,我們推出了3個大模型PaaS產(chǎn)品:知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,希望能夠簡化數(shù)據(jù)工程和模型精調(diào)流程,幫助企業(yè)快速、輕松打造AI原生應用。
經(jīng)過兩個月時間的迭代,我們的這三款模型產(chǎn)品也進行了全新的能力提升。
首先是知識引擎,基于LLM+ RAG框架,我們發(fā)布了全新的多模態(tài)檢索能力,升級支持圖文互搜、以圖搜圖,能夠結合知識庫中檢索返回的圖文片段,給出圖文并茂的答案。
同時,我們進一步擴展了企業(yè)知識類型覆蓋面,升級了泛BI對話式數(shù)據(jù)問答體驗,支持超大表格、多表場景的多步驟推理、多條件篩選、求和計算,可擴展支持對接客戶主流數(shù)據(jù)庫。
圖像創(chuàng)作引擎這里,我們基于騰訊混元模型底座,實現(xiàn)了業(yè)界領先的AI圖像生成和編輯能力。我們的圖像風格目前已經(jīng)新增到33種,并推出了專用于頭像的生成模式,讓生成的風格化頭像既能保留個人相貌特色,又融入了多元藝術風格特征。同時還新增了商品背景生成、模特換裝和創(chuàng)意換裝等接口,大幅降低了營銷和影視行業(yè)的制作成本。
而視頻創(chuàng)作引擎這一次也進行了全新升級,帶來了不少好用、實用的功能體驗。首先,我們新增了超過20種熱門舞蹈動作,利用先進的3D建模技術和背部生成技術,使得圖片中的角色能夠非常流暢地進行轉身舞蹈,甚至支持多人舞蹈的復雜編排,這在行業(yè)內(nèi)屬于首創(chuàng)。
其次,我們的視頻風格化功能借助面部增強技術,能夠逼真還原面部細節(jié)與表情,這在行業(yè)里也是比較領先的。另外,我們的視頻轉譯功能接入混元文生文大模型和TTS技術,也能大幅提升轉譯后音頻的自然度、相似度和語速效果。這些能力的升級既能增強視頻創(chuàng)作多樣性和表現(xiàn)力,也能為創(chuàng)作者拓展更大的創(chuàng)意空間。
同時,為了幫助企業(yè)用戶更便捷地打造專屬的模型應用,我們的機器學習平臺TI平臺也進行了全新升級。
首先,我們內(nèi)置了開源可擴展的數(shù)據(jù)構建pipeline,能夠幫助開發(fā)者高效進行數(shù)據(jù)準備。另外,我們還全面提升了數(shù)據(jù)標注能力,首創(chuàng)了基于Schema的標注方法,專為LLM和多模態(tài)大模型設計,非常靈活、好用。
平臺的精調(diào)訓練模塊以易用、穩(wěn)定和高效為核心,內(nèi)置多款主流大模型,支持一鍵啟動精調(diào),并通過三層穩(wěn)定機制及自研Angel框架,確保大規(guī)模訓練的連續(xù)性和性能提升。此外,我們還采用三階段模型評測流程,包括輕量體驗、客觀評測和主觀評測,確保模型訓練的精準性和真實反饋。
通過混元大模型底座、TI平臺、知識引擎等工具、產(chǎn)品的不斷迭代與發(fā)展,目前我們能夠圍繞辦公協(xié)同、知識管理、智能客服、營銷等全場景,為產(chǎn)業(yè)用戶提供全鏈路模型服務,幫助他們真正實現(xiàn)提質(zhì)增效和轉型升級。
比如,我們將知識引擎的能力應用于企點客服大模型文本機器人。在面向賬單查詢、退換貨這類復雜任務時,大模型機器人配置成本,相較傳統(tǒng)文本機器人減少50%。
再比如,騰訊樂享是服務于企業(yè)內(nèi)部的知識學習協(xié)作平臺,為企業(yè)提供知識管理、學習培訓、文化建設等服務,目前已經(jīng)服務了超過30萬家客戶,用戶超過1億。在結合騰訊自研大模型和知識引擎后,樂享實現(xiàn)了兩大場景的關鍵革新。
圍繞“知識生產(chǎn)端”,樂享結合大模型知識引擎,升級了“智能寫作”能力,一句話就讓AI幫你完成寫作?!爸悄苌伞?,可以讓AI自動生成知識點、生成考題,解決了培訓部門不懂業(yè)務、業(yè)務部門不懂培訓的難題,提升培訓效率。
圍繞“知識消費端“,還推出”智能問答“,無需訓練即可讓AI回答內(nèi)部業(yè)務知識,大幅提升知識獲取效率,又繼承了每個文檔的細分權限,做到千人千面的問答。比如,一個擁有薪酬權限的員工問“薪酬怎么算”,AI會給出詳細回答,一個沒有權限的員工問,AI則回答“抱歉,不清楚”。
在產(chǎn)業(yè)落地方面,本著優(yōu)勢互補的原則,我們和上海市數(shù)字醫(yī)學創(chuàng)新中心開展合作,共研醫(yī)學大模型,目前在瑞金醫(yī)院實現(xiàn)了總檢報告和電子病歷生成等相關項目的落地應用。以體檢報告生成為例,平均每5秒即可自動生成一份總檢報告,為醫(yī)生節(jié)約50%+的撰寫時間。
在文娛行業(yè),閱文集團已經(jīng)應用大模型文生文能力,為作家提供AI輔助寫作能力,包括描寫靈感、大綱提取和角色提取等;應用大模型文生圖能力,用于連載書插圖制作等內(nèi)容。
但與此同時,他們也遇到了一些模型應用難題,一來算法和工程團隊精力有限,模型數(shù)量多迭代快,自行搭建推理集群和服務平臺,模型更新復雜;二來推理成本高昂,推理速度已達瓶頸,千百億級別模型推理部署,推理吞吐和時延存在瓶頸。
而通過騰訊云TI平臺的應用,在模型訓練方面,有效降低了訓練配置難度。以前更多是通過編寫代碼等復雜配置去提交對應訓練任務,做任務管理;現(xiàn)在只需要在TI平臺上做一些點選的工作,就可以快速開啟訓練任務;在模型推理方面,通過我們的平臺加速框架,幫助閱文實現(xiàn)了在相同資源條件下,內(nèi)容產(chǎn)出的速度變得更快;另外,平臺還提供了直觀的監(jiān)控和管理工具,幫助客戶輕松管理任務和資源。
產(chǎn)業(yè)落地之外,我們也看到大模型在科學計算、文化研究方面的價值。2021年,我們聯(lián)合國家天文臺,發(fā)起了“探星計劃”,我們希望通過人工智能技術,提升天文發(fā)現(xiàn)和科研的效率。
截至目前,通過我們的AI技術助力,從巡天觀測數(shù)據(jù)中發(fā)現(xiàn)了3顆快速射電暴、41顆脈沖星??焖偕潆姳┦悄壳疤煳慕缪芯繜狳c,相比脈沖星,快速射電暴因發(fā)現(xiàn)時間晚、AI訓練數(shù)據(jù)少、出現(xiàn)頻率低,發(fā)現(xiàn)難度相比脈沖星要大很多。為此,我們團隊通過設計全新的端到端AI算法,引入多示例學習和大模型注意力機制,顯著提升了模型精度和數(shù)據(jù)處理速度。
在文化領域,此前我們與內(nèi)外部多個部門攜手合作,將文字檢測、摹本生成、字形匹配等多種AI算法,綜合應用于甲骨文研究。今天,我也宣布將全球最大的甲骨文多模態(tài)數(shù)據(jù)集正式開源。該數(shù)據(jù)集包含一萬片甲骨的拓片、摹本,以及甲骨單字對應位置、對應字頭、對應釋文以及辭例分組、釋讀順序等數(shù)據(jù)。
基于該數(shù)據(jù)集,研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數(shù)字化和智能化。
最后,無論是產(chǎn)業(yè)落地還是科學、文化探索,AI大模型技術的發(fā)展離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建。后續(xù),我也希望能夠與更多同行者一道,推進科技賦能與產(chǎn)業(yè)創(chuàng)新,共創(chuàng)、共 建、共享智能美好未來,謝謝大家。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
- 責任編輯: 周毅 
-
羅曉任中國商飛黨委副書記、董事
2025-01-20 21:01 大公司 -
黃仁勛現(xiàn)身北京,稱華為三折疊“難以置信”
2025-01-20 18:15 觀網(wǎng)財經(jīng)-科創(chuàng) -
榮耀中國區(qū)CMO將離職
2025-01-20 16:32 觀網(wǎng)財經(jīng)-科創(chuàng) -
前華為悍將掛帥,榮耀劍指高端化和全球化
2025-01-20 15:15 觀網(wǎng)財經(jīng)-科創(chuàng) -
中國折疊屏市場罕見下滑,華為榮耀vivo位列去年前三
2025-01-20 14:10 觀網(wǎng)財經(jīng)-科創(chuàng) -
華為2024年分紅方案公布,收益率18%
2025-01-20 10:11 觀網(wǎng)財經(jīng)-科創(chuàng) -
事關國補!蘋果華為等多款手機降價至6000元以下
2025-01-20 09:43 觀網(wǎng)財經(jīng)-科創(chuàng) -
TikTok向美國用戶推送暫停服務通知
2025-01-19 10:57 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
馬斯克要收購英特爾?
2025-01-18 14:48 觀網(wǎng)財經(jīng)-科創(chuàng) -
荷蘭決定“隱藏”光刻機巨頭對華銷售情況
2025-01-18 13:24 觀網(wǎng)財經(jīng)-科創(chuàng) -
龍芯中科去年凈利大跌88%,預虧超6億
2025-01-18 09:57 觀網(wǎng)財經(jīng)-科創(chuàng) -
日本壓上國運的氫能源,出路只能在中國?
2025-01-17 18:48 觀察者頭條 -
美企獲巨額補貼低價對華出口芯片,中方將依法啟動調(diào)查
2025-01-17 18:27 觀網(wǎng)財經(jīng)-科創(chuàng) -
黃仁勛忙著訪問中國,將缺席特朗普就職典禮
2025-01-17 18:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
趙明辭任榮耀CEO:人生最艱難的決定
2025-01-17 17:18 觀網(wǎng)財經(jīng)-科創(chuàng) -
采礦業(yè)史上最大并購案要來了?傳力拓與嘉能可已初步談判
2025-01-17 15:26 產(chǎn)業(yè)萬象 -
淘寶已成為2025年春晚獨家電商互動平臺
2025-01-17 14:30 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
國家統(tǒng)計局公布去年12月70城房價,新房環(huán)比漲價城市增加至23個
2025-01-17 14:18 -
未來變成美積電? 臺積電董事長稱“門都沒有”
2025-01-17 11:36 觀網(wǎng)財經(jīng)-科創(chuàng) -
2024年全國固投增長3.2%,外企投資下降10%
2025-01-17 10:50 中國經(jīng)濟
相關推薦 -
-
馬克龍:別天真了!歐盟要暫停對美投資 評論 32“果然,中國說對了” 評論 245“特朗普會讓世界團結起來,減少對美依賴” 評論 218“剛剛,我看到了未來,它不在美國” 評論 163特朗普竟對中國征收34%“對等關稅” 評論 956最新聞 Hot
-
尹錫悅被罷免
-
馬克龍:別天真了!歐盟要暫停對美投資
-
對中國進口產(chǎn)品征收關稅,特朗普政府被起訴
-
“特朗普想得很美,但我老死前能不能看到就不知道了”
-
美聯(lián)航一波音737客機在空中起火
-
加拿大對美國出手:25%!
-
逃跑的黑熊,找到了
-
“美國這么做,堵不住我的嘴”
-
“對等關稅”竟是這么算的?經(jīng)濟學家集體傻眼
-
“果然,中國說對了”
-
加拿大發(fā)愁:躲過子彈,卻撞上坦克
-
內(nèi)塔尼亞胡來了,匈牙利退了
-
“禁令之前就有,但伯恩斯離任前擴大了范圍”
-
“地球上沒一個地方是安全的”
-
“美國是特朗普關稅政策下的最大輸家”
-
“對臺灣地區(qū)沖擊明顯,非??膳隆?/a>
-