被夫の上司に犯中文字幕,中文字幕乱码2国语自产,被男狂揉吃奶高潮60分钟

APP下載

掃一掃

下載觀察者APP

騰訊吳運聲：大模型訓練正在簡化，一張照片就能生成數(shù)智人
- 周毅是故意的還是不小心？
分享到：

2024-07-08 13:36:45 字號：A- A A+ 來源：觀察者網(wǎng)

最后更新: 2025-01-21 12:58:14

以下為本次演講全文：

尊敬的各位嘉賓、媒體朋友們，大家好，歡迎來到騰訊論壇！

我是騰訊的吳運聲，今天我想和大家分享下大模型等技術的發(fā)展，以及如何更快、更好地普惠給更多人。

作為國內(nèi)規(guī)格最高、影響力最大的技術盛會，世界人工智能大會已經(jīng)連續(xù)舉辦七屆，很多新的技術趨勢、創(chuàng)新方案、產(chǎn)業(yè)成果在這里發(fā)布，已經(jīng)成為人工智能技術發(fā)展的風向標。

接下來，我將從技術的發(fā)展、模型的迭代、工具的優(yōu)化以及場景的落地四個層面來分享下我們的一些思考和實踐。

在技術的發(fā)展這塊，有三個趨勢想和大家分享一下。

過去一段時間，大模型的發(fā)展，將人工智能技術推到了一個新的制高點。但在實際落地中，我們發(fā)現(xiàn)，雖然單模態(tài)技術在某些場景下表現(xiàn)良好，但通過引入多模態(tài)能力，我們能夠擴展其應用范圍，使其在更廣泛的場景中同樣表現(xiàn)出色。

比如在識別和交互上，多模態(tài)大模型通過結合視覺與語言理解等能力，有效突破了此前的局限，實現(xiàn)了更精準的語義分析和全面的原因歸因。在實際場景中，這種技術能夠處理多樣化的用戶輸入，如文字、圖片等，尤其在汽車助手等企業(yè)知識服務等領域，提供了更深入的圖像內(nèi)容理解和更高質(zhì)量的交互體驗。

其次，在學習范式方面，傳統(tǒng)模型訓練受限于任務獨立性，和對大量標注數(shù)據(jù)的依賴，而通過零樣本/小樣本學習能夠很好地解決這類問題，簡化研發(fā)流程并加速AI技術的普惠。

舉個例子，以前我們?nèi)绻胍梢粋€數(shù)智人，必須錄制一段視頻，做一些高定制化的工作才能得以實現(xiàn)。而今天，利用zero-shot生成技術，僅需一張照片，無需任何定制，就可以得到一個栩栩如生的數(shù)智人。

而這個技術應用到工業(yè)質(zhì)檢等場景中，通過一個缺陷詞匯提示或一張缺陷圖片提示，即可實現(xiàn)缺陷質(zhì)檢，能夠大大提高檢測效率和準確性。比如，我們?yōu)槟除堫^新能源企業(yè)提供電池自動檢測機，解決質(zhì)檢難題。項目上線后，顯著提高了產(chǎn)品檢測能力，大大降低了該用戶的企業(yè)運營成本。

第三，在內(nèi)容呈現(xiàn)方面，隨著3D生成和視頻生成技術的不斷發(fā)展，用戶可以獲得更加沉浸式的體驗。

比如，3D生成技術通過模型不斷自學習，不再依賴人工調(diào)參，能夠打破傳統(tǒng)物理仿真的局限性，顯著提升生成內(nèi)容的速度和質(zhì)量。更豐富的3D生成內(nèi)容能夠為用戶帶來更加生動和真實的沉浸式體驗，比如單圖3D頭像生成等能力，能夠廣泛應用于電影動畫、增強現(xiàn)實、虛擬現(xiàn)實和視頻游戲等領域。

與此同時，視頻生成技術也在不斷進化，生成時長大幅增加的同時，品質(zhì)也得到了有效提升。比如，我們聯(lián)合《人民日報》打造的原創(chuàng)視頻《珍AI地球》，生成的視頻內(nèi)容真實、精細，在內(nèi)容理解、邏輯推理和畫面生成等方面表現(xiàn)都很不錯。

底層技術的不斷探索，也讓我們的模型不斷進化。去年9月，騰訊發(fā)布了全鏈路自研的騰訊混元大模型。目前，騰訊混元大模型已經(jīng)實現(xiàn)了較大的升級，架構也從稠密模型轉為MoE（混合專家模型），模型參數(shù)達到萬億級別，預訓練語料超過7萬億tokens。綜合算力、工程和算法上的自研創(chuàng)新，騰訊混元大模型已經(jīng)穩(wěn)居國內(nèi)大模型第一梯隊。混元的生圖、生視頻、生3D等多模態(tài)能力也處于業(yè)界領先地位。

目前，騰訊混元大模型的單日調(diào)用Tokens已經(jīng)達到千億級別。此前，我們也在騰訊云上開放了括混元-pro、混元-standard、混元-lite和混元standard 256k版本。

接下來，我們的混元-lite 256k版本以及vision多模態(tài)版本也會跟大家見面。同時，我們也將陸續(xù)上線代碼生成、角色扮演、functioncall等子模型和接口，滿足不同企業(yè)和開發(fā)者的需求。

具體到模型工具產(chǎn)品方面，大模型的研發(fā)、應用必須關注、解決具體業(yè)務場景，必須關注可用性和性價比。今年5月，我們推出了3個大模型PaaS產(chǎn)品：知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎，希望能夠簡化數(shù)據(jù)工程和模型精調(diào)流程，幫助企業(yè)快速、輕松打造AI原生應用。

經(jīng)過兩個月時間的迭代，我們的這三款模型產(chǎn)品也進行了全新的能力提升。

首先是知識引擎，基于LLM+ RAG框架，我們發(fā)布了全新的多模態(tài)檢索能力，升級支持圖文互搜、以圖搜圖，能夠結合知識庫中檢索返回的圖文片段，給出圖文并茂的答案。

同時，我們進一步擴展了企業(yè)知識類型覆蓋面，升級了泛BI對話式數(shù)據(jù)問答體驗，支持超大表格、多表場景的多步驟推理、多條件篩選、求和計算，可擴展支持對接客戶主流數(shù)據(jù)庫。

圖像創(chuàng)作引擎這里，我們基于騰訊混元模型底座，實現(xiàn)了業(yè)界領先的AI圖像生成和編輯能力。我們的圖像風格目前已經(jīng)新增到33種，并推出了專用于頭像的生成模式，讓生成的風格化頭像既能保留個人相貌特色，又融入了多元藝術風格特征。同時還新增了商品背景生成、模特換裝和創(chuàng)意換裝等接口，大幅降低了營銷和影視行業(yè)的制作成本。

而視頻創(chuàng)作引擎這一次也進行了全新升級，帶來了不少好用、實用的功能體驗。首先，我們新增了超過20種熱門舞蹈動作，利用先進的3D建模技術和背部生成技術，使得圖片中的角色能夠非常流暢地進行轉身舞蹈，甚至支持多人舞蹈的復雜編排，這在行業(yè)內(nèi)屬于首創(chuàng)。

其次，我們的視頻風格化功能借助面部增強技術，能夠逼真還原面部細節(jié)與表情，這在行業(yè)里也是比較領先的。另外，我們的視頻轉譯功能接入混元文生文大模型和TTS技術，也能大幅提升轉譯后音頻的自然度、相似度和語速效果。這些能力的升級既能增強視頻創(chuàng)作多樣性和表現(xiàn)力，也能為創(chuàng)作者拓展更大的創(chuàng)意空間。

同時，為了幫助企業(yè)用戶更便捷地打造專屬的模型應用，我們的機器學習平臺TI平臺也進行了全新升級。

首先，我們內(nèi)置了開源可擴展的數(shù)據(jù)構建pipeline，能夠幫助開發(fā)者高效進行數(shù)據(jù)準備。另外，我們還全面提升了數(shù)據(jù)標注能力，首創(chuàng)了基于Schema的標注方法，專為LLM和多模態(tài)大模型設計，非常靈活、好用。

平臺的精調(diào)訓練模塊以易用、穩(wěn)定和高效為核心，內(nèi)置多款主流大模型，支持一鍵啟動精調(diào)，并通過三層穩(wěn)定機制及自研Angel框架，確保大規(guī)模訓練的連續(xù)性和性能提升。此外，我們還采用三階段模型評測流程，包括輕量體驗、客觀評測和主觀評測，確保模型訓練的精準性和真實反饋。

通過混元大模型底座、TI平臺、知識引擎等工具、產(chǎn)品的不斷迭代與發(fā)展，目前我們能夠圍繞辦公協(xié)同、知識管理、智能客服、營銷等全場景，為產(chǎn)業(yè)用戶提供全鏈路模型服務，幫助他們真正實現(xiàn)提質(zhì)增效和轉型升級。

比如，我們將知識引擎的能力應用于企點客服大模型文本機器人。在面向賬單查詢、退換貨這類復雜任務時，大模型機器人配置成本，相較傳統(tǒng)文本機器人減少50%。

再比如，騰訊樂享是服務于企業(yè)內(nèi)部的知識學習協(xié)作平臺，為企業(yè)提供知識管理、學習培訓、文化建設等服務，目前已經(jīng)服務了超過30萬家客戶，用戶超過1億。在結合騰訊自研大模型和知識引擎后，樂享實現(xiàn)了兩大場景的關鍵革新。

圍繞“知識生產(chǎn)端”，樂享結合大模型知識引擎，升級了“智能寫作”能力，一句話就讓AI幫你完成寫作?！爸悄苌伞?，可以讓AI自動生成知識點、生成考題，解決了培訓部門不懂業(yè)務、業(yè)務部門不懂培訓的難題，提升培訓效率。

圍繞“知識消費端“，還推出”智能問答“，無需訓練即可讓AI回答內(nèi)部業(yè)務知識，大幅提升知識獲取效率，又繼承了每個文檔的細分權限，做到千人千面的問答。比如，一個擁有薪酬權限的員工問“薪酬怎么算”，AI會給出詳細回答，一個沒有權限的員工問，AI則回答“抱歉，不清楚”。

在產(chǎn)業(yè)落地方面，本著優(yōu)勢互補的原則，我們和上海市數(shù)字醫(yī)學創(chuàng)新中心開展合作，共研醫(yī)學大模型，目前在瑞金醫(yī)院實現(xiàn)了總檢報告和電子病歷生成等相關項目的落地應用。以體檢報告生成為例，平均每5秒即可自動生成一份總檢報告，為醫(yī)生節(jié)約50%+的撰寫時間。

在文娛行業(yè)，閱文集團已經(jīng)應用大模型文生文能力，為作家提供AI輔助寫作能力，包括描寫靈感、大綱提取和角色提取等；應用大模型文生圖能力，用于連載書插圖制作等內(nèi)容。

但與此同時，他們也遇到了一些模型應用難題，一來算法和工程團隊精力有限，模型數(shù)量多迭代快，自行搭建推理集群和服務平臺，模型更新復雜；二來推理成本高昂，推理速度已達瓶頸，千百億級別模型推理部署，推理吞吐和時延存在瓶頸。

而通過騰訊云TI平臺的應用，在模型訓練方面，有效降低了訓練配置難度。以前更多是通過編寫代碼等復雜配置去提交對應訓練任務，做任務管理；現(xiàn)在只需要在TI平臺上做一些點選的工作，就可以快速開啟訓練任務；在模型推理方面，通過我們的平臺加速框架，幫助閱文實現(xiàn)了在相同資源條件下，內(nèi)容產(chǎn)出的速度變得更快；另外，平臺還提供了直觀的監(jiān)控和管理工具，幫助客戶輕松管理任務和資源。

產(chǎn)業(yè)落地之外，我們也看到大模型在科學計算、文化研究方面的價值。2021年，我們聯(lián)合國家天文臺，發(fā)起了“探星計劃”，我們希望通過人工智能技術，提升天文發(fā)現(xiàn)和科研的效率。

截至目前，通過我們的AI技術助力，從巡天觀測數(shù)據(jù)中發(fā)現(xiàn)了3顆快速射電暴、41顆脈沖星?？焖偕潆姳┦悄壳疤煳慕缪芯繜狳c，相比脈沖星，快速射電暴因發(fā)現(xiàn)時間晚、AI訓練數(shù)據(jù)少、出現(xiàn)頻率低，發(fā)現(xiàn)難度相比脈沖星要大很多。為此，我們團隊通過設計全新的端到端AI算法，引入多示例學習和大模型注意力機制，顯著提升了模型精度和數(shù)據(jù)處理速度。

在文化領域，此前我們與內(nèi)外部多個部門攜手合作，將文字檢測、摹本生成、字形匹配等多種AI算法，綜合應用于甲骨文研究。今天，我也宣布將全球最大的甲骨文多模態(tài)數(shù)據(jù)集正式開源。該數(shù)據(jù)集包含一萬片甲骨的拓片、摹本，以及甲骨單字對應位置、對應字頭、對應釋文以及辭例分組、釋讀順序等數(shù)據(jù)。

基于該數(shù)據(jù)集，研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法，助推甲骨文研究加速數(shù)字化和智能化。

最后，無論是產(chǎn)業(yè)落地還是科學、文化探索，AI大模型技術的發(fā)展離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建。后續(xù)，我也希望能夠與更多同行者一道，推進科技賦能與產(chǎn)業(yè)創(chuàng)新，共創(chuàng)、共建、共享智能美好未來，謝謝大家。

本文系觀察者網(wǎng)獨家稿件，未經(jīng)授權，不得轉載。

首頁上一頁 1 2 余下全文
|

舉報
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報制度規(guī)范
確定取消
標簽騰訊 2024世界人工智能大會
- 責任編輯: 周毅
- 羅曉任中國商飛黨委副書記、董事
  
  2025-01-20 21:01 大公司
- 黃仁勛現(xiàn)身北京，稱華為三折疊“難以置信”
  
  2025-01-20 18:15 觀網(wǎng)財經(jīng)-科創(chuàng)
- 榮耀中國區(qū)CMO將離職
  
  2025-01-20 16:32 觀網(wǎng)財經(jīng)-科創(chuàng)
- 前華為悍將掛帥，榮耀劍指高端化和全球化
  
  2025-01-20 15:15 觀網(wǎng)財經(jīng)-科創(chuàng)
- 中國折疊屏市場罕見下滑，華為榮耀vivo位列去年前三
  
  2025-01-20 14:10 觀網(wǎng)財經(jīng)-科創(chuàng)
- 華為2024年分紅方案公布，收益率18%
  
  2025-01-20 10:11 觀網(wǎng)財經(jīng)-科創(chuàng)
- 事關國補！蘋果華為等多款手機降價至6000元以下
  
  2025-01-20 09:43 觀網(wǎng)財經(jīng)-科創(chuàng)
- TikTok向美國用戶推送暫停服務通知
  
  2025-01-19 10:57 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
- 馬斯克要收購英特爾？
  
  2025-01-18 14:48 觀網(wǎng)財經(jīng)-科創(chuàng)
- 荷蘭決定“隱藏”光刻機巨頭對華銷售情況
  
  2025-01-18 13:24 觀網(wǎng)財經(jīng)-科創(chuàng)
- 龍芯中科去年凈利大跌88%，預虧超6億
  
  2025-01-18 09:57 觀網(wǎng)財經(jīng)-科創(chuàng)
- 日本壓上國運的氫能源，出路只能在中國？
  
  2025-01-17 18:48 觀察者頭條
- 美企獲巨額補貼低價對華出口芯片，中方將依法啟動調(diào)查
  
  2025-01-17 18:27 觀網(wǎng)財經(jīng)-科創(chuàng)
- 黃仁勛忙著訪問中國，將缺席特朗普就職典禮
  
  2025-01-17 18:07 觀網(wǎng)財經(jīng)-科創(chuàng)
- 趙明辭任榮耀CEO：人生最艱難的決定
  
  2025-01-17 17:18 觀網(wǎng)財經(jīng)-科創(chuàng)
- 采礦業(yè)史上最大并購案要來了？傳力拓與嘉能可已初步談判
  
  2025-01-17 15:26 產(chǎn)業(yè)萬象
- 淘寶已成為2025年春晚獨家電商互動平臺
  
  2025-01-17 14:30 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
- 國家統(tǒng)計局公布去年12月70城房價，新房環(huán)比漲價城市增加至23個
  
  2025-01-17 14:18
- 未來變成美積電？臺積電董事長稱“門都沒有”
  
  2025-01-17 11:36 觀網(wǎng)財經(jīng)-科創(chuàng)
- 2024年全國固投增長3.2%，外企投資下降10%
  
  2025-01-17 10:50 中國經(jīng)濟
搜索

   觀察者頭條查看全部

馬克龍：別天真了！歐盟要暫停對美投資評論 32

“果然，中國說對了” 評論 245

“特朗普會讓世界團結起來，減少對美依賴” 評論 218

“剛剛，我看到了未來，它不在美國” 評論 163

特朗普竟對中國征收34%“對等關稅” 評論 956

   風聞 · 24小時最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

 去年4家國有大行個人住房貸款余額下降，7家股份制銀行余額增長

河南省委書記、省長一同會見順豐控股董事長王衛(wèi)

微信最新公告：攔截、下架

全國“最能生娃”省份排名出爐，廣東、河南、山東居前三

對中國進口產(chǎn)品征收關稅，特朗普政府被起訴

中央網(wǎng)信辦副主任王崧，調(diào)任河南省委常委

一年?交付10臺人形機器人，優(yōu)必選離盈利更遠了

加拿大對美國出手：25%！

騰訊吳運聲：大模型訓練正在簡化，一張照片就能生成數(shù)智人

羅曉任中國商飛黨委副書記、董事

黃仁勛現(xiàn)身北京，稱華為三折疊“難以置信”

榮耀中國區(qū)CMO將離職

前華為悍將掛帥，榮耀劍指高端化和全球化

中國折疊屏市場罕見下滑，華為榮耀vivo位列去年前三

華為2024年分紅方案公布，收益率18%

事關國補！蘋果華為等多款手機降價至6000元以下

TikTok向美國用戶推送暫停服務通知

馬斯克要收購英特爾？

荷蘭決定“隱藏”光刻機巨頭對華銷售情況

龍芯中科去年凈利大跌88%，預虧超6億

日本壓上國運的氫能源，出路只能在中國？

美企獲巨額補貼低價對華出口芯片，中方將依法啟動調(diào)查

黃仁勛忙著訪問中國，將缺席特朗普就職典禮

趙明辭任榮耀CEO：人生最艱難的決定

采礦業(yè)史上最大并購案要來了？傳力拓與嘉能可已初步談判

淘寶已成為2025年春晚獨家電商互動平臺

國家統(tǒng)計局公布去年12月70城房價，新房環(huán)比漲價城市增加至23個

未來變成美積電？臺積電董事長稱“門都沒有”

2024年全國固投增長3.2%，外企投資下降10%

尹錫悅被罷免

馬克龍：別天真了！歐盟要暫停對美投資

對中國進口產(chǎn)品征收關稅，特朗普政府被起訴

“特朗普想得很美，但我老死前能不能看到就不知道了”

美聯(lián)航一波音737客機在空中起火

加拿大對美國出手：25%！

逃跑的黑熊，找到了

“美國這么做，堵不住我的嘴”

“對等關稅”竟是這么算的？經(jīng)濟學家集體傻眼

“果然，中國說對了”

加拿大發(fā)愁：躲過子彈，卻撞上坦克

內(nèi)塔尼亞胡來了，匈牙利退了

“禁令之前就有，但伯恩斯離任前擴大了范圍”

“地球上沒一個地方是安全的”

“美國是特朗普關稅政策下的最大輸家”

“對臺灣地區(qū)沖擊明顯，非?？膳隆?/a>

騰訊吳運聲：大模型訓練正在簡化，一張照片就能生成數(shù)智人

騰訊吳運聲：大模型訓練正在簡化，一張照片就能生成數(shù)智人