在线观看av中文字幕不卡,久久九九久精品国产免费直播

APP下載

掃一掃

下載觀察者APP

謝耘：為什么要認真討論大語言模型的“理解”問題？
- 謝耘清華大學電子工程系博士，正高級工程師，國家科技進步二等獎獲得者
分享到：

2024-08-21 13:16:03 字號：A- A A+ 來源：觀察者網(wǎng)

【文/觀察者網(wǎng)專欄作者謝耘】

自今年初文生視頻大模型Sora引爆熱議后，本周美國軟件巨頭Adobe表示，將允許用戶在其旗下的視頻編輯軟件中使用包括OpenAI的Sora在內(nèi)的第三方生成式人工智能工具。

另外，馬斯克旗下人工智能公司xAI于近日推出首個多模態(tài)模型 Grok-1.5 Vision。

xAI 表示：除文本功能外，Grok還可以處理各種各樣的視覺信息，包括文檔、圖表、圖表、屏幕截圖、照片，并能進行多學科推理。xAI重點展示了Grok-1.5V的7個示例，包括：將手繪圖表轉(zhuǎn)換成Python代碼、看食品標簽計算卡路里、根據(jù)孩子的繪畫講睡前故事、解釋梗圖等。

馬斯克xAI的多模態(tài)模型Grok-1.5V

Sora 可以在每次 API 調(diào)用中為自然語言提示創(chuàng)建最多三種視頻變體。

無論在語言領(lǐng)域還是在視頻領(lǐng)域，它們都給出了讓許多人感到驚奇的結(jié)果，于是便出現(xiàn)了大量聳人聽聞的說法。其中一個核心的話題就是有人認為這些模型已經(jīng)具有了“理解”能力，它們能夠理解語言背后的邏輯，能夠理解物理世界的運動規(guī)律。

當談到“理解”的時候，有多少人知道自己心中的“理解”到底是什么？如果大家對于什么是“理解”都沒有共同認識的話，討論這些生成模型是否有“理解”能力就失去了意義。

“理解”是一個我們再熟悉不過的詞匯了，它同時也是智能意識領(lǐng)域中最基本與核心的問題之一。問題越基本，我們往往越熟視無睹，越覺得無需做什么解釋，其實把它說清楚就越困難。

從小到大，我們都在努力地去“理解”，也希望被別人理解。可是好像卻沒有誰講過到底什么是“理解”。在受教育的過程中，幾乎所有課程，都是講授需要我們?nèi)ダ斫獾闹R內(nèi)容，然后用考試來檢驗我們是否理解課程。但卻沒有一門普及性的課程教授我們應(yīng)該如何去理解?！袄斫狻彼坪跏且粋€如呼吸一樣的理所當然的、每個人都會自然而然地無師自通的能力。

然而事情遠非如此簡單。只要是生理正常的人都一樣地在正常呼吸，但是正常人之間的理解能力卻是有很大的差異。如同一個老師教授的學生可以有很不同的結(jié)果表現(xiàn)。

如果我們將人類的理性意識活動做簡化，可以得到下圖所示的基本過程示意。

人類理性活動的簡化示意

從這個過程中我們可以看到，理解是認知的結(jié)果也是行動的前提，是人類理性意識活動的核心環(huán)節(jié)。

所以對“理解”有一個清晰的認識，對于我們提升自己的理解能力，尋找意識活動的規(guī)律，包括人工智能在內(nèi)的計算機應(yīng)用這個人類的“外意識”，認識各種基于不同算法的“外意識”的能力邊界都具有極其重要又十分普遍的意義。

01. 機器學習獲得的“統(tǒng)計性理解”

在對人的理解做了一個比較全面的討論之后，我們來看一下人類創(chuàng)造出來的“外意識”在“理解”的道路上到底走了多遠，以及最終能走多遠。

2023年以ChatGPT為代表的大語言模型的出現(xiàn)，再次引發(fā)了對機器是否具有了意識或理解能力的大規(guī)模議論。

圖二回歸關(guān)聯(lián)核心作用的示意

目前包括大語言模型在內(nèi)的機器學習方法，接受的都是人類給其提供的用文字符號表達的內(nèi)容，所以即使它有了某種“理解”，也僅僅是存在于文字符號這個抽象層面的，而做不到最為關(guān)鍵的回歸關(guān)聯(lián)理解。這被稱為人工智能的“符號落地”問題?；诙喾N傳感器構(gòu)建“具身智能”的努力，包含了實現(xiàn)上圖中所示的回歸關(guān)聯(lián)的意圖。但是因為我們沒有關(guān)于意識活動的基礎(chǔ)科學理論來支撐這些努力，所以借助“具身智能”實現(xiàn)回歸關(guān)聯(lián)或“符號落地”這一目標能否實現(xiàn)以及能走多遠，都還有待于在實踐中去探索，難以做理論上的分析推斷。

我們目前能夠下的結(jié)論是，從人類理解的本質(zhì)來講，基于對文字符號做信息處理的機器學習算法，還不具有與人類一樣的理解能力，因為它對這個世界是沒有自己實在感知的，無法實現(xiàn)回歸關(guān)聯(lián)。

那么，包括大語言模型在內(nèi)的機器學習算法在抽象的文字符號層面實現(xiàn)了某種關(guān)聯(lián)嗎？答案顯然是肯定的。機器學習最著名的一點就是它能夠發(fā)現(xiàn)與建立信息之間的相關(guān)性，并且因為也僅此而已而遭到詬病。但是這種相關(guān)性關(guān)聯(lián)與人類在理解的時候依靠的反映客觀聯(lián)系的關(guān)聯(lián)有所不同。機器學習是基于對人類生成的內(nèi)容做文字符號層面的統(tǒng)計相關(guān)處理，來確定文字符號之間的概率性關(guān)聯(lián)關(guān)系，然后據(jù)此給出相應(yīng)的輸出結(jié)果。這種文字符號之間的相關(guān)性并非是人類思考的基點，而是人類因思考而產(chǎn)生的文字符號表達形式的一種派生特征。

圖源：CSDN

以生成式大語言模型為例，它是對用文字符號表達的內(nèi)容在文字符號層面做概率性相關(guān)統(tǒng)計分析，進而通過文字符號之間的關(guān)聯(lián)關(guān)系，在概率的意義上掌握學習樣本所反映的文字符號的含義、語法規(guī)則和文字符號的組合習慣、及體現(xiàn)不同具體表述內(nèi)容的組合方式等信息，或稱之為知識。最后模型以此為基礎(chǔ)通過自回歸的方式來完成內(nèi)容生成的任務(wù)。

這種依靠統(tǒng)計獲得的文字符號之間的關(guān)聯(lián)關(guān)系，是一種語言層面的表象關(guān)聯(lián)。之所以說它是表象關(guān)聯(lián)，是因為文字符號的組合是其表述內(nèi)容的外在形式，并不能簡單地等同于內(nèi)容本身，所以才有“言外之意”“字面含義”等說法。因而依據(jù)它形成的關(guān)聯(lián)也并不能完全等價于基于內(nèi)容的關(guān)聯(lián)。但同時，形式與內(nèi)容終歸有著統(tǒng)一的一面。所以這種統(tǒng)計關(guān)聯(lián)，與人類在抽象知識層面依據(jù)內(nèi)容與客觀邏輯形成的關(guān)聯(lián)有許多相通之處，但在一般的意義上也并不相同。

人類在做文字符號表達的時候，基本的邏輯是先做“構(gòu)思”---捋清要表達的內(nèi)容，確定要使用的表達的方式，然后根據(jù)文字符號所代表的現(xiàn)實意義，按照語法規(guī)則形成最后的表達形式。雖然這個過程常常包含了非邏輯化的潛意識過程，常常并沒有嚴格清晰的階段劃分，但是這個基本邏輯依然在起決定性作用。在這個過程中，“構(gòu)思”是基礎(chǔ)與起點，最終形成的文字符號表達是結(jié)果。而且人類在這個過程中還有“反思”，它基于“構(gòu)思”去斟酌修改已經(jīng)形成的表述，讓其能夠更好地反映自己的初衷。

大語言模型是不存在“構(gòu)思”這一關(guān)鍵環(huán)節(jié)的，當然也就不存在“反思”的過程。它是通過所謂的“自回歸”過程來產(chǎn)生輸出，即利用過去已形成的輸出及掌握的概率性關(guān)聯(lián)關(guān)系去推算下一步的輸出。這是它與人類在生成文字符號表述時的一個本質(zhì)差異。

它以得到的輸入為起點，利用從學習樣本中學習到的各種概率性關(guān)聯(lián)關(guān)系，以“自回歸”的方式按照順序一步步組合出相應(yīng)的輸出。在這個輸出中，文字符號的基本使用方式來自于對它從天量的學習樣本中學到的語言學知識，這使得其輸出在形式上可以很好地符合人類的表達習慣。同時根據(jù)其學習到的相關(guān)性關(guān)聯(lián)關(guān)系，在其輸出中還會含有許多來自其學習樣本中表達不同內(nèi)容的文字符號組合方式。

所以雖然它沒有像人那樣的“構(gòu)思”過程，可它也并不是在言之無物或憑空編造，而是通過關(guān)聯(lián)關(guān)系把其學習樣本中的許多內(nèi)容有序地一步步組合在了一起。這是“自回歸”機制自己的“思考”方式。它從接受的問題出發(fā)，通過這種“思考”方式生成了看上去含義豐富內(nèi)容完整的輸出。由此，它讓許多人以為它是以與人類類似甚至相同的思維方式生成了那些文字符號的表述。

如果僅僅從語言層面來看，大語言模型可以給出相當好的結(jié)果，其表達相當?shù)捻槙?，說的都是人話；但是在其對答如流中，如果我們從深層含義的角度來看，情況就變得復(fù)雜了。它有時會給出令人滿意的答案，即它給出的結(jié)果比較好地符合人類的理解認知；有時則會出現(xiàn)困難，甚至給出的結(jié)果讓人感到莫名其妙，即出現(xiàn)所謂的“幻覺”。這種“幻覺”并非是因為它走了神，而是因為它“思考”的底層機制與人類思考的機制是基于很不相同的原理，所以它按照自己的機制給出的有些結(jié)果對人類而言如幻覺一般。即使對于一些我們看上去比較簡單的、但是沒有包含在其學習樣本中的問題或表達方式，它也可能出現(xiàn)根本性的混亂或錯誤。

比如曾有人問：“大象與貓哪個大？”大語言模型回答道：“大象大”；但當被問道：“大象與貓哪個不比另外一個大？”大語言模型則回復(fù)說：“它們哪個都不比另外一個大?！?（“Stuart Russell專訪：關(guān)于ChatGPT，更多數(shù)據(jù)和更多算力不能帶來真正的智能”，聞菲，微信公眾號：“機器之心”，2023年2月20日）如果這個回答是人類做出的，我們會說這個人在回答問題時“沒走心”。這個例子很清楚地表明，因為大語言模型僅僅學到了文字符號層面的統(tǒng)計相關(guān)性關(guān)聯(lián)，在面對這個用不太常見的方式表述的問題時，它基于統(tǒng)計相關(guān)給出的文字表達便無法與人類的期望相應(yīng)，即不符合人類的理解。

而且目前大家公認大語言模型的推理能力很弱，對于稍復(fù)雜一點的邏輯關(guān)系就無能為力。這正反映了它依靠文字符號層面的統(tǒng)計相關(guān)性關(guān)聯(lián)，僅僅能夠反映語言所表達的淺層含義，而卻很難體現(xiàn)出文字符號表達的內(nèi)容所蘊含的復(fù)雜或深層一些的邏輯。

而它在什么問題上會出什么性質(zhì)的錯誤，是我們難以預(yù)計的。原因就在于它在做關(guān)聯(lián)組合輸出時，僅僅是依據(jù)學習到的統(tǒng)計性關(guān)聯(lián)，而并不是像人類那樣基于內(nèi)容含義去表述。對大語言模型能力與局限的分析，還是應(yīng)該注重對底層機制的認識，不能僅僅依靠不完整的測試結(jié)果去論證。對于大語言模型而言，由于其面對問題的開放性，根本不存在對其做哪怕是比較充分測試的可能。

1 2 3 4 下一頁余下全文
|

舉報
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報制度規(guī)范
確定取消
標簽機器學習 ChatGPT Sora 大模型理解大語言模型文生視頻 aigc
- 責任編輯: 史岱君
- “知假買假”者惡意高額索賠，最高法發(fā)布司法解釋
  
  2024-08-21 11:08 食品安全
- 學習時報：解放思想是個重大政治問題
  
  2024-08-21 08:40
- 湖北：推行分管案件的縣紀委副書記異地交流任職后，反腐力度明顯加大
  
  2024-08-21 08:17 廉政風暴
- 國家衛(wèi)健委：將對授予護士處方權(quán)工作的必要性進行充分論證
  
  2024-08-21 08:00 醫(yī)療改革
- 廣西北海多人趕海遭雷擊，官方通報：1人死亡
  
  2024-08-21 07:42
- 放票秒沒、60元門票被炒到1600元，故宮回應(yīng)
  
  2024-08-21 07:29
- 巴黎長榮桂冠酒店拒絕懸掛中國國旗遭旅法僑界譴責，中使館發(fā)聲
  
  2024-08-21 06:50
- 智障男子服刑近10年改判無罪后哥哥發(fā)聲：希望對相關(guān)法官追責
  
  2024-08-20 21:50 疑案追蹤
- 習近平接見第33屆奧運會中國體育代表團
  
  2024-08-20 19:37
- 習近平會見出席全國人大加入各國議會聯(lián)盟40周年紀念活動
  
  2024-08-20 19:10
- 鄭州警方回應(yīng)女子被男子壓身下毆打：男子精神分裂
  
  2024-08-20 18:14
- 央視起底：氧氣放掉，用藥直接丟垃圾箱，工傷保險基金成“提款機”
  
  2024-08-20 18:01 醫(yī)療改革
- 強降雨致300多名受災(zāi)群眾被困，葫蘆島應(yīng)急局出動三十多架救援直升機
  
  2024-08-20 17:32 極端天氣
- 日媒中國籍播音員播報時說“釣魚島是中國”，最新后續(xù)
  
  2024-08-20 16:30 日本
- 大搞數(shù)字政績與家族式腐敗，湖南省政協(xié)原副主席戴道晉被逮捕
  
  2024-08-20 15:29 廉政風暴
- 多地農(nóng)村地區(qū)離婚率上升引關(guān)注，機構(gòu)和學者分析原因提出對策
  
  2024-08-20 13:33 婚姻故事
- 受強降雨影響，遼寧葫蘆島4個村通信中斷
  
  2024-08-20 12:55 極端天氣
- 足協(xié)競賽部原部長黃松因受賄罪一審被判七年
  
  2024-08-20 08:53 廉政風暴
- 出廠價5萬賣給醫(yī)院12萬，國家醫(yī)保局問詢藥企
  
  2024-08-20 06:59
- 寧夏一化工車間發(fā)生爆炸，5人遇難
  
  2024-08-19 22:09 安全生產(chǎn)
搜索

   觀察者頭條查看全部

“果然，中國說對了” 評論 109

“特朗普會讓世界團結(jié)起來，減少對美依賴” 評論 205

“剛剛，我看到了未來，它不在美國” 評論 160

特朗普竟對中國征收34%“對等關(guān)稅” 評論 953

解放日？“對于市場而言這是‘屠戮日’” 評論 71

   風聞 · 24小時最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

謝耘：為什么要認真討論大語言模型的“理解”問題？

“知假買假”者惡意高額索賠，最高法發(fā)布司法解釋

學習時報：解放思想是個重大政治問題

湖北：推行分管案件的縣紀委副書記異地交流任職后，反腐力度明顯加大

國家衛(wèi)健委：將對授予護士處方權(quán)工作的必要性進行充分論證

廣西北海多人趕海遭雷擊，官方通報：1人死亡

放票秒沒、60元門票被炒到1600元，故宮回應(yīng)

巴黎長榮桂冠酒店拒絕懸掛中國國旗遭旅法僑界譴責，中使館發(fā)聲

智障男子服刑近10年改判無罪后哥哥發(fā)聲：希望對相關(guān)法官追責

習近平接見第33屆奧運會中國體育代表團

習近平會見出席全國人大加入各國議會聯(lián)盟40周年紀念活動

鄭州警方回應(yīng)女子被男子壓身下毆打：男子精神分裂

央視起底：氧氣放掉，用藥直接丟垃圾箱，工傷保險基金成“提款機”

強降雨致300多名受災(zāi)群眾被困，葫蘆島應(yīng)急局出動三十多架救援直升機

日媒中國籍播音員播報時說“釣魚島是中國”，最新后續(xù)

大搞數(shù)字政績與家族式腐敗，湖南省政協(xié)原副主席戴道晉被逮捕

多地農(nóng)村地區(qū)離婚率上升引關(guān)注，機構(gòu)和學者分析原因提出對策

受強降雨影響，遼寧葫蘆島4個村通信中斷

足協(xié)競賽部原部長黃松因受賄罪一審被判七年

出廠價5萬賣給醫(yī)院12萬，國家醫(yī)保局問詢藥企

寧夏一化工車間發(fā)生爆炸，5人遇難

“美國這么做，堵不住我的嘴”

“對等關(guān)稅”竟是這么算的？經(jīng)濟學家集體傻眼

“果然，中國說對了”

加拿大發(fā)愁：躲過子彈，卻撞上坦克

內(nèi)塔尼亞胡來了，匈牙利退了

“禁令之前就有，但伯恩斯離任前擴大了范圍”

“地球上沒一個地方是安全的”

“美國是特朗普關(guān)稅政策下的最大輸家”

“對臺灣地區(qū)沖擊明顯，非?？膳隆?/a>

“剛剛，我看到了未來，它不在美國”

誰被征了50%的最高關(guān)稅？

四名共和黨議員倒戈阻止對加關(guān)稅，特朗普破口大罵

“特朗普會讓世界團結(jié)起來，減少對美依賴”

特朗普發(fā)動全球關(guān)稅戰(zhàn)，美國VS全世界

結(jié)束全球化？“不是按個開關(guān)，美國就能搖身一變”

諾獎得主克魯格曼：特朗普在貿(mào)易上已經(jīng)徹底瘋了