-
哈佛報(bào)告:中國網(wǎng)絡(luò)審查制度如何允許批評政府卻禁止群體煽動(dòng)
最后更新: 2021-11-19 15:45:50【按】本文原載于《美國政治學(xué)評論》(American Political Science Review)2013年5月刊,題為《中國網(wǎng)絡(luò)審查制度如何允許批評政府卻禁言群體煽動(dòng)》(How Censorship in China Allows Government Criticism but Silences Collective Expression),作者為哈佛大學(xué)教授金加里(Gary King)和他的學(xué)生珍妮弗·潘(Jennifer Pan)與瑪格麗特·E·羅伯茨(Margaret E. Roberts)。該論文刊出后不久,觀察者網(wǎng)即組織翻譯。
通過對中國網(wǎng)絡(luò)審查制度的大規(guī)模、多來源數(shù)據(jù)分析,金加里教授等得出結(jié)論:中國領(lǐng)導(dǎo)層允許社交媒體發(fā)展,容忍對政府、政策、領(lǐng)導(dǎo)人的批評。中國網(wǎng)民在個(gè)體上是自由的,但在群體活動(dòng)上受到控制。我們意識(shí)到,世界各國政府處理同樣問題時(shí)會(huì)采用類似的手段,英國卡梅倫政府曾在騷亂期間對社交媒體進(jìn)行管制,這是一個(gè)近期的例子。
在哈佛大學(xué)的教授等級中,最高級是“校級教授”(University Professor),哈佛大學(xué)目前僅設(shè)24名。政治學(xué)系金加里(Gary King)的頭銜是“阿爾伯特?韋瑟黑德三世校級教授”(Albert J. Weatherhead III University Professorship)。這一頭銜的上一任擁有者正是大名鼎鼎亨廷頓——美國政治學(xué)者、前哈佛大學(xué)政治學(xué)系教授亨廷頓(Samuel Huntington)。
觀察者網(wǎng)今日特刊出金加里教授領(lǐng)導(dǎo)撰寫的此文譯文(附錄部分略有刪節(jié)),供讀者借鑒:
雖然作者功力扎實(shí),又具有重要的學(xué)術(shù)地位,但由于種種原因,與《外交政策》雜志上此前刊登的《謠言共和國》相比,該論文在中美學(xué)術(shù)圈和媒體上引起的反響則顯得遲緩?!都~約時(shí)報(bào)》中文網(wǎng)專欄作家歐陽斌近期在哈佛大學(xué)就該論文對金加里教授進(jìn)行了采訪?!董h(huán)球時(shí)報(bào)》今日則刊發(fā)觀察者網(wǎng)專欄作家、復(fù)旦大學(xué)國際政治系講師沈逸文章《客觀研究中國網(wǎng)絡(luò),摘下有色眼鏡》,評述了該論文在學(xué)術(shù)圈內(nèi)的窘境。
觀察者網(wǎng)今日特刊出金加里教授領(lǐng)導(dǎo)撰寫的此文譯文(附錄部分有刪節(jié)),供讀者借鑒:
中國網(wǎng)絡(luò)審查制度如何允許批評政府卻禁止群體煽動(dòng)
How Censorship in China Allows Government Criticism but Silences
Collective Expression譯者:朱新偉、王楊
中國網(wǎng)絡(luò)管理部門可能正在實(shí)施有史以來最廣泛的人類言論篩查行動(dòng),我們首次對這一行動(dòng)大規(guī)模、多來源的分析。為此,我們專門設(shè)計(jì)了一套計(jì)算機(jī)系統(tǒng)。搶在中國政府發(fā)現(xiàn)、評估并審查(從互聯(lián)網(wǎng)刪除)他們視為不妥的內(nèi)容之前,這套系統(tǒng)在1400個(gè)不同的社交媒體網(wǎng)站上定位、下載并分析數(shù)百萬的網(wǎng)貼。利用現(xiàn)代電腦文本分析方法,我們在85個(gè)主題范圍中,把特定時(shí)間內(nèi)被過濾的網(wǎng)貼與未被審查的網(wǎng)貼的實(shí)質(zhì)內(nèi)容進(jìn)行對比。我們發(fā)現(xiàn),與通常的認(rèn)識(shí)不同,那些對國家、領(lǐng)導(dǎo)人和政策進(jìn)行消極甚至刻薄批評的網(wǎng)貼遭過濾的概率并不高。但是,自詡民意代表、煽動(dòng)社會(huì)動(dòng)員的言論,不論任何內(nèi)容一概會(huì)被禁言。審查部門力圖限制任何群體性事件,這明確暴露了政府的執(zhí)政意圖。
摘要
中國政府有選擇地過濾中國網(wǎng)民言論,從其規(guī)模和復(fù)雜程度來說,這一工程史無前例。美國的社交媒體集于少數(shù)網(wǎng)站,而中國(社交媒體)則分布于數(shù)以百計(jì)的地方站點(diǎn)。這意味著,很大一部分審查責(zé)任被下放給這些網(wǎng)站的管理方,如果他們違反政府審查守則,就有可能遭罰款或關(guān)閉。為了避免觸犯政府規(guī)則,每個(gè)網(wǎng)站都雇傭了專職審查員,最多的可達(dá)1000名。此外,在中央、省級和地方等不同級別,約2萬-5萬網(wǎng)警和網(wǎng)管辦(員工)、約25萬-30萬“五毛黨”都參與了這項(xiàng)艱巨工程。中國的新聞自由規(guī)模在197個(gè)國家中與緬甸并列第187位(據(jù)2012年自由之家報(bào)告),中國的審查工作是迄今最大的。
在本文中我們發(fā)現(xiàn),這一機(jī)制旨在限制中國人言論自由,同時(shí)是一個(gè)異常豐富的信息資源——它暴露了中國政府(自認(rèn)的)利益、意圖和目標(biāo)。這是學(xué)術(shù)和政策研究團(tuán)體一直關(guān)注的話題。跟通常媒體零星報(bào)道的領(lǐng)導(dǎo)人的公開活動(dòng)不同,網(wǎng)絡(luò)信息可以不間斷地獲得(對研究有利)。我們用該新信息發(fā)展新的理論,以解釋審查機(jī)制的總體目標(biāo),進(jìn)而揭示中國領(lǐng)導(dǎo)層的一些最基本目標(biāo)。對中國政府這些目標(biāo)有多種多樣的猜測,但無論哪種假說都缺乏實(shí)證分析。所以該信息對于其他很多學(xué)術(shù)(和實(shí)際決策)用途都很有價(jià)值。
我們得出了一個(gè)核心的理論發(fā)現(xiàn):與通常的研究和評論相反,審查機(jī)構(gòu)的目的并非壓制批評國家或共產(chǎn)黨的言論。必須承認(rèn),審查覆蓋社交媒體,但我們發(fā)現(xiàn),當(dāng)中國人對政府或領(lǐng)導(dǎo)人提出尖刻批評時(shí),網(wǎng)帖被過濾的幾率并沒有上升。另一方面,我們發(fā)現(xiàn)審查的目的是降低群體性事件的可能性。只要群體性運(yùn)動(dòng)已經(jīng)或可能發(fā)生,有關(guān)部門就會(huì)及時(shí)刪除網(wǎng)貼。我們在此闡明上述觀點(diǎn),認(rèn)為它們對中國政治、比較政治學(xué)等很多研究領(lǐng)域會(huì)產(chǎn)生深遠(yuǎn)影響。
在以下章節(jié)中,我們先對中國審查制度提出兩種假說。然后我們介紹獨(dú)特的數(shù)據(jù)源以及富有挑戰(zhàn)的收集數(shù)據(jù)過程。接下來,我們闡明分析方式,給出結(jié)果并總結(jié)。附錄包括編碼細(xì)節(jié),中文文本自動(dòng)分析方法,并指出審查行為預(yù)示了政府在互聯(lián)網(wǎng)之外的行動(dòng)。
政府意圖以及審查目標(biāo)
此前,尋找衡量政府意圖的指標(biāo)
破譯中國領(lǐng)導(dǎo)人隱秘的意圖和目標(biāo)曾是研究中國精英政治的焦點(diǎn)。西方學(xué)者曾采用克里姆林學(xué)或北京學(xué)(基于人事關(guān)系和官方報(bào)道的中國政策研究)作為其研究方略。隨著文化大革命和改革開放的到來,研究者可獲得越來越多的數(shù)據(jù),而學(xué)者也將研究方向轉(zhuǎn)到信息更開放的領(lǐng)域。總體上,今天的中國研究依賴于官方數(shù)據(jù)、民意調(diào)查、地方官員訪談以及官員和政府的公開活動(dòng)。
這些資源很適合回答其他重要的政治科學(xué)問題,但是在衡量政府意圖這個(gè)問題上,這些資源顯然是間接的、往往取樣過于稀疏且可疑。比如,官方數(shù)據(jù)公布的“群體性事件(mass incident)”數(shù)量,可能受政府利益考量影響,但我們只有將真實(shí)數(shù)字和政府?dāng)?shù)據(jù)對比才能發(fā)現(xiàn)這一點(diǎn)。同樣,抽樣調(diào)查或許有用,但政府顯對普通公民有所隱瞞。而且,即使受訪者擁有研究者想要的信息,他們也未必愿透露。在直接訪談官員時(shí),研究者恐怕要算一卦才能知道知情官員的真正想法。
(與研究政府行動(dòng)相比)衡量政府的意圖更加困難。目前各種研究方式都只能搜集到有限的信息,不足以得出明確的結(jié)論。因?yàn)橹袊皇氰F板一塊。其實(shí),在很多情況下不同的政府部門、不同的領(lǐng)導(dǎo)或不同級別的政府工作目的千差萬別,甚至很難確定一個(gè)統(tǒng)一的意圖或動(dòng)機(jī),更不可能進(jìn)行簡單的描述。我們也不能解決所有的問題,但是政府的審查行為中的偏好是一個(gè)很好的研究對象,會(huì)透露更多信息,我們可以借此分析官員自己也未必明確的工作目的。
審查的邏輯
本研究的前提是網(wǎng)絡(luò)大大拓展了公共話語的空間。我們首先建立一個(gè)基于實(shí)證研究的理論,解釋政府為何要審查網(wǎng)絡(luò)言論,以及他們想通過這樣龐大的機(jī)制達(dá)到什么目的?,F(xiàn)有學(xué)者一般持有一個(gè)大而無當(dāng)?shù)慕Y(jié)論——中國政府審查網(wǎng)貼是為了維持政權(quán)。而我們著更關(guān)心政府的具體行事方式——政府到底如何定義自己的目標(biāo),以及它采取了什么行動(dòng)來實(shí)現(xiàn)自己的目標(biāo)。
為此,我們提出了兩個(gè)理論。這兩個(gè)理論各自反映了威脅中國政權(quán)的某個(gè)方面。
第一條是常見的(壓制)國家批評論,即假定中國領(lǐng)導(dǎo)層的行為目標(biāo)是鎮(zhèn)壓異見者,控制指責(zé)中國政府、政策或領(lǐng)導(dǎo)的言論。結(jié)果是讓看得到的公眾言論對掌權(quán)者更有利。很多對國家的批評都被視為這一目標(biāo)的控制對象,比如差勁的政府業(yè)績。
第二個(gè)理論是我們所說的潛在群體性事件論,即審查目標(biāo)是聯(lián)合起來集體表達(dá)意愿的人。在民間人士的激勵(lì)下,他們有引發(fā)群體性事件的可能。該觀點(diǎn)認(rèn)為,群體表達(dá)——很多人在社交媒體上就同一問題交流——與真實(shí)的群體性事件相關(guān)。只要言論可能引發(fā)群體性事件,就很可能會(huì)被審查。值得注意的是,這一理論并不關(guān)心網(wǎng)貼的內(nèi)容,無論內(nèi)容是批評還是歌頌國家,甚至根本不涉及國家政權(quán)。
“潛在群體性事件”也可以在中國政府鮮明的表態(tài)中找到依據(jù),即不受政府控制的群體表達(dá)無異于派系私斗,并最終會(huì)導(dǎo)致混亂和無序。比如,在共產(chǎn)黨建黨90周年前夕,新華社社論,稱西式議會(huì)民主將導(dǎo)致中國重蹈文革的動(dòng)蕩史。同樣地,2011年3月召開的第11屆全國人大四次會(huì)議上,全國人大委員長吳邦國稱,鑒于中國國情,中國將不會(huì)借鑒多黨輪流執(zhí)政的體制。這樣做的目的,是為了避免中國“陷入內(nèi)亂深淵”。
中國觀察家們常會(huì)注意到,中國政府對維穩(wěn)異常重視,有強(qiáng)烈的意愿通過約束社會(huì)關(guān)系限制群體性事件。當(dāng)前的中國政府遇到了大量爭端和群體行動(dòng)。清華大學(xué)社會(huì)學(xué)系教授孫立平稱,2010年,中國共發(fā)生了18000起群體性事件。頻繁地群體事件不可避免地對政府處理問題的方式和觀念產(chǎn)生影響。中國政府認(rèn)為,對橫向溝通加以約束是合法且有效的保護(hù)人民的手段。
現(xiàn)在的學(xué)者無法通過實(shí)證研究區(qū)分前述兩種理論的不同。Marolt (2011) 寫道,當(dāng)“批評政黨及其政策,或鼓動(dòng)群體性政治運(yùn)動(dòng)”時(shí),網(wǎng)上的網(wǎng)貼會(huì)被查封。MacKinnon (2012)稱在溫州高鐵事故中,互聯(lián)網(wǎng)服務(wù)商受命“跟蹤并審查批判性的網(wǎng)貼”Esarey和Xiao (2008) 發(fā)現(xiàn)中國博主采用(婉轉(zhuǎn)地)諷刺手法批評政府,以避免遭到鎮(zhèn)壓。Esarey 和 Xiao (2011) 寫道,共產(chǎn)黨領(lǐng)導(dǎo)人最害怕“有影響力的網(wǎng)民聯(lián)合對政府施壓,要求其改變政策,”但他們認(rèn)為這種施壓的方式是對政府的批評。Shirk (2011)稱審查的目的是壓制政治反對派的動(dòng)員,但她的例子表明批評的觀點(diǎn)來自于那些被壓迫的人。
街頭抗議這種群體性事件經(jīng)常被視為專制政權(quán)的喪鐘。東德、東歐以及最近的中東抗議都導(dǎo)致了政權(quán)更迭的革命。 很多中國學(xué)者都關(guān)注人們反抗的原因以及策略。中國政府似乎要不計(jì)代價(jià)阻止抗議——的確,群體性事件的數(shù)量是地方官員考核標(biāo)準(zhǔn)之一。然而,最近的數(shù)個(gè)研究指出:專制政權(quán)可能會(huì)期待并歡迎潛在的小規(guī)??棺h活動(dòng)。因?yàn)榱私獠⑻幚砣罕姷牟粷M會(huì)促進(jìn)政權(quán)穩(wěn)定。Chen (2012) 指出小規(guī)模、孤立的抗議是中國長期的傳統(tǒng),也是政府期望的行為.
結(jié)論概述
上述兩個(gè)假說相互獨(dú)立——可能都對,也可能一對一錯(cuò)或者全錯(cuò)。但根據(jù)我們?nèi)〉玫臄?shù)據(jù),答案很明確:國家批評論是錯(cuò)誤的,潛在群體性事件論是正確的。我們的數(shù)據(jù)表明,中國的審查機(jī)制放任對中國政府、官員和政策的廣泛批評,審查首要針對的是限制可能引發(fā)群體性事件的信息傳播,無論這種信息是煽動(dòng)反政府,還是反對具體的政策,都會(huì)審查。如果網(wǎng)上發(fā)帖數(shù)量激增,且內(nèi)容可能引發(fā)群體性事件(如廣場抗議),那么審查就會(huì)到來。此外,我們還考察了每個(gè)事件中的表態(tài),發(fā)現(xiàn)在這些事件中,政府對支持和批評的觀點(diǎn)不加區(qū)分,一律刪除。這表明中國政府相信,為了維護(hù)自己的統(tǒng)治,壓制有可能引發(fā)群體性事件的網(wǎng)貼比壓制批評更重要。
數(shù)據(jù)
我們在收集海量具體信息時(shí)遇到了巨大的挑戰(zhàn),中國政府不希望任何人看到這些信息,因此會(huì)竭盡全力阻止別人獲取。下面我們我們將討論審查的種類,數(shù)據(jù)收集過程,該研究的局限性,以及我們對數(shù)據(jù)做后續(xù)分析的方法。
審查的種類
中國審查社交媒體上上的網(wǎng)民意見至少有3種方式,最后一種是我們研究的重點(diǎn)。
首先是“防火長城”(一般縮寫GFW,方濱興主持建立)。該防火墻完全禁止某些網(wǎng)站在中國運(yùn)營。這令很多國外的互聯(lián)網(wǎng)公司頭痛,也阻止了中國人通過這些網(wǎng)站與國外網(wǎng)民交流。但中國人可以用其他的網(wǎng)站,用相似的方式表達(dá)自己的觀點(diǎn),防火墻對此無法干預(yù)。比如,facebook臉書在中國被禁,但人人網(wǎng)是相似的替代品;同樣地,新浪微博是人氣很旺的推特的克隆體。
第二種方式是“關(guān)鍵詞屏蔽”,它防止用戶發(fā)布含有被禁的詞或短語的文本。這對限制言論自由作用有限,因?yàn)榫W(wǎng)民發(fā)現(xiàn)自動(dòng)程序的智商并不高。他們用類比,比喻,諷刺等方式繞過審查。漢語可以為此提供多種新穎的方法,比如替換漢字,可以用同音字或看上去相近的漢子(同形異義字)。比如“目田”,本意是“眼睛-田野”,但被魔獸世界玩家用來代指字形相近的“自由”。同音字方面,“hexie”這個(gè)音經(jīng)常被寫成河蟹,意思是河里的螃蟹,實(shí)際上指代“和諧”,即官方的“和諧社會(huì)”政策。
一旦跨過了前兩個(gè)障礙,文章就能(自由地)在網(wǎng)上發(fā)布。審查者將閱讀并刪除那些不妥的文章。通過研究文獻(xiàn)、觀察者的記錄、與數(shù)個(gè)政府內(nèi)部人士的談話以及對數(shù)據(jù)的匯總,我們幾乎可以斷定,內(nèi)容過濾在很大程度上是人工完成的——審查者手動(dòng)閱讀文章。自動(dòng)程序似乎只是輔助。跟”防火長城”或關(guān)鍵詞屏蔽不同,手動(dòng)審查不會(huì)被文字游戲糊弄。因此,這也是最后也是最費(fèi)力的審查方式,也是本文的研究重點(diǎn)。
資料收集
我們先收集社交媒體上的博客,至少在審查到來前,作者可以完整的表達(dá)他們的思想。
在很多國家,如美國,幾乎全部博客都集中在少數(shù)幾個(gè)大網(wǎng)站上(臉書、谷歌博客、Tumblr等);中國確實(shí)有新浪這樣的大網(wǎng)站,但還有很大一部分社交媒體資源分布在無數(shù)的單個(gè)站點(diǎn)上,比如地方bbs論壇等。這種多元對數(shù)據(jù)的收集工作造成了邏輯上的挑戰(zhàn)。由于網(wǎng)址、軟件界面、地方審查官員、網(wǎng)絡(luò)可靠性、訪問速度、使用條款各不相同,審查模式也不同,能對我們的數(shù)據(jù)收集造成潛在妨礙的方式也多種多樣。幸運(yùn)的是,中國獨(dú)特的社交媒體結(jié)構(gòu)也為研究各地對群體表達(dá)的監(jiān)管提供了絕佳機(jī)會(huì),因?yàn)榇罅康谋镜卣军c(diǎn)提供了豐富的信息, 這比在美國還要便利。
數(shù)據(jù)收集面臨的最復(fù)雜的挑戰(zhàn)是,趕在中國政府閱讀并刪除不妥的內(nèi)容之前,定位、訪問并下載相關(guān)內(nèi)容。此外,對每個(gè)帖子進(jìn)行頻繁重訪以確認(rèn)刪除的時(shí)間。還要在中國很多地方收集數(shù)據(jù)同時(shí)不會(huì)影響到我們研究的審查機(jī)制,研究也不會(huì)遭到制止。
我們能完成的原因是數(shù)據(jù)手機(jī)系統(tǒng)高度自動(dòng)化,而中國審查系統(tǒng)涉及人工操作。我們龐大的工程(由于明顯原因?qū)⒉粫?huì)在此詳述)在全世界很多地方運(yùn)行,包括中國內(nèi)地。
最后,在2011年前半年,我們從1382個(gè)中國網(wǎng)站上定位、訪問并下載了社交媒體網(wǎng)貼。中國社交媒體結(jié)構(gòu)最顯著的特就是它有極長的(冪律狀的)尾巴(指中小型網(wǎng)站的原創(chuàng)內(nèi)容)。圖1是各網(wǎng)站的樣本和中文標(biāo)識(shí)(圖片a)以及代表該長尾的網(wǎng)帖數(shù)量餅狀圖(圖片b)。圖中可見,最大的網(wǎng)帖來源是新浪博客(占總數(shù)的59%),百度嗨,華聲論壇,四月論壇和天涯。但尾巴還在一直(向更小的網(wǎng)站)延伸。
社交媒體網(wǎng)貼涵蓋的話題范圍太廣,以致于全面的隨機(jī)取樣策略很難對單一話題提供有價(jià)值信息。因此,我們采取了分層隨機(jī)抽樣設(shè)計(jì)的方法。我們先選取了85個(gè)單獨(dú)的話題范圍,并按照假定的政治敏感性分為高(如艾未未)、中(如計(jì)劃生育)、低(如流行網(wǎng)游)三檔。通過回顧以前的研究、咨詢中國專家以及對當(dāng)下事件進(jìn)行研究,我們分別在這三檔中選取某些特定話題。附錄A是完整的清單。
然后,針對不同的每個(gè)話題范圍(用關(guān)鍵詞區(qū)分),我們收集6個(gè)月時(shí)間內(nèi)所有相關(guān)的社交媒體網(wǎng)貼。我們檢查每個(gè)話題范圍的網(wǎng)貼,刪除垃圾郵件,再用輔助閱讀工具對內(nèi)容進(jìn)行研究。(Crosas et al. 2012; Grimmer and King 2011)我們一共收集了3674698篇網(wǎng)貼,其中隨機(jī)選出127283萬篇進(jìn)行進(jìn)一步分析。(我們在其他時(shí)間段里重復(fù)這一過程,有時(shí)候會(huì)對某些話題范圍進(jìn)行更深入的研究。總共收集并分析了11382221篇網(wǎng)貼。)所有這些來自中國站點(diǎn)的網(wǎng)貼都是用中文寫的,但不包來自括香港和臺(tái)灣的文章。我們先閱讀每篇文章的內(nèi)容,將其置于某個(gè)話題范圍的時(shí)間軸上,并重復(fù)訪問源網(wǎng)站以確定其是否被過濾。根據(jù)需要,我們將用其他特定的數(shù)據(jù)對該信息進(jìn)行補(bǔ)充。
審查者們并不羞于公開自己的行為,因?yàn)槲覀儼l(fā)現(xiàn)可以很容易區(qū)分(有意的)審查和零星的斷電,或是短暫的超時(shí)錯(cuò)誤。被審查的網(wǎng)頁清晰地包含這樣的字眼:“抱歉,指定的主題不存在,已被刪除或正在審核”,有時(shí)候還會(huì)留下有警警和察察(網(wǎng)警logo)的標(biāo)志。
盡管我們搜集信息比審查者審帖快,但他們的效率也體現(xiàn)出了高度專業(yè)水平。為了說明這一點(diǎn),我們隨機(jī)收集并分析了2011年9月27日上海地鐵相撞事件前后的網(wǎng)帖、2012年4月10日到12日薄熙來事件的網(wǎng)帖和有關(guān)谷開來的網(wǎng)帖,以此舉例。盡管我們搜集信息比審查者審帖快,但他們的效率也體現(xiàn)出了高度專業(yè)水平。為了說明這一點(diǎn),我們隨機(jī)收集并分析了2011年9月27日上海地鐵相撞事件前后的網(wǎng)帖、2012年4月10日到12日薄熙來事件的網(wǎng)帖和有關(guān)谷開來的網(wǎng)帖,以此舉例。
我們對上述三個(gè)話題范圍的網(wǎng)貼進(jìn)行不間斷監(jiān)控,一共監(jiān)控9天。(其他范圍的審查遵循同樣的基本方式)圖2表示的是被審查的網(wǎng)貼數(shù)的直方圖。在三個(gè)事件中,大多數(shù)的內(nèi)容過濾發(fā)生在原文發(fā)布后的24小時(shí)之內(nèi),當(dāng)然也有一小部分網(wǎng)貼到5天之后才被刪除。這體現(xiàn)了驚人的組織能力,它需要戰(zhàn)爭機(jī)器般的精確:不同政府級別、分管不同互聯(lián)網(wǎng)運(yùn)營商的領(lǐng)導(dǎo)需要首先做出決斷(給出一致意見、直接命令或妥協(xié)方案),決定什么內(nèi)容需要被過濾;他們需要將該決定傳達(dá)給數(shù)十萬的個(gè)人;然后這支軍隊(duì)需要在大約24小時(shí)之內(nèi)完成絕大多數(shù)審查工作。
正如埃德蒙(2012)指出,社交媒體上信息源的激增讓信息越來越難以控制,然而,中國政府竟然在全國范圍內(nèi)克服了這一困難。鑒于很多人很難達(dá)成一致意見,而且不同的人執(zhí)行指令很難達(dá)成同樣的效果(比如Hopkins and King 2010, Appendix B)我們認(rèn)定政府對審查工作做出了巨大而專業(yè)的努力。我們發(fā)現(xiàn)了一些證據(jù),表明這一龐大蕪雜的官僚體制中存在不同意見,比如不同級別的政府之間的不一致。但我們尚未對此進(jìn)行細(xì)致的研究。
研究的局限性
如下所示,我們的方法很大程度上揭示了中國領(lǐng)導(dǎo)層的目標(biāo),但它忽略了網(wǎng)站的自我審查以及這些內(nèi)容被我們看到之前已經(jīng)發(fā)生的過濾;它也沒有對”防火長城”、關(guān)鍵詞屏蔽或搜索過濾的直接效果進(jìn)行量化。我們也沒有研究現(xiàn)實(shí)中暴力的效果,如逮捕博主或進(jìn)行威脅。盡管各級政府和官員都會(huì)對審查什么、何時(shí)審查進(jìn)行干預(yù),但我們的數(shù)據(jù)有時(shí)候并不能讓我們對這些信息源加以區(qū)分。
我們的確無法判斷上述局限性的后果,不過我們可以合理地推斷,其中最重要的應(yīng)該是現(xiàn)實(shí)中的暴力、威脅以及由此導(dǎo)致的自我審查。盡管我們分析的社交媒體數(shù)據(jù)包含數(shù)百萬中國人的意見,涵蓋了極其廣泛的話題和演講行為,但那些從未被我們觀測到的話題(即網(wǎng)民不敢談到的話題)可能才是政府認(rèn)為最要害(或最緊迫的)的部分。
最后,過去對互聯(lián)網(wǎng)行為的研究存在一個(gè)可靠的前提——網(wǎng)民的社會(huì)行為跟“現(xiàn)實(shí)世界”行為基本同步。但是,當(dāng)前的網(wǎng)絡(luò)行為已經(jīng)占據(jù)了人類生活很重要的位置,因此今天社交媒體上觀察到的思想本身就非常重要——不論它能否很好地衡量非網(wǎng)絡(luò)自由和行為。但無論這個(gè)前提是否成立,我們都難以作出這樣的論斷:我們對中國社交媒體的研究可以用來說明中國的新聞自由或是其他信息傳遞問題。
分析策略
總體上看,大約有13%的網(wǎng)貼被過濾。如果將所有領(lǐng)域、所有的網(wǎng)貼匯總起來,這一數(shù)據(jù)隨著時(shí)間的推移變化不大,但它會(huì)隨著網(wǎng)貼數(shù)量和審查力度的變化產(chǎn)生巨大變化。我們發(fā)現(xiàn),網(wǎng)貼的潛在政治敏感性和審查之間的關(guān)聯(lián)性非常低:在低檔和中檔敏感度事件中,審查率基本一致(分別是16%和17%),僅僅比高檔敏感度事件(24%)低一點(diǎn)。當(dāng)然,單個(gè)數(shù)據(jù)的穩(wěn)定性不意味著內(nèi)涵的簡單。為了發(fā)現(xiàn)審查的深層規(guī)律,我們接下來將討論編碼規(guī)則、給出核心假設(shè),探討中國政府可能的審查程序。
編碼規(guī)則
我們分5步進(jìn)行樣本編碼。
首先,按分層隨機(jī)抽樣設(shè)置的關(guān)鍵詞,我們將社交媒體網(wǎng)貼分為85個(gè)話題范圍。盡管我們做了大量的檢查(通過大量人工閱讀并借助現(xiàn)代電腦輔助閱讀技術(shù))確保其準(zhǔn)確性,我們的話題范圍里難免(借助任何機(jī)器或人工分類技術(shù))存在一些歸類錯(cuò)誤。我們采用了保守的方法,先做出結(jié)論,暫且忽略這一錯(cuò)誤的影響。隨后,我們進(jìn)行了反復(fù)的篩查(用同樣的技術(shù)),確保我們不會(huì)錯(cuò)過任何重要的信息。這種歸類錯(cuò)誤可以看做是系統(tǒng)性錯(cuò)誤,但迄今為止,所有數(shù)據(jù)(扣除錯(cuò)誤后的數(shù)據(jù))都依然支持我們的結(jié)論。
第二,眾所周知,幾乎所有話題范圍(和相關(guān)區(qū)域)的言論數(shù)量都是“陣發(fā)”的,即穩(wěn)定的時(shí)間曲線常常因偶然事件而出現(xiàn)數(shù)量激增。這一規(guī)律僅僅有兩個(gè)例外——色情內(nèi)容和對審查者自身的批評。如下所述——審查工作在數(shù)量爆發(fā)(volume burst)時(shí)期(即事件熱點(diǎn)時(shí)期)力度往往格外大。因此,我們對數(shù)量爆發(fā)期前后的數(shù)據(jù)進(jìn)行了處理。我們將每個(gè)話題的數(shù)據(jù)搜集范圍都確定為6個(gè)月時(shí)間序列中每天的數(shù)量,并采用回歸方式計(jì)算數(shù)據(jù),以確定在剩余時(shí)間序列中的離散值(outlaying observations)。
通過這一過程,我們檢測的85個(gè)話題范圍中有67個(gè)出現(xiàn)過數(shù)量爆發(fā),一共出現(xiàn)了87次。
第三,我們將每個(gè)事件歸為以下五類:每個(gè)類別都可能包含批評或不批評政府、領(lǐng)導(dǎo)人和政策的網(wǎng)貼。
1.潛在群體性事件
“群體性事件”定義:
兩個(gè)(含)以上的人,受到參與者而非官員(或官方代表)的鼓動(dòng)、控制,追求特定目標(biāo)的行為。我們的“潛在群體性事件”原則上包括任何有可能引發(fā)群體性事件的事件,但是為了保守起見,并確保編碼規(guī)則清楚明確且可以重復(fù)驗(yàn)證,我們將增加3個(gè)歸類條件:a)作者參與了抗議活動(dòng)或有組織的人群;b)網(wǎng)貼與曾經(jīng)組織或引發(fā)群體性事件的個(gè)人有關(guān);c)網(wǎng)貼與曾經(jīng)引發(fā)抗議或群體性事件的民族主義或民族主義情緒有關(guān)。2.對審查者批評
“對審查者批評”定義:
對效命于政府或非政府實(shí)體的審查者(無論個(gè)人和公司)的批判。3.色情內(nèi)容
“色情”定義:
包含色情或明顯性方面內(nèi)容的電影、網(wǎng)站、廣告、新聞。
4.政府政策
“政策”定義
政府聲明或政府活動(dòng)報(bào)告,包括國內(nèi)或?qū)ν庹摺?
5.其他新聞。
其他新聞是指對上述4類事件以外的事件的報(bào)告。
最后,我們進(jìn)行了一項(xiàng)研究以驗(yàn)證我們編碼規(guī)則的可靠性。
我們把上述規(guī)則給兩位熟悉中國政策的人看,要求他們對87個(gè)話題分別進(jìn)行編碼(每個(gè)話題都曾導(dǎo)致中國網(wǎng)民的發(fā)帖量爆發(fā)),并將其歸入上述的5個(gè)范疇中。兩名編碼者獨(dú)立工作,各自對這些事件進(jìn)行歸類。編碼結(jié)果證明,兩位編碼者的一致率是98.9%,即87個(gè)話題中的86個(gè)歸類都相同。唯一不同的話題是方濱興(”防火長城”的發(fā)明者)遭扔鞋事件。這一事件既導(dǎo)致對審查者的批評,在一定程度上也是群體性事件,因?yàn)橛泻脦讉€(gè)人一起向方濱興扔鞋。我們最后決定將該事件作為批評審查者的例子,不過不管它怎么編碼,都不會(huì)影響我們的結(jié)果。因?yàn)槲覀児烙?jì),無論它歸入哪一類,都會(huì)遭到審查。
核心假說
我們的核心假說如下:網(wǎng)貼數(shù)量爆發(fā)期間,政府會(huì)根據(jù)話題范圍,將所有討論潛在群體性事件的網(wǎng)貼刪除。也就是說,審查者將不管這些網(wǎng)貼是否有群體性事件的可能。這或許是因?yàn)閳?zhí)行精確鑒別指令的難度比較大。Kuran (1989)和Lohmann (2002)研究表明,正是有關(guān)群體性事件事件的信息促進(jìn)了群體性事件的產(chǎn)生,因此,要想把這種信息和明確的對群體性事件的號(hào)召區(qū)分開來,即使不是不可能,也是非常困難的。因此,我們假設(shè)審查者采用了更簡單的標(biāo)準(zhǔn)來判斷網(wǎng)貼是否誘發(fā)潛在群體性事件。而且他們不會(huì)考慮網(wǎng)貼是否批評政府的(即支持政府的也一概不放過)。
審查者還試圖把全部刪除色情內(nèi)容和批評審查者的內(nèi)容。但不會(huì)刪除政府政策和其他新聞范疇內(nèi)的網(wǎng)貼。
政府的運(yùn)作程序
中國政府審查的確切運(yùn)作程序當(dāng)然無法觀測。但是我們約談了接近審查機(jī)構(gòu)的人,以及內(nèi)部人士,我們相信我們的編碼規(guī)則可以視作接近真實(shí)程序。(事實(shí)上,在文章的一個(gè)草稿公布后,我們收到的反饋?zhàn)C實(shí)了我們的觀點(diǎn))我們手動(dòng)確定話題范圍,用關(guān)鍵詞對網(wǎng)貼進(jìn)行歸類,并通過統(tǒng)計(jì)發(fā)帖數(shù)量的時(shí)間序列數(shù)據(jù),自動(dòng)甄別網(wǎng)貼數(shù)量爆發(fā)。某些情況下,對談?wù)摤F(xiàn)實(shí)世界事件網(wǎng)貼的過濾可能發(fā)生在事件真正發(fā)生之前——因?yàn)閷彶檎邥?huì)被秘密告知某事將要發(fā)生(比如對某個(gè)異見分子的逮捕),而這件事可能引發(fā)群體性事件。
在網(wǎng)貼數(shù)量爆發(fā)期間進(jìn)行過濾,第一步的甄別工作幾乎全部需要人工完成,或許偶爾會(huì)輔以計(jì)算機(jī)程序,如算法識(shí)別特色詞組(statistically improbable phrases)。最后,審查者對單個(gè)網(wǎng)貼做出審查決定——根據(jù)我們的假說,要檢查它是否與某個(gè)特定事件有關(guān)——幾乎肯定是人工完成的,因?yàn)闆]有哪個(gè)已知的計(jì)算機(jī)系統(tǒng)的精度能與中國審查工作的精確程度相比。審查者可能會(huì)先用關(guān)鍵詞搜索找到相關(guān)事件,但他們依然需要人工閱讀文章,再進(jìn)行審查。比如,當(dāng)審查者從網(wǎng)上的討論中找到增城事件的文章,他們可能采取了關(guān)鍵詞搜索的方式,但他們可能必須要閱讀全文,這樣才能將增城抗議和增城的其他信息區(qū)分開來,比如增城荔枝豐收。
結(jié)果
接下來我們介紹3個(gè)具體的測試以驗(yàn)證我們的假說。這些測試基于:
1 網(wǎng)貼數(shù)量
2 引發(fā)每次數(shù)量爆發(fā)的事件性質(zhì)
3 被審查的網(wǎng)貼的具體內(nèi)容。
此外,附錄C(見文末)提供了一些證據(jù),表明中國政府的審查行為自相矛盾地反映了中國政府的意圖。
網(wǎng)帖數(shù)量
假如審查的目標(biāo)是禁止有可能引發(fā)群體性事件的討論,那么我們應(yīng)該會(huì)看到,數(shù)量爆發(fā)期間會(huì)比別的時(shí)期有更多審查行動(dòng)。我們會(huì)看到,某些事件爆發(fā)——有群體性事件可能的——受到的審查級別會(huì)更高。
為了研究這一模式,我們引入了“審查強(qiáng)度”的概念,即數(shù)量爆發(fā)期內(nèi)被審查(刪除)網(wǎng)貼的百分比減去數(shù)量爆發(fā)期外所有被審查(刪除)網(wǎng)貼的百分比。(基本比率在不同的話題范圍中變動(dòng)很小,如下圖所示,沒有造成天花板或地板效應(yīng))。這可以證明中國政府網(wǎng)絡(luò)政策之嚴(yán)厲,因?yàn)樵诰W(wǎng)貼數(shù)量爆發(fā)期間進(jìn)行審查明顯更加困難,網(wǎng)帖數(shù)量更多,時(shí)間更緊迫,且沒人預(yù)先警告什么時(shí)候會(huì)出事。
表3的a直方圖似乎支持我們的假說。結(jié)果表明,絕大多數(shù)數(shù)量爆發(fā)的審查強(qiáng)度集中在0附近,但有一條顯著的長尾(坐標(biāo)軸左側(cè)沒有相應(yīng)的長尾,即很少有審查比率在重大事件期間下降的案例)。顯然數(shù)量爆發(fā)往往伴隨著審查強(qiáng)度的大幅提高,即使跟接下來的6個(gè)月相對比也是如此。
能引發(fā)數(shù)量爆發(fā)的事件的性質(zhì)
我們發(fā)現(xiàn),由群體性事件,批評審查者和色情事件引發(fā)的數(shù)量爆發(fā)會(huì)遭到審查,但是由討論政府政策和其他新聞引發(fā)的發(fā)帖量增加則不會(huì)。
我們在下一節(jié)討論國家批評論。這里,我們提出針對本次調(diào)查結(jié)果的三個(gè)結(jié)論。
首先來看圖3的B列,其審查強(qiáng)度的分布與A列一樣均勻,并按時(shí)間類型顯示。結(jié)果很明顯:與群體性事件、批評審查者和色情(分別是紅、橘紅、黃色)相關(guān)的事件基本都在坐標(biāo)系的右邊,表明審查強(qiáng)度很高,而關(guān)于政策和新聞的事件基本都在坐標(biāo)系的左邊(分別是藍(lán)、紫色)。群體性事件的審查強(qiáng)度平均是27%,而政策和新聞的平均審查強(qiáng)度分別是1%和4%。[橫坐標(biāo)(刪除率)基本上數(shù)值很小,約為3-5%,上下波動(dòng)幅度不高。]
第二,我們列出審查強(qiáng)度最高和最低的事件案例,在圖4用相同的顏色標(biāo)注。群體性事件可能性最高的事件包括內(nèi)蒙古牧民被運(yùn)煤車撞死事件、增城孕婦遭保安毆打引發(fā)民工騷亂事件、艾未未被捕、撫州征地爆炸案。明顯的是,“群體性事件可能性”最高的事件根本與政治無關(guān):日本地震和核電廠事故發(fā)生后,浙江出現(xiàn)謠言,稱碘鹽可以抵御核輻射,于是民眾搶購食鹽。這個(gè)謠言沒有科學(xué)依據(jù),也和國家無關(guān),但卻遭到了嚴(yán)格的審查;原因大概是政府認(rèn)為在某些地區(qū)出現(xiàn)了群體性的情緒失控。實(shí)際上,我們發(fā)現(xiàn)地方網(wǎng)站對碘鹽謠言審查要比全國性網(wǎng)站來得嚴(yán)格。[在圖4的兩個(gè)相關(guān)事件中,社交媒體的新聞和討論中經(jīng)常會(huì)添加色情內(nèi)容,以吸引眼球。]
與我們的“潛在群體性事件防范論”結(jié)論一致的是,一些審查最嚴(yán)格的事件不是對國家政策的批評或討論,而是可能引發(fā)群體聚集的地方性群體表達(dá)自己的看法。一個(gè)例子是,溫州的一個(gè)當(dāng)?shù)鼐W(wǎng)站出現(xiàn)了一些網(wǎng)貼,聲援環(huán)保人士陳飛。陳飛力挺用于保護(hù)當(dāng)?shù)丨h(huán)境的環(huán)保彩票。雖然陳飛受到了中央政府的支持,但是,所有關(guān)于他的網(wǎng)貼都被當(dāng)?shù)鼐W(wǎng)站刪除了,原因有可能是他過去組織過群體性活動(dòng)。2000年后,陳飛建立了綠色環(huán)保志愿者協(xié)會(huì),擁有超過400名注冊會(huì)員,創(chuàng)立了中國首個(gè)“無塑料袋村莊”,最終推動(dòng)了關(guān)于使用塑料袋的立法程序。
另一個(gè)例子是關(guān)于江蘇沭陽兒童鉛中毒事件。相關(guān)的網(wǎng)絡(luò)網(wǎng)貼討論了天能集團(tuán)的電池廠導(dǎo)致兒童健康狀況受污染的事情,醫(yī)院拒絕向受害兒童父母公布檢測報(bào)告。2011年1月,沭陽村民在電池廠門前要求解釋。審查者絕不容許這類群體性集結(jié),無論它是支持政府或批評政府。
所有被標(biāo)記為“可能發(fā)生群體性活動(dòng)”的事件中,事件內(nèi)的審查比事件外的審查更為密集。另外,平均來看,這些事件比其他事件的審查率要高得多。這些事實(shí)與我們的分析一致,即,審查者會(huì)主動(dòng)搜尋并刪除那些與“可能發(fā)生群體性活動(dòng)”事件有關(guān)的網(wǎng)貼。不過,我們想進(jìn)一步分析審查的不同力度:雖然我們已經(jīng)采取了定量分析,但顯然,“可能發(fā)生群體性活動(dòng)”中的某些事件要比另一些事件敏感性高得多。因此,通過分析個(gè)別事件,可以看出,審查程度低的事件,其發(fā)生群體性活動(dòng)的可能性也較低。
以下舉例分析。動(dòng)畫電影《功夫熊貓2》上映時(shí),關(guān)于電影種族歧視的抗議出現(xiàn)了言論的數(shù)量爆發(fā),但這導(dǎo)致發(fā)生大規(guī)??棺h的可能性顯然極低。另一個(gè)例子是錢云會(huì)事件,這位浙江農(nóng)民帶領(lǐng)村民抗議當(dāng)?shù)卣鞯匮a(bǔ)償不公,后來被卡車壓死。錢云會(huì)遭遇的這兩件事都發(fā)生在我們調(diào)查以前。在我們調(diào)查期間,錢云會(huì)的遺屬為了爭取賠償又引發(fā)了一次熱點(diǎn),但這一事件的網(wǎng)貼數(shù)量爆發(fā)更為集中、事件本身對無關(guān)人員的煽動(dòng)性卻較低。
最后,我們給出三類事件更為詳細(xì)的一些例子,其中每一類事件都基于某一話題領(lǐng)域的隨機(jī)網(wǎng)貼。首先,圖5給出了4個(gè)例子,一開始都是審查力度很低,然后相關(guān)言論突然出現(xiàn)數(shù)量爆發(fā),審查強(qiáng)度也就隨之增加。無論是刪帖的絕對數(shù)量,還是刪帖占所有網(wǎng)貼的比例,都是非常高。4張圖表(還有其他例子,本文無法一一列舉)的結(jié)論很明顯:中國政府在言論數(shù)量爆發(fā)期會(huì)加倍投入審查。
我們進(jìn)一步分析了(按照Grimmer and King 2011的分析方法)可能發(fā)生群體性事件的言論數(shù)量爆發(fā)期間沒有被刪除的那些網(wǎng)貼,如圖5的a坐標(biāo)所示,紅色區(qū)域并沒有完全覆蓋灰色區(qū)域。這些未被刪除的網(wǎng)貼與事件沒有直接關(guān)系,但恰巧包含了事件話題的敏感詞。我們再次發(fā)現(xiàn),審查者在增加審查強(qiáng)度時(shí),操作非常精準(zhǔn),極少誤傷。自動(dòng)分類不可能達(dá)到如此高的準(zhǔn)確度。
第二,我們在表6中給出4個(gè)話題,這4個(gè)話題都至少導(dǎo)致1個(gè)話題數(shù)量爆發(fā)期,但沒有遭到審查。其中包括重大而富有爭議性、具有潛在煽動(dòng)性的話題,計(jì)劃生育、教育改革、腐敗和電價(jià)調(diào)整,但均與地方性的示威游行無關(guān),所以,審查強(qiáng)度一直非常低。
最后,我們發(fā)現(xiàn),幾乎所有的話題都呈現(xiàn)出圖5和圖6的趨勢。兩種模式如圖7所示。這些話題包括色情內(nèi)容(坐標(biāo)a)和對審查者的批評(坐標(biāo)b)。這些話題的特點(diǎn)是,6個(gè)月內(nèi)其審查強(qiáng)度始終很高,并且,沒有在數(shù)量爆發(fā)期增加審查強(qiáng)度。美國政客將色情內(nèi)容視為挑戰(zhàn)國家的“道德操守”,中國領(lǐng)導(dǎo)層也將其視為腐蝕年輕人身心健康的產(chǎn)物,并且是社會(huì)不穩(wěn)定因素之一;總之,必須對其進(jìn)行審查。
更令人驚訝的是審查者的“不當(dāng)行為”:他們允許中國人批評任何一位政治家,但不允許批評審查者自己;允許批評每一項(xiàng)政策,但不允許批評言論審查政策本身;允許批評每一個(gè)項(xiàng)目,但不允許批評他們自己的項(xiàng)目。就算是用中國自己的牽強(qiáng)理由來看,圖7所示的結(jié)果仍可稱得上是驚人之舉。
哪些要?jiǎng)h除,哪些無需刪除
我們的最后一項(xiàng)測試是比較刪除的網(wǎng)貼和未刪除的網(wǎng)貼的內(nèi)容。“國家批評防范論”認(rèn)為,批評政府的網(wǎng)貼都會(huì)被刪除,無論它有沒有引發(fā)群體性事件的可能性。相反,“潛在群體性事件防范論”認(rèn)為,有關(guān)群體性事件的網(wǎng)貼都會(huì)被刪除,無論它是批評或贊揚(yáng)國家;而那些無關(guān)群體性事件的網(wǎng)貼,無論對政府是褒是貶,都不會(huì)被刪除。
為了執(zhí)行此次大規(guī)模測試,我們需要一種自動(dòng)文本分析手段。因此,我們將Hopkins和King(2010)分析英語的方法應(yīng)用到漢語文本。這個(gè)方法不需要機(jī)器翻譯、個(gè)別話題分類計(jì)算或鑒別每個(gè)話題的關(guān)鍵詞(當(dāng)然,免不了會(huì)發(fā)生錯(cuò)誤);其方案只需一小部分的中文文本。我們采用了一系列嚴(yán)格的測試,并獲得高度精確的結(jié)果——如同人工閱讀和分類一般。我們在附件B中描述這一方法,并列舉若干例子。
就我們的分析而言,我們將網(wǎng)貼內(nèi)容分為3類:(1)批評政府(2)支持政府(3)與事件無關(guān)的報(bào)道或事實(shí)性的報(bào)道。不過,我們對每個(gè)類別中的網(wǎng)貼比例沒有興趣,對刪除的網(wǎng)貼和未刪除的網(wǎng)貼的比例也沒興趣——那是Hopkins和King的研究方法。我們的方法是,估計(jì)并比較每一個(gè)類別中被刪除的網(wǎng)貼的比例。因此,我們使用的貝葉斯方法(參見附件2),對Hopkins和King的方法進(jìn)行改進(jìn)。
我們首先分析特定的事件,然后從所有的事件中隨機(jī)抽取網(wǎng)貼。關(guān)于群體性事件,我們精確選擇了艾未未被捕、內(nèi)蒙古抗議、撫州拆遷爆炸事件。圖8的坐標(biāo)(a)呈現(xiàn)了每一個(gè)事件中刪除網(wǎng)貼的比例,其中,批評政府的用紅色表示,支持政府的用綠色表示;縱坐標(biāo)是95%置信區(qū)間。顯而易見,無論網(wǎng)貼支持或反對政府,刪除率都很高,平均是80%。雖然常識(shí)認(rèn)為刪帖是為了過濾批評政府的聲音,但測試表明,批評政府的網(wǎng)貼的被刪概率并不比支持政府的網(wǎng)貼高。這支持了“群體性事件防范論”結(jié)論,并與“國家批評論”相悖。
我們還從圖6中選取了三個(gè)主題,進(jìn)行平行試驗(yàn)。這三個(gè)主題都沒有導(dǎo)致群體性活動(dòng)的可能性:計(jì)劃生育、反腐政策和物價(jià)上漲的新聞。結(jié)論與我們的預(yù)期相符:無論支持或反對政府,相關(guān)網(wǎng)貼的刪除率都很低,平均約為10%。
為了檢驗(yàn)以上結(jié)論的普遍有效性,我們從所有數(shù)量爆發(fā)的主題中隨機(jī)選取沒有群體性活動(dòng)可能性的網(wǎng)貼。圖9顯示的結(jié)論與圖8一致,群體性活動(dòng)可能性高的事件刪除率也高,無論網(wǎng)貼是支持還是反對政府,而新聞和政策性事件的網(wǎng)貼刪除率較低。同上,支持或反對政府的態(tài)度對刪除率影響不大,而與群體性活動(dòng)的關(guān)系則很大。
結(jié)論很清楚:如果網(wǎng)貼牽涉到群體性活動(dòng)的可能性,那就會(huì)被刪除;否則就不會(huì)被刪除。無論網(wǎng)貼支持或反對政府、領(lǐng)導(dǎo)人或政策,都與刪除率無關(guān)。
最后,我們列舉幾個(gè)中國社交媒體的網(wǎng)貼內(nèi)容。首先,我們舉出兩個(gè)無關(guān)群體性活動(dòng)可能性的網(wǎng)貼,雖然網(wǎng)貼內(nèi)容都批評了政府和領(lǐng)導(dǎo)人。例如,以下網(wǎng)貼直接進(jìn)行了人身攻擊,點(diǎn)名當(dāng)?shù)卣?
這是一個(gè)漠視生命的市政府[陜西省榆林市]、一個(gè)官員橫行的市政府、一個(gè)沒有公正的市政府,一個(gè)低級趣味的市政府,一個(gè)包二奶的市政府,一個(gè)為錢不要臉的市政府,一個(gè)為個(gè)權(quán)不要人格的市政府,一個(gè)沒有血性的市政府,一個(gè)沒有道德底線的市政府,一個(gè)出爾反爾的市政府,一個(gè)忘恩負(fù)義的市政府,一個(gè)不要子孫后代的市政府,一個(gè)什么怪事都出的市政府,一個(gè)什么的市政府,只要你想到的就有……
另一位博主尖銳地批評了中國的計(jì)劃生育政策,同樣未被刪除:
可以提倡人民自愿節(jié)育,但讓人斷子絕孫的強(qiáng)制節(jié)育,搞30年已是忍辱負(fù)重,不能形成路徑依賴,將不得已的臨時(shí)性惡政無限延長……可以毫不夸張地講,計(jì)劃生育是農(nóng)民最痛苦的暴政。雖說是“必要的惡”,卻是世界少有,遭到世界輿論的廣泛譴責(zé),實(shí)在不該以此為豪。
最后,以下博文尖銳批評中國共產(chǎn)黨背棄民主和憲政諾言,但也沒被刪除:
我一直將中國的近代史視為一場改良與革命的賽跑,在清末的大賽場上,最終革命跑到了頭,改良的一切設(shè)計(jì),在武昌起義槍聲響起后成了廢紙。中共的民主憲政承諾,是抗戰(zhàn)結(jié)束前開出的遠(yuǎn)期支票,超過了一個(gè)甲子仍未兌現(xiàn)。當(dāng)今中國社會(huì)缺乏誠信,要從毛澤東開始問責(zé)。鄧小平在80年代提出的政治體制改革,之后被長期擱置……近年所謂“黨主立憲”之說,也是主流學(xué)者為維系一黨執(zhí)政地位所做的政治設(shè)計(jì)。
這些網(wǎng)貼既非特例,也不反常:我們的數(shù)據(jù)庫中還有幾千條負(fù)面網(wǎng)貼,包括所謂的敏感主題,例如一黨執(zhí)政,并沒有瞞過審查體制。證據(jù)表明,審查者無意阻止這些網(wǎng)貼的出現(xiàn)。相反,他們注重刪除關(guān)于群體性活動(dòng)可能性的網(wǎng)貼,無論是否牽涉到中國領(lǐng)導(dǎo)人或政府的政策。
為了強(qiáng)調(diào)以上論點(diǎn),我們給出兩個(gè)有關(guān)群體性事件可能性的網(wǎng)貼,這兩個(gè)網(wǎng)貼都支持政府,但卻很快遭到刪除。在撫州爆炸事件中,政府刪除了這個(gè)網(wǎng)貼,雖然它明確譴責(zé)錢明奇,并褒揚(yáng)政府在動(dòng)遷過程中的工作:
爆炸案造成他本人和多名政府工作人員死亡的悲劇,即使錢明奇在微博里所稱拆遷造成的個(gè)人損失是屬實(shí)的,我們也應(yīng)譴責(zé)他的極端報(bào)復(fù)行為……政府在連續(xù)出臺(tái)保護(hù)被拆遷者利益的政府法規(guī),媒體也在為公平對待被拆遷者大聲疾呼,各地拆遷補(bǔ)償款上升速度,大多高于商品房售價(jià)上升速度,在不少地方,補(bǔ)償款已經(jīng)足以改變一個(gè)家庭的命運(yùn)。
另一個(gè)例子是下面這個(gè)被刪的網(wǎng)貼,它同樣支持政府。該帖指責(zé)當(dāng)?shù)仡I(lǐng)導(dǎo)冉建新涉嫌腐敗,而他在被警察監(jiān)禁期間的死亡引發(fā)利川游行:
湖北省巴東縣委宣傳部都在其官方網(wǎng)站發(fā)布新聞通稿稱,冉建新在擔(dān)任利川市都亭辦事處常委書記、主任期間,利用職務(wù)之便,在征地拆遷、工程發(fā)包等事項(xiàng)中為他人謀取利益,收受他人賄賂,涉嫌受賄犯罪。
結(jié)語
我們提供的新數(shù)據(jù)和新方法表明了中國網(wǎng)民、中國的言論審查機(jī)制以及中國政府關(guān)注的網(wǎng)絡(luò)內(nèi)容各不相同,還揭示了政府壓制信息傳播的秘密機(jī)制,以及中國領(lǐng)導(dǎo)層的關(guān)注點(diǎn)、意圖和目標(biāo)。
證據(jù)表明,中國的領(lǐng)導(dǎo)層允許社交媒體發(fā)展,允許對政府、政策、領(lǐng)導(dǎo)人的負(fù)面、正面批評。因此,政府的政策有時(shí)被職責(zé)為非常糟糕,領(lǐng)導(dǎo)人臉面無光,這和民主國家的民選政客并無二致;不過,他們似乎已經(jīng)意識(shí)到,丟臉不會(huì)影響到他們的位子,只要不發(fā)生群體性事件——政府以外的權(quán)力控制群眾的行為??梢哉f,中國人在個(gè)體上是自由的,但群體上是受控制的。
解釋中國政府這一策略的研究已有很多,我們在此提出一些初步性設(shè)想。首先,只要不發(fā)生群體性事件,社交媒體就是獲取對中國政府和官員的意見的良好渠道。當(dāng)然,必須考慮到公眾發(fā)表意見的成本越來越低,政府也越來越懂得如何滿足并緩和公眾的情緒。從這個(gè)角度來看,目前的模式或許是政府利用社交媒體掌握權(quán)力的最佳手段。例如,Dimitrov(2008)提出,人民如果不再抱怨政府,政府就會(huì)垮臺(tái);因?yàn)?,這表明在人民心中,政府已經(jīng)沒有了合法性。同樣,Egorov、Guriev、Sonin(2009)提出,缺少自然資源優(yōu)勢的獨(dú)裁政府會(huì)允許媒體更為自由,以便增強(qiáng)其執(zhí)政能力。引申開來講,這與我們的中國研究遙相呼應(yīng),即,容許批評可以增強(qiáng)政府的合法性,鞏固政權(quán)。Lorentzen(2012)提出了一種規(guī)范性模式,威權(quán)政府調(diào)和媒體自由與言論審查這兩種政策,在減少地方腐敗的同時(shí),鞏固政權(quán)的穩(wěn)定性。也許,研究規(guī)范性模式的學(xué)者可以吸收我們的經(jīng)驗(yàn)性結(jié)論,進(jìn)一步發(fā)展他們的理論。
進(jìn)一步說,本文的數(shù)據(jù)引申出研究中國政治、比較政治學(xué)的新方法和新思維。就中國研究而言,我們的方法反映了威權(quán)政府的彈性、中央-地方關(guān)系、次國家層面的政治、國際關(guān)系和中國的外交政策。
通過分析國家層面和地方層面不同的敏感話題,本文表明,在某些領(lǐng)域,地方政府可以獨(dú)立行事。另外,我們的分析明確地揭露了政府的意圖,展現(xiàn)出各級政府的意圖差異。我們分析了社交媒體和言論審查的實(shí)際內(nèi)容,這有助于揭示中國的國際關(guān)系和外交政策,例如,民族主義的呈現(xiàn)是否會(huì)限制政府的外交活動(dòng)?最后,中國的審查機(jī)制可以被視為一種建設(shè)性機(jī)構(gòu)。Nathan(2003)將其視為威權(quán)政府彈性機(jī)制的一部分,或可反映中國共產(chǎn)黨的體制化和長期執(zhí)政的秘訣。
就比較政治學(xué)而言,我們的工作可以直接展現(xiàn)國家能力、威權(quán)政府的長期執(zhí)政和執(zhí)政變化。最近關(guān)于阿拉伯之春中的互聯(lián)網(wǎng)和社交媒體的研究(Ada et al. 2012;Bellin 2012)質(zhì)疑了這些技術(shù)組織群體性活動(dòng)和擴(kuò)散地區(qū)信息的功能,反而強(qiáng)調(diào)這些技術(shù)創(chuàng)新對維持威權(quán)政府執(zhí)政的積極作用。Edmond(2012)研究了信息資源(互聯(lián)網(wǎng)、社交媒體等)對政權(quán)的壞處,而如果政府擁有足夠的經(jīng)濟(jì)能力,它就可以控制信息資源?;ヂ?lián)網(wǎng)和社交媒體的經(jīng)濟(jì)規(guī)模目前在中國還不大,而中國政府將言論審查的責(zé)任下放到了地方上的互聯(lián)網(wǎng)經(jīng)營商,因此,中國能夠繼續(xù)款擴(kuò)張這一新興技術(shù)的經(jīng)濟(jì)規(guī)模。中國是一個(gè)相對富裕、有彈性的威權(quán)國家,審查機(jī)制復(fù)雜、有效,它也許是全世界獨(dú)裁者的關(guān)注對象。
我們分析了中國審查機(jī)制的主要目標(biāo),揭示了中國網(wǎng)民的關(guān)注點(diǎn)、中國政府的意圖和目標(biāo)。雖然我們只分析了不同時(shí)間段的85個(gè)話題,但這種分析還可以延伸到更廣泛的領(lǐng)域。在傳統(tǒng)媒體沒有提供任何線索的情況下,審查行為或可預(yù)示政府在線下的下一步行動(dòng),為政府政策和商業(yè)活動(dòng)的學(xué)術(shù)研究和實(shí)踐提供啟發(fā)。
我們構(gòu)建了計(jì)算機(jī)輔助文本分析法,有效分析了中文文本。這些方法還可推廣至其他領(lǐng)域。我們設(shè)想,我們的數(shù)據(jù)手機(jī)程序、文本分析手段、總體分析和經(jīng)驗(yàn)策略可以推廣至世界其他壓制言論自由的地域。
附錄C【附錄A羅列敏感詞列表、附錄B介紹計(jì)算方法,此處略——譯者注】
如果說審查行為是衡量政府意圖和意愿的一種手段,那么,考察審查行為就可以為預(yù)測政府行為提供一些線索。我們就此進(jìn)行測試。不過,中國政府的大部分行為都是針對外部事件的評論或反應(yīng),都可以事先預(yù)測。困難的是那些無法預(yù)測的事例,我們在此挑出其中與群體性活動(dòng)可能性有關(guān)的事例進(jìn)行研究。
我們本來沒有就此專門搜集數(shù)據(jù),但根據(jù)手頭的數(shù)據(jù),仍可進(jìn)行間接的驗(yàn)證。我們采用了廣為流傳的數(shù)據(jù)控制手段(King and Zeng 2001)。首先,我們抽取與群體性活動(dòng)可能性有關(guān)的所有真實(shí)事例,然后剔除那些容易被預(yù)測的事例。于是,便剩下了兩個(gè)事件,這兩個(gè)事件都不能事先預(yù)測:2011年4月3日艾未未被捕,以及2011年6月25日與越南的南海爭端。我們分析這兩個(gè)事例,并證明,政府的反應(yīng)可以從審查行為的數(shù)據(jù)中預(yù)測出來。另外,正當(dāng)本文于2012年初收尾之際,中國發(fā)生了薄熙來事件,這一件事件被認(rèn)為“是數(shù)十年來振動(dòng)中國政壇的最大丑聞”(Branigan 2012),并將“困擾下一代中國領(lǐng)導(dǎo)人”(Economy 2012)。碰巧,我們的數(shù)據(jù)監(jiān)控還沒結(jié)束。因此,這成為了我們研究的第三個(gè)事例。
接著,我們要確定審查行為能夠提前多久預(yù)測(突發(fā))事件。時(shí)間間隔必須足夠長,以顯示審查行為的存在;但也不能太長,以防數(shù)據(jù)波動(dòng)淹沒了審查者的干預(yù)跡象。我們選擇5天為合適的間隔,這不一定準(zhǔn)確,但不影響我們此處的數(shù)據(jù)。因此,我們架設(shè)中國當(dāng)局預(yù)先5天采取行動(dòng),并且在審查模式上可以體現(xiàn)出這一跡象。
在圖11的坐標(biāo)a中,我們來觀察艾未未被捕事件??v坐標(biāo)是被刪除的網(wǎng)貼比例?;疑珔^(qū)域是從(我們假設(shè)的)采取行動(dòng)的日期到艾未未真正被捕的日期。我們從新聞媒體中無法得知艾未未即將被捕。藍(lán)色線段是實(shí)際的審查力度,紅色線段是根據(jù)此前的數(shù)據(jù)推算出來的趨勢。4月3日紅線與藍(lán)線的差距是我們的粗略估計(jì);如果政府沒有特別行動(dòng),實(shí)際的審查力度應(yīng)該是將近10%;但最終的實(shí)際審查力度是預(yù)估值的兩倍。為了證明這不是偶然現(xiàn)象,我們選取了任意5天間隔,均沒有出現(xiàn)如上反?,F(xiàn)象。
我們用這個(gè)方法再來驗(yàn)證圖11坐標(biāo)b的南海事件。南海的石油勘探導(dǎo)致北京與河內(nèi)關(guān)系持續(xù)緊張,審查率暴增。根據(jù)媒體報(bào)道,沖突一直持續(xù),直到6月25日兩國突然達(dá)成和平協(xié)議。我們再度隨機(jī)采樣,證明這一反?,F(xiàn)象絕非偶然。
最后,我們來看薄熙來事件。薄熙來的父親是中共八大元老之一。薄熙來被認(rèn)為是2012年秋季召開的中共十八大的新一屆常委熱門人選??墒牵恼紊鼌s突然終止。2012年2月6日,王立軍逃入成都的美領(lǐng)館。四天前,王立軍剛被薄熙來免職。王立軍揭發(fā)了薄熙來參與謀殺英國公民的秘密,然后,薄熙來被免職。由于事件反常地揭示了中共高層內(nèi)部的分歧,我們專門來分析2月2日王立軍被薄熙來免職的事件。據(jù)稱,王立軍與薄熙來就海伍德之死發(fā)生了沖突,引發(fā)薄熙來采取行動(dòng)。
我們的分析如圖11坐標(biāo)c所示,王立軍被免職以前的審查力度趨勢與實(shí)際的審查力度差距很大。王被免職以前,媒體沒有任何透露的消息。同樣,我們做了驗(yàn)證測試,證明這不是偶然現(xiàn)象。
這三個(gè)事例都證明了我們的結(jié)論,但我們是事后分析,且只有這三個(gè)例子,所以,還需要對審查率和可預(yù)測性之間的做進(jìn)一步研究。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 網(wǎng)絡(luò)安全-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 張苗鳳 
-
國際頂尖數(shù)學(xué)物理學(xué)家尼古拉·萊舍提金入職清華
2021-11-19 15:44 中西教育 -
國臺(tái)辦:堅(jiān)決反對并將堅(jiān)決打擊
2021-11-19 15:34 臺(tái)灣 -
安徽鼓勵(lì)三胎:延長產(chǎn)假60天,男方享30天護(hù)理假
2021-11-19 15:23 -
浪潮集團(tuán)通報(bào):員工私自懸掛
2021-11-19 14:39 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
杭州金錢豹外逃事件6人被判刑:目前仍有一只未捕獲
2021-11-19 13:12 依法治國 -
公職人員的狗咬傷人,省級電視臺(tái)調(diào)解都不管用...
2021-11-19 11:37 -
常德市委書記夫妻昨日雙雙落馬,妹妹今日被查
2021-11-19 11:21 廉政風(fēng)暴 -
首個(gè)景區(qū)元宇宙研究中心正式掛牌
2021-11-19 09:42 產(chǎn)業(yè)萬象 -
31省份新增本土確診8例,涉及遼寧、河南
2021-11-19 09:04 新冠肺炎抗疫戰(zhàn) -
腐敗夫妻檔,同日被查
2021-11-19 09:02 廉政風(fēng)暴 -
中國自主知識(shí)產(chǎn)權(quán)新冠抗體藥物JS016有效性獲世界認(rèn)可
2021-11-19 08:46 新冠肺炎抗疫戰(zhàn) -
遼寧大連新增本土確診7例
2021-11-19 08:16 新冠肺炎抗疫戰(zhàn) -
香港一巴士發(fā)生側(cè)翻,致1死10傷
2021-11-19 07:13 香港 -
成都一施工區(qū)域發(fā)生交通事故致3死2傷,警方:相關(guān)人員被刑拘
2021-11-19 07:02 依法治國 -
直抵海南!明起全國普降6至10℃
2021-11-18 21:28 極端天氣 -
巴黎歐萊雅回應(yīng):補(bǔ)償優(yōu)惠券及金卡會(huì)員
2021-11-18 20:49 -
習(xí)近平:在國家核心利益、民族尊嚴(yán)問題上決不退讓
2021-11-18 20:08 國家安全 -
中印舉行邊境事務(wù)會(huì)議:積極籌備第14輪軍長級會(huì)談
2021-11-18 19:30 龍象之間 -
二十大代表怎么選?中央發(fā)文明確
2021-11-18 19:04 -
長沙市公安局黨委副書記、副局長李湘江被查
2021-11-18 18:11 廉政風(fēng)暴
相關(guān)推薦 -
最新聞 Hot
-
“對等關(guān)稅”竟是這么算的?經(jīng)濟(jì)學(xué)家集體傻眼
-
“果然,中國說對了”
-
加拿大發(fā)愁:躲過子彈,卻撞上坦克
-
內(nèi)塔尼亞胡來了,匈牙利退了
-
“禁令之前就有,但伯恩斯離任前擴(kuò)大了范圍”
-
“地球上沒一個(gè)地方是安全的”
-
“美國是特朗普關(guān)稅政策下的最大輸家”
-
“對臺(tái)灣地區(qū)沖擊明顯,非常可怕”
-
“剛剛,我看到了未來,它不在美國”
-
誰被征了50%的最高關(guān)稅?
-
四名共和黨議員倒戈阻止對加關(guān)稅,特朗普破口大罵
-
“特朗普會(huì)讓世界團(tuán)結(jié)起來,減少對美依賴”
-
特朗普發(fā)動(dòng)全球關(guān)稅戰(zhàn),美國VS全世界
-
結(jié)束全球化?“不是按個(gè)開關(guān),美國就能搖身一變”
-
諾獎(jiǎng)得主克魯格曼:特朗普在貿(mào)易上已經(jīng)徹底瘋了
-
特朗普“汽車關(guān)稅”也落地了,“日本GDP將萎縮0.3%”
-