隨著信息技術迅猛發(fā)展,新型信息分析技術被應用到政治學研究中來。許多政治學研究者采用當前比較成熟的大數(shù)據(jù)爬取、大數(shù)據(jù)文本分析等技術,獲取新的研究素材并進行分析整理。同時,以億萬為量級單位的大數(shù)據(jù)本身就具有政治學研究價值。可以說,大數(shù)據(jù)為政治學帶來研究方法上的創(chuàng)新,也進一步拓展了政治學研究領域。
基于大數(shù)據(jù)對網(wǎng)絡民意進行研究。網(wǎng)絡上有許多現(xiàn)成數(shù)據(jù)可以用于對網(wǎng)絡民意和政府部門回應進行研究。一些政治學研究者常把兩類網(wǎng)絡大數(shù)據(jù)用作分析素材:一類是政府網(wǎng)絡問政平臺上的群眾留言及相關部門回復信息,另一類是主流媒體網(wǎng)站以及微博、微信等社交媒體平臺上的網(wǎng)民發(fā)帖信息。這些數(shù)據(jù)都可通過數(shù)據(jù)爬取技術直接獲取。第一類數(shù)據(jù)經(jīng)過分析處理后,可以反映群眾關注的議題類型分布、政府相關部門回應的特點和問題解決程度。還可以進一步分析特定類型群體在什么時期大致提出哪些類型的訴求。第二類數(shù)據(jù)主要用于分析網(wǎng)民對某一具體事件的看法和態(tài)度。對微博等社交媒體的數(shù)據(jù)分析,不僅關注具體話題,還將話題和情感、偏好等因素分析相結合,呈現(xiàn)網(wǎng)絡民意對某個具體事件的態(tài)度演變過程及影響網(wǎng)絡民意變化的具體因素??梢哉f,網(wǎng)絡大數(shù)據(jù)的應用極大豐富了政治學對網(wǎng)絡民意的研究方式。
對文本轉換后的大數(shù)據(jù)進行分析。在網(wǎng)絡大數(shù)據(jù)之后,研究者嘗試挖掘其他非現(xiàn)成的、更具獨特性的大數(shù)據(jù)信息。這類信息主要有兩種,一種是從公開平臺獲取的大數(shù)據(jù)文本。這類數(shù)據(jù)通過數(shù)據(jù)爬取技術獲得,但發(fā)布這些數(shù)據(jù)的平臺并非人人皆知,需要研究者去搜尋。目前,政治學研究者較多關注并取得研究進展的大數(shù)據(jù)主要有:從裁判文書網(wǎng)獲取的司法大數(shù)據(jù),從人大代表的議案建議庫和政協(xié)委員的提案庫中獲得的文本大數(shù)據(jù)等。隨著政府信息公開力度加大,這類可供研究的信息資源會越來越豐富。另一種數(shù)據(jù)需要先進行文本轉換才可使用,如對歷史資料的研究。相當數(shù)量的歷史資料是以圖片形式而非文本形式存在的,這就需要通過識別技術將圖片信息轉換為文字文本,然后進行大數(shù)據(jù)分析。這類數(shù)據(jù)的獲取難度較高,不過一旦形成數(shù)據(jù)庫,對政治學研究則有較大幫助。
大數(shù)據(jù)為政治學提供新的研究素材和分析技術,但并未改變政治學研究的本質。面對層出不窮的新素材和新工具,政治學研究者需要保持清醒頭腦,不能陷入對數(shù)據(jù)和方法的盲目追求中。同時,應結合政治學研究本身的特點,發(fā)揮大數(shù)據(jù)技術優(yōu)勢,推動信息技術在政治學研究應用中取得更多突破。一是開發(fā)更多樣化的大數(shù)據(jù)類型。目前,政治學研究分析的大多是文本形式的大數(shù)據(jù)。文本信息只是浩瀚信息世界中的一種,還有圖片、音頻、視頻等大量信息類型有待開發(fā)利用。這些類型的大數(shù)據(jù)有的在商業(yè)領域已有較成熟的應用,研究者可考慮以合適方式將其應用于政治學研究。二是探索更前沿的大數(shù)據(jù)分析技術。現(xiàn)有的分析技術還離不開人工標注,需要政治學研究者從大數(shù)據(jù)中抽出很小一部分,對這部分數(shù)據(jù)進行人工閱讀和標注,然后利用機器學習的方法,讓計算機基于人工標注的數(shù)據(jù)去分析剩下的大量數(shù)據(jù),嘗試得出相應結論。由于人工標注的數(shù)量不等,分析的效果也參差不齊。在文本挖掘上,需要進一步開發(fā)更先進的技術。三是實現(xiàn)更復雜的大數(shù)據(jù)分析目標。現(xiàn)有的大數(shù)據(jù)分析主要是對數(shù)據(jù)所體現(xiàn)的政治現(xiàn)象進行描述,尚未具備解釋政治現(xiàn)象、發(fā)現(xiàn)運行規(guī)律以及進行預測的功能,這需要更進一步的技術支持和研究突破。從這個角度看,大數(shù)據(jù)的開發(fā)利用在政治學研究領域還有更為廣闊的發(fā)展前景。
(作者為中山大學政治與公共事務管理學院教授)