網站首頁 | 網站地圖

大國新村
首頁 > 原創(chuàng)精品 > 成果首發(fā) > 正文

另類數據:經濟增長的新亮點

【摘要】在疫情之后全球和我國經濟發(fā)展進入數字經濟新階段的背景下,另類數據的發(fā)展已經在宏觀、中觀和微觀等應用場景中得到了實際應用。在宏觀方面,另類數據被用于編制物價、就業(yè)狀況、疫情復工等指數,幫助我們更加清晰地認識和分析經濟形勢;在中觀方面,另類數據通常用來整體分析企業(yè)經營情況、預測行業(yè)景氣程度等,跟蹤產業(yè)發(fā)展狀況;在微觀方面,另類數據的應用場景主要集中在投資決策輔助和個人信用判斷等。毋庸置疑,另類數據與傳統(tǒng)數據相互補充,將共同組成數字經濟時代的生產要素,其行業(yè)本身也會成為經濟增長的新亮點。

【關鍵詞】另類數據 傳統(tǒng)數據 經濟增長

【中圖分類號】F49 【文獻標識碼】A

【DOI】10.16619/j.cnki.rmltxsqy.2021.06.003

廖理,清華大學五道口金融學院金融學講席教授、教育部長江學者特聘教授、博導、清華大學五道口金融學院常務副院長、清華大學金融科技研究院院長、《清華金融評論》主編。研究方向為金融科技、公司金融。主要著作有《金融科技研究:前沿與探索》《全球互聯網金融商業(yè)模式》《股權分置改革與中國資本市場》等。

另類數據的應用場景

本世紀初以來,互聯網的普及,特別是移動終端的普及,使得積累數據的基礎設施不斷加強,以前無法留存的數據現在可以大規(guī)模的存儲和積累,并得到有效利用。與此同時,數據存儲的材料不斷創(chuàng)新、技術不斷提高,數據存儲的成本也大幅降低,海量的數據也大大激發(fā)和帶動了人工智能和云計算等技術的發(fā)展。

在這樣的背景下,另類數據的概念出現了。另類數據,即非傳統(tǒng)數據,目前尚未形成統(tǒng)一明確的定義,泛指區(qū)別于傳統(tǒng)金融數據的有價值的信息和數據。傳統(tǒng)金融數據是指通過常規(guī)渠道獲得的數據,例如股票、債券等的交易數據、上市公司年報和財務數據、銀行用戶的借貸數據等。不同于傳統(tǒng)數據,另類數據是典型的“大”數據,主要體現在三個方面:一是體量大,體現在規(guī)模和傳輸量;二是流動速度大,數據實時或接近實時獲取和傳輸;三是種類多,數據結構形式多樣。

另類數據主要有三方面來源。一是個人產生的數據,如社交網絡信息、產品評價、搜索記錄、購物喜好等。二是商業(yè)過程數據,如物流數據、支付數據等,也有另類數據公司采集傳統(tǒng)商業(yè)數據,如大型百貨公司客流量、大型游樂場客流量等數據。三是傳感器數據,如利用衛(wèi)星數據通過光感和熱感采集鋼廠、化工廠、原油等的開工、采集、運輸情況,另外,還有來自GPS定位、車輛軌跡和個人穿戴設備的另類數據。

海量的數據推動了另類數據市場快速發(fā)展,另類數據公司大量涌現。從數據積累方面看,根據國際數據公司(International Data Corporation,簡稱IDC)的一份報告,2018年全球有33ZB的數據,而這個數量預計在2025年會增長到175ZB。從另類數據公司數量上看,據AlternativeData的統(tǒng)計數據,2018年全球另類數據公司已增長到近400家,國內另類數據公司大約占100家。我們估計,目前中國已經超過了200家。國際上的另類數據公司主要分為三類:一是原始數據提供者,這類供應商只收集最原始的另類數據,對于數據的處理程度最小;二是輕處理數據提供者,提供與金融資產相關的可視化數據;三是信號提供者,一般專注于某個特定行業(yè),向資產管理公司提供打包好的量化投資信號。

從市場空間上看,AlternativeData統(tǒng)計表明,截至2017年全球已有約800支基金利用另類數據做投資決策,2017年投資機構對另類數據的投入規(guī)模約為4億美金,行業(yè)正處于快速發(fā)展期。我們預計從2021年開始到未來的10年期間,國內每年新成立另類數據公司可達幾十家乃至100家,每年吸引投資達數十億人民幣。

疫情之后全球和我國經濟發(fā)展進入了一個新的階段,數字經濟將成為我國經濟下一個階段高質量發(fā)展的重要特征。因此,就像金融行業(yè)助力實體經濟發(fā)展一樣,另類數據行業(yè)不但會助力數字經濟的發(fā)展,其行業(yè)本身也會成為經濟增長的新亮點。

從國內發(fā)展的情況來看,另類數據已經在宏觀、中觀和微觀等應用場景中得到了實際應用。在宏觀方面,另類數據被用于編制物價、就業(yè)狀況、疫情復工等指數,幫助我們更加清晰地認識和分析經濟形勢;在中觀方面,另類數據通常用來整體分析企業(yè)經營情況、預測行業(yè)景氣程度等,跟蹤產業(yè)發(fā)展狀況;在微觀方面,另類數據的應用場景主要集中在投資決策輔助和個人信用判斷等。毋庸置疑,另類數據與傳統(tǒng)數據相互補充,將共同組成數字經濟時代的生產要素和支柱產業(yè)。

另類數據輔助經濟發(fā)展形勢分析

另類數據可用來輔助預判經濟發(fā)展形勢,為政策制定者提供更多決策依據。例如,利用另類數據編制可實時更新經濟指標CPI,來作為傳統(tǒng)指數的有效補充;也可以用于編制就業(yè)指數,提高就業(yè)指數底層數據的完整度和時效性。此外,另類數據也可為評估疫情等事件對經濟發(fā)展的影響提供及時、全面、深入的底層數據依據,以便得出準確度高、顆粒度細的結論。

1.消費者物價指數:基于網絡消費編制的數字經濟指數。消費者物價指數(Consumer Price Index,以下簡稱CPI)是反映與居民生活有關的消費品和服務價格水平變動情況的重要宏觀指標,通常用來衡量通貨膨脹的水平。CPI是市場經濟活動與政府政策的一個重要參考指標,其變化會直接影響政府宏觀經濟調控措施的出臺。傳統(tǒng)的CPI編制通常采用抽樣調查的方式選定代表性商品和價格調查地點,并派調查員通過直接上門調查的方式收集計算CPI所需的原始價格資料,之后由國家統(tǒng)計局按人口和消費水平加權匯總計算出CPI。隨著另類數據的積累,一些機構開始利用新的數據來補充傳統(tǒng)的CPI指標。

Adobe公司推出了數字經濟指數(Digital Economy Index,以下簡稱DEI),該指數旨在衡量美國和全球主要經濟體在數字經濟中購買的商品的通貨膨脹率。[1]該指數基于數字購買力(Digital Purchasing Power,簡稱DPP)計算,每月更新1次,以衡量1美元能夠購買的商品。樣本規(guī)模為美國前100家網絡電商中的80家平臺的交易信息。DEI抽取了網絡電商中電子產品、食品雜貨、服裝、書籍、玩具等18個品類的價格指數進行計算,其中食品雜貨、電子產品和服裝價格變動對DEI影響最大。在指數計算過程中,覆蓋了超過1萬億次的訪問量和超過1億個庫存量單位(Stock Keeping Unit,簡稱SKU)的數據信息。

目前,包括美國勞工統(tǒng)計局、美聯儲和美國人口普查局在內的多個政府機構和行業(yè)貿易組織都與Adobe開展合作,以便即時了解數字經濟的信息。和傳統(tǒng)基于調查的CPI統(tǒng)計口徑不同,DEI的數據是基于消費者實際購買的商品來實時計算的。另類數據的使用有效擴大了樣本規(guī)模,降低了抽樣調查的成本。通過使用高頻率和廣覆蓋的互聯網電商購物數據,DEI指數可以幫助我們更方便地衡量數字經濟環(huán)境下的物價指數和消費者購買力,能夠幫助消費者、企業(yè)和政策制定者更加全面地了解經濟情況。

2.失業(yè)率:基于網絡招聘數據編制的就業(yè)指數。就業(yè)穩(wěn)定是宏觀經濟穩(wěn)定的重要內容。失業(yè)率等反映就業(yè)市場狀況的指標是宏觀經濟的重要信息指標和宏觀調控政策的實施依據,直接關系到宏觀調控的政策應對和未來經濟的整體發(fā)展規(guī)劃。

在就業(yè)問題的研究中,傳統(tǒng)就業(yè)指數主要包括登記失業(yè)率、調查失業(yè)率和求人倍率等,目前國內外主要通過家庭抽樣調查和機構抽樣調查兩種方式來統(tǒng)計相關人員的就業(yè)情況。與傳統(tǒng)就業(yè)調查數據相比,網絡招聘數據為就業(yè)問題研究提供了更廣的覆蓋面和更強的時效性。

清華大學金融科技研究院與熵簡科技公司聯合課題組通過對全網招聘大數據進行結構化清洗和聚合,編制了“基于網絡招聘數據的就業(yè)指數”,該指數實時捕捉了就業(yè)市場整體景氣度趨勢與結構性變化,為基于就業(yè)數據的宏觀調控提供了補充參考。“基于網絡招聘數據的就業(yè)指數”分析了各大型招聘網站和各城市當地招聘網站的招聘數據,包括Boss直聘、前程無憂、智聯招聘、58同城、拉勾網等招聘網站的主要公司崗位數量、需求人數、崗位地點分布、崗位薪資分布、崗位學歷分布、崗位經驗分布、歷史崗位信息等。指數編制所使用的網絡招聘數據對我國就業(yè)市場的覆蓋率較高,可覆蓋除港澳臺之外的所有省市地區(qū),并覆蓋所有行業(yè)。

研究發(fā)現,與官方統(tǒng)計數據對比,全國線上招聘需求數據與城鎮(zhèn)新增就業(yè)數據高度相關,二者均存在很強的周期性特征。整體而言,“基于網絡招聘數據編制的就業(yè)指標”可以反映我國就業(yè)市場景氣度,輔助對相關經濟指標的預測,可以成為官方指標的重要補充。

3.疫情后的經濟分析:道口中小微經濟恢復指數。新冠肺炎疫情為全球經濟帶來了重創(chuàng),如何評估新冠肺炎疫情對經濟和生產的影響、并制定相應的應急政策是各國各部門關注的重點。另類數據憑借其可獲取量高、實時性強的特征,在突發(fā)事件應急中提供了重要支持作用。

2020年4月,清華大學五道口金融學院、道口金科聯合課題組聯合發(fā)布了“道口中小微經濟恢復指數”。該指數旨在更深入、全面地了解全國各地企業(yè),尤其是中小微企業(yè)受疫情影響的具體狀況、經濟活動恢復情況、企業(yè)面臨的問題、可能采取的行動及對政策的訴求。課題組利用道口金科通過稅務、發(fā)票、支付、工商等多個數據源整理的企業(yè)經營類數據,構建全國、各行業(yè)、各地區(qū)及不同規(guī)模企業(yè)的“道口中小微經濟恢復指數”,并從企業(yè)營業(yè)收入入手研究此次疫情對我國經濟的影響。經研究,截至2020年3月31日,從全國來看,湖北省受到疫情沖擊最嚴重,恢復指數較低,大部分中小企業(yè)業(yè)務停擺狀態(tài)時間長;從行業(yè)來看,教育業(yè)、住宿及餐飲業(yè)、文娛產業(yè)受到沖擊影響最大;中小企業(yè)方面,微型企業(yè)恢復指數較高,說明與2019年同期相比,微型企業(yè)經濟活動恢復水平高于小型和中型企業(yè)。

此指數背后的原始數據涵蓋了超過1年的日度頻率中小微企業(yè)營業(yè)金額信息,包括1.73億條企業(yè)/日營業(yè)記錄,7.84億條交易記錄;覆蓋了全國除港澳臺的31個省份和直轄市,對應著全國600多個城市,同時也覆蓋了國家統(tǒng)計局的19個行業(yè)分類,具備數據量大、維度廣、顆粒度細的優(yōu)勢,使研究人員在技術上可以對企業(yè)經濟活動恢復情況進行更準確、更多維的分析;企業(yè)經營數據可以更直觀、更完整地衡量企業(yè)經營情況,具備更顯著的經濟意義。

除了能夠較準確描摹企業(yè)經濟恢復情況外,底層的企業(yè)經營類大數據還可用來量化測算疫情沖擊對于中小微企業(yè)收入的影響。課題組利用全國600多個城市2019年以來各行業(yè)的日度匯總數據進行研究,建立了以企業(yè)營業(yè)收入的自然對數為因變量的回歸模型,并通過將疫情設為一個虛擬變量來觀察疫情對企業(yè)營收造成的影響?;貧w結果符合預期,截至2020年3月31日,新冠肺炎疫情沖擊在整體水平上會使得中小微企業(yè)收入降低69.5%;行業(yè)方面,住宿和餐飲行業(yè)、建筑業(yè)、教育業(yè)、房地產業(yè)、制造業(yè)、租賃和商業(yè)服務業(yè)的中小微企業(yè)收入受疫情的負面影響最大。

除了“道口中小微經濟恢復指數”研究之外,其他研究者們也在利用各類另類數據從多方面評估新冠肺炎疫情帶來的沖擊。例如,通過利用夜間燈光監(jiān)測、遙感衛(wèi)星紅外成像輻射儀設備來判斷復工情況;利用城市出行數據、網絡輿情數據來判斷國家經濟的恢復情況;利用支付寶旗下的“碼商”數據評估疫情對個體戶造成的影響;利用企業(yè)用電量情況估測企業(yè)復工指數等?;诹眍悢祿嫿ǖ膶崟r性指標都為我們分析疫情后的經濟形勢提供了參考。

另類數據跟蹤產業(yè)發(fā)展狀況

另類數據可以被用于跟蹤產業(yè)發(fā)展狀況,例如,分析企業(yè)經營情況和預測行業(yè)景氣程度等。作為傳統(tǒng)經營數據的補充,另類數據具有高效、海量、客觀和實地等特征,能有效提高分析、預測的準確性。

1.企業(yè)經營情況分析。不同于使用傳統(tǒng)的財務數據、經營數據來分析企業(yè)的經營情況。目前,大量機構試圖通過收集衛(wèi)星遙感數據、航班數據、手機定位數據、氣象數據等另類數據,結合深度學習等數據處理技術,將過去無法獲取或者使用的數據轉化為準確、高效的商業(yè)情報。

應用一:企業(yè)開工情況。望眼科技是國內一家將衛(wèi)星遙感、氣象、無人機、物聯網、定位等時空數據用于商業(yè)分析的數據企業(yè)。望眼科技利用衛(wèi)星遙感數據繪制了夜光數據和溫度數據,對企業(yè)開工情況進行實時掌控,降低造假風險。其中,夜光數據利用遙感衛(wèi)星獲取地面可見光情況,來分析地面人類活動情況。在企業(yè)經營分析中,反映夜晚照明情況的夜光數據可以輔助追蹤企業(yè)的經營活動,企業(yè)夜光指數的增加通常反映了企業(yè)生產經營活動的增加。溫度數據則利用傳感器收集物體發(fā)射的紅外能量,從而得到溫度信息。溫度指數通過監(jiān)測工廠內的運行溫度和周邊區(qū)域的溫度之差,來追蹤企業(yè)生產經營活動。當工廠內的運行溫度和周邊區(qū)域的溫度溫差增大時,則說明企業(yè)生產經營活動有所增加。

應用二:企業(yè)重大融資并購情況。企業(yè)高管的行程能夠在一定層面上揭示公司的潛在決策。Paragon Intel是紐約一家通過搜集企業(yè)高管數據來監(jiān)測企業(yè)經營發(fā)展的數據企業(yè)。其主要通過監(jiān)控大企業(yè)高管的航班信息,來預測企業(yè)潛在重大交易、并購的情況。在達成大筆交易之前,企業(yè)高管之間會頻繁會面。當他們不在同一城市時,高級管理人員通常乘坐公司飛機飛行至目的地,Paragon Intel實時監(jiān)控目標企業(yè)相關的公務機,獲得高管的出行數據,這些航班累計覆蓋超過200萬英里、10年時長、25000個機場、1700架飛機,遍及美洲、東歐和西歐、俄羅斯、中國沿海地區(qū)、亞洲其他地區(qū)以及北非部分地區(qū)。

2.行業(yè)發(fā)展指數。另類數據也被用于監(jiān)測相關行業(yè)的發(fā)展情況,以解決傳統(tǒng)財報數據滯后問題、新興行業(yè)信息披露不足等問題。

應用一:社區(qū)團購行業(yè)。作為2020年的新型零售模式,社區(qū)團購受到了商業(yè)領域的極大關注。在社區(qū)團購中,社區(qū)居民通過平臺的微信小程序下單,平臺匯集社區(qū)居民的購買信息再統(tǒng)一向供應商采購,最后統(tǒng)一配送到社區(qū)自提點。百觀科技是國內一家基于另類數據提供投研分析的數據平臺。該企業(yè)從2020年初開始追蹤社區(qū)團購行業(yè)數據,通過采集社區(qū)團購平臺的微信小程序,監(jiān)控近百萬個自提點以及近十萬個在售商品的銷量、價格和品類等數據。基于抓取的微信小程序數據,可對社區(qū)團購行業(yè)的市場競爭格局形成判斷,包括各平臺的地區(qū)分布、商品交易總額、商品品類分布、物流配送基礎設施搭建等情況。

應用二:ESG行業(yè)。ESG,即環(huán)境、社會和公司治理(Environment; Social Responsibility; Corporate Governance)。Truvalue Lab是一家2013年成立于美國舊金山的ESG新型數據公司,其創(chuàng)始人Hendrik Bartel看到了ESG報告數據的局限性,決定利用AI技術從公開信息中挖掘公司ESG的相關數據。Truvalue公司只會保留對公司可持續(xù)發(fā)展有實質性影響的數據,對其加以分析及量化,從而得到公司的ESG評分和趨勢變化。投資人不僅可以用其數據進行投資決策,也可以通過ESG數據及時和被投資公司溝通交流。Truvalue公司也聯合指數基金機構合作推出了ESG指數基金。Truvalue公司已于2020年10月被數據平臺FactSet收購。

應用三:線上消費行業(yè)。國內眾多另類數據公司通過抓取如天貓、京東等電商平臺的銷售數據,如行業(yè)時序銷售數據、品牌時序銷售數據、店鋪銷售數據、熱銷商品榜單、品牌市占率、商品長尾屬性構成等信息,形成對大消費行業(yè)的實時分析。對于在食品飲料、紡織服飾和家電等線上業(yè)務占比較高的行業(yè),企業(yè)的線上零售數據與財報的營收數據呈現高度相關性,可通過線上電商零售數據實現對行業(yè)發(fā)展的實時監(jiān)控。

另類數據輔助投資決策和信用評估

另類數據也極大地輔助了個人的投資決策和信用評估。例如,個人在社交媒體和應用上發(fā)布的事件信息,可以成為投資研究決策的補充信息;個人行為、生物特征等另類數據也可作為授信評估的輔助依據,為信貸記錄缺失的用戶提供金融服務。

1.投資決策輔助。社交媒體平臺是如今人們獲取新聞和信息的重要來源之一。社交媒體平臺發(fā)布的最新消息往往比主流媒體的相關報道時效性更強、傳播速度更快、覆蓋范圍更廣。依靠傳統(tǒng)媒體的延遲報道或通過主流媒體渠道均存在一定的滯后性,在黑天鵝事件中往往會對投資決策帶來不利影響。因此,大量機構通過社交媒體信息這一另類數據來輔助投資決策。

例如,Dataminr是一家美國的科技創(chuàng)業(yè)企業(yè),通過分析用戶在推特(Twitter)等社交媒體平臺上發(fā)布的信息,監(jiān)測影響力較大的事件或關鍵突發(fā)信息的最早跡象,并在事件擴散或引起嚴重連鎖反應前,提供實時報警服務以減少損失。2017年12月12日,奧地利一座大型天然氣設備發(fā)生爆炸,一位當地的目擊者在Twitter分享了一張實時火勢的照片。這一事件對股票和大宗商品交易有著重要影響,Dataminr在社交網絡上傳圖片的同時,即刻向金融機構客戶發(fā)出了預警,客戶在市場波動前就已被提前告知這一突發(fā)事件,得以及時調整投資策略、避開風險。這一突發(fā)事件直接影響了整個歐洲的天然氣供應,天然氣期貨價格飆升,整個能源行業(yè)也受到了沖擊。

2.信貸評估決策。金融機構往往依據用戶的歷史信貸記錄來進行授信決策。目前,以電信運營商數據、支付數據、航旅出行數據、申請行為數據等為代表另類數據被越來越多的用于信貸評估決策。

例如,新網銀行通過將另類數據應用于貸款評分模型中,極大地提高了貸款效率。新網銀行在信貸評估時,對用戶的電信運營商、社保公積金、航旅出行、學歷、支付行為、網絡購物、地理位置、申請信息等數據進行分析,也采集和使用了如用戶的圖片影像、生物特征、關聯網絡等數據來對客戶進行精準畫像和風險評估。而部分客戶雖銀行征信數據比較好,但存在多頭網絡借貸情況。新網銀行將這一部分另類數據也加入了評分模型,拒絕評分較低的風險客戶。

毋庸置疑,另類數據已經成為新的生產要素,另類數據行業(yè)也逐漸成為數字經濟時代的支柱產業(yè)。目前,從全球另類數據行業(yè)的發(fā)展來看,我國同其他國家處于一個起跑線上,并在應用的很多領域處于領先地位,但是應該指出的是,世界各國在發(fā)展另類數據行業(yè)方面都面臨著巨大的挑戰(zhàn),主要原因是尚未形成對另類數據行業(yè)進行監(jiān)管的成熟框架。

數據的不當獲取和使用,既能產生個人隱私和商業(yè)信息泄露的風險,也能帶來國家安全層面的風險,目前數據的獲取、加工、使用和交易等所有的環(huán)節(jié)都需要立法來規(guī)制。過去幾年,數據泄露和不當使用的案件和案例不斷發(fā)生,暴露出另類數據行業(yè)監(jiān)管的空白。在我國邁向數字經濟的征途中,如何既能發(fā)揮另類數據的巨大潛能,又能有效防范相關風險,保障另類數據行業(yè)的健康發(fā)展,是擺在我們面前的一項重要任務。

注釋

[1]Adobe此前還曾推出過數字價格指數(Digital Price Index, DPI)、就業(yè)指數(Job Seeking Index, JSI)和數字房價指數(Digital Housing Index, DHI),但目前官網已不再更新這些指數。

責 編/張 曉

Alternative Data: A New Area of Economic Growth

Liao Li

Abstract: As the global and Chinese economic development is entering a new stage of digital economy thanks to the waning pandemic, the alternative data has been applied in macro, meso and micro scenarios. In the macro aspect, the alternative data is used to compile indices of price, employment situation and post-pandemic work resumption, in order to help us understand and analyze the economic reality more clearly; in the medium aspect, the alternative data is often used to analyze the overall operation situation of enterprises, predict the prospect of the industry, and follow up on the development of the industry; in the micro aspect, the application scenarios of the alternative data are mainly focused on investment decision support and personal credit judgment. There is no doubt that the alternative data and traditional data complement each other, which will constitute the factors of production in the digital economy era, and the industry itself will become a new highlight of economic growth.

Keywords: alternative data, traditional data, economic growth

[責任編輯:張曉]