宏觀經濟分析如何借助大數據-雜誌-人人書

大數據時代對數據的挖掘、處理和分析的方式，對于傳統的宏觀經濟分析，無疑是一次大的革新

在新常态下，我國經濟面臨的形勢和任務更加複雜艱巨，政府宏觀決策對宏觀經濟分析的準确性和時效性提出了更高的要求。随着大數據時代的到來，借助大規模數據生産、分享和利用，以嶄新的思維和技術去分析，将揭示海量數據背後所隐藏的宏觀經濟運行模式。

大數據方法和技術不僅可以被深度地應用在微觀分析、行業研究領域，也可以運用在宏觀決策之中。未來，大數據既是企業占領市場、赢得機遇的利器，也是政府進行宏觀調控、國家治理、社會管理的信息基礎。而大數據時代對數據的挖掘、處理和分析的方式，對于傳統的宏觀經濟分析，無疑是一次大的革新。

大數據應用于宏觀經濟分析的趨勢

傳統的宏觀經濟分析通常是通過對比主要宏觀經濟指标、建立宏觀經濟計量模型、仿真宏觀經濟動力系統，對宏觀經濟形勢及未來發展趨勢進行判斷與預測。

在當前的大數據時代，越來越多的宏觀經濟政策制定者和相關專家學者都已經意識到，大數據對宏觀經濟分析有着革命性的影響。目前，在宏觀經濟分析及預測中運用大數據方面，無論是國外還是國内，從新型宏觀經濟指數構建，到建立新型大數據宏觀經濟預測模型，各方面都取得了一定的進展。

早期大數據在宏觀經濟分析領域的應用，主要集中在建立新的宏觀經濟指數，以便更加準确的反應宏觀經濟運行狀況。這方面的工作主要基于個人的交易記錄，包括像一些歐洲國家将銷售點掃描數據納入CPI指數編制。

特别引起關注的是麻省理工學院的經濟學家利用網上購物交易數據創建的BBP項目(BillionPricesProject)，基于不斷變化的一籃子商品所計算的日度通脹指數。這種實時的通貨膨脹指數能夠比相應的官方數據更好地反映實際經濟運行的情況。當年，在雷曼兄弟公司倒閉後，BPP的數據顯示，大部分美國企業幾乎立刻開始削減價格，這就表明總需求已經減弱。而相比之下，官方通脹機構公布的數據直到當年11月，即在10月CPI數據公布後，才對通貨緊縮有所反應。

“企業發展工商指數”是宏觀經濟分析領域中典型的大數據應用案例，也是我國政府在大數據挖掘領域的首創成果。該指數包括10個對宏觀經濟具有顯著先行性的指标，可以提前1～2個季度預測宏觀經濟發展趨勢。它改變了傳統的抽樣統計方式，利用大數據挖掘技術，對工商全量、動态的全國企業登記數據進行分析，發掘大數據價值，并采用合成企業發展工商指數，以判斷宏觀經濟走勢。

除了宏觀經濟分析與預測方面相關指數的建構，從宏觀經濟分析與預測研究的國際趨勢看，使用大數據集，建構監測預測的模型，進行經濟預測越來越廣泛，逐漸成為很多國家央行進行經濟預測的新方法和新工具。

在應用互聯網大數據進行經濟分析及預測中，使用網絡搜索引擎或網絡社交媒體記錄的關鍵詞，會有數據獲取及時、樣本統計意義明顯等優勢，預測精度較高。

GoogleTrends每天都在産生大量與經濟發展相關的查詢結果，且這些查詢結果與當下的經濟活動之間必然存在着不容忽視的關系，或許可以對預測當下的經濟活動起到非常重要的作用。并且，在此基礎上，ChoiH.&.VarianH.（2016）舉例說明了如何利用GoogleTrends預測美國零售業、汽車、住房和旅遊的銷售情況。

還有相關機構引用專業數據分析軟件公司SAS的研究數據，以社交網絡活躍度增長作為失業率上升的早期征兆，幫助政府判斷就業形勢和經濟狀況，以更好地制定經濟政策。在社交網絡上，網民們更多地談論“我的車放在車庫已經快兩周了”、“我這周隻去了一次超市”這些話題時，顯示網民可能面臨巨大的失業壓力；當網民開始讨論“我要出租房屋”、“我準備取消度假”這些話題時，顯示出這些網民可能已經失業，面臨巨大的生存壓力，這些指标是失業後的滞後标志性指标。

樣本統計轉為總體普查

大數據的發展對于宏觀經濟分析最為顯著的積極影響，莫過于使宏觀經濟分析從樣本統計時代走向總體普查時代。大數據時代的宏觀經濟分析中，傳統的樣本假設方式被抛棄，轉而以真實的海量數據來進行計算機的自動分析。

我們知道，傳統的經濟分析包括經濟計量分析是建立在抽樣統計基礎之上的，在傳統的抽樣統計分析中，往往以假設檢驗為基本模式，依靠的數據主要是樣本，将樣本假設為整體，然而，這種分析往往與事實存在或多或少的出入。

與傳統宏觀經濟分析總是局限于小規模樣本數據有所不同,在大數據時代，随着信息覆蓋範圍和數據量迅速提升,數據樣本的體量會極大地提高,甚至可以達到樣本即總體的程度。例如，就物價而言，每一筆在電子商務網站成交的交易信息都能記錄在案。這樣的情況下，宏觀經濟分析的可靠性必然大大加強。

同時，随着信息量的極大拓展和處理信息能力的極大提高，使得宏觀經濟的分析不再局限于傳統的統計分析模式，而是将抽樣分析轉變為總體分析。這一點對宏觀經濟分析意義重大，因為宏觀經濟系統紛繁複雜，如果能将對整體宏觀經濟變量的分析建立在盡可能多的關于經濟主體行為的信息以及其他諸多經濟變量的信息的基礎上，無疑将會極大地提高宏觀經濟分析的準确性。

基于推特（Twitter）平台表達的公共情緒用來預測股市變動，是很典型的例子。2008年3月到12月長達九個月間，270萬Twitter用戶推送的多達970萬條的消息，經過情緒評估工具——OpinionFinder和GPOMS被分别賦值并評估為“積極”與“消極”兩種情緒和“calm(冷靜)”、“alert(警覺)”、“sure(确信)”、“vital(活潑)”、“kind(美好)”、

“happy(高興)”六種情緒。結果發現，在道瓊斯工業平均指數和GPOMS中的“calm（冷靜）”情緒之間存在相關性。進一步研究發現，“calm（冷靜）”情緒可以很好地預測道瓊斯工業平均指數在未來2到6天的漲跌情況，而且這種每日預測的準确率高達到87.6%。

大數據時代，可獲得大而全的可得數據，甚至可抛棄原有的假設檢驗的模式，這些優勢是傳統經濟分析方法無法想象和實現的，無疑将會極大地提高宏觀經濟分析的準确性和可信度，不僅可以更加準确了解宏觀經濟形勢，還有利于正确做出宏觀經濟發展的預測，從而更加合理地制定宏觀經濟政策。

變量個數無限增多

在當前大數據時代，數據的可得性和多樣性導緻樣本量無限增大，同時變量個數無限增多，這有利于應用大量模型進行研究，并應用完備的數據信息，提高預測的準确性。

經濟預測模型可以分為兩類：一是傳統的小模型預測，這類模型往往通過建立時間序列、橫截面或面闆方程來進行經濟分析。傳統的小模型預測的特點是僅使用較少的變量，像VAR模型的變量個數通常小于10個。二是大模型預測，這類模型往往使用成百上千個變量，因而大模型預測利用的信息非常豐富。

小模型預測理論比較成熟、方法相對簡單。但是，小模型預測有天然的缺陷,那就是變量的完整通常是不可能的，而預測的效果受限于其所使用的變量。

使用小模型進行預測時必須仔細挑選預測變量，然而仁者見仁智者見智，無論是根據理論還是根據經驗進行變量的選擇，其過程必然會存在差異，其結果也更是可想而知，而且甚至會産生一些争議。比如，基于菲利普斯曲線預測通脹時，有的研究使用失業率作為預測變量，也有研究使用GDP缺口或者産能利用率。

清華大學經濟學研究所所長劉濤雄教授就指出，由于模型變量選擇、參數設置、估計方法以及滞後期選擇等的不同，預測結果會産生很大的偏差。

小模型預測方法這一天然的局限是很難調和的，主要是因為數據樣本有限而導緻增加很多變量不可行。這使小模型預測的結論往往和經濟現實嚴重脫節。我們很難想象中央銀行會僅僅根據少數幾個變量進行宏觀預測，并據此做出決策。即便是一家企業也不會如此草率。

通過大數據挖掘，可以使得變量大大增加。這就為經濟預測從小模型預測轉變為大模型預測創造了條件，應用大量模型進行分析及預測，可以應用完備的數據信息，從而提高預測的準确性。

在美國，銀行通常依靠FICO得分做出貸款與否的決定，FICO分大概有15-20個變量，諸如信用卡的使用比率、有無未還款的記錄等。而一家名為ZestCash的金融機構，在決定是否向客戶放貸的時，分析的卻是數千個信息線索。ZestCash正是依靠其強大的對于大數據的處理和分析能力，形成了其獨特的核心競争力。

未必因果關系而是相關關系

傳統的經濟計量分析以尋找相關事物（變量）的因果關系為核心，而大數據條件下的經濟分析通常則着眼于挖掘相關事物（變量）的相關關系。

在複雜的宏觀經濟系統中，許多經濟變量的因果關系往往難以準确檢驗，或者因果結論經常廣受質疑。然而，在如今的大數據時代，更加重視可靠相關關系的發掘，并且充分利用相關關系對于經濟預測、經濟政策制定與評估的作用，則無疑為宏觀經濟分析打開了另一片廣闊的空間。

在“小數據”時代，宏觀經濟中的因果關系分析其實并不容易，耗費的精力大、時間多。特别是，要從建立假設開始，進而不斷地進行一系列假設的實驗，而一個個假設要麼被證實，要麼被推翻。不過，無論被證實還是被推翻，由于二者都始于假設，這些分析就都有受偏見的可能，所以極易導緻錯誤。

同時，由于計算機能力的不足，在小數據時代，大部分相關事物（變量）關系的分析局限于尋求線性關系。然而，實際上的情況要複雜得多，在現實宏觀經濟中，總能夠發現的是相關事物（變量）的“非線性關系”。

當然，在小數據世界的宏觀經濟分析中，相關關系也是存在并有價值的；不過，在大數據時代的宏觀經濟分析中，相關關系才将大放異彩。維克托·邁爾－舍恩伯格與肯尼思·庫克耶(Victor•Mayer－Schonberger&.Kenneth•Cukier)認為，建立在相關關系分析基礎上的預測是大數據的核心。通過應用相關關系，可以比之前更容易、更快捷、更清楚地分析事物（變量）。

英國華威商學院為預測股市的漲跌，使用谷歌趨勢（GoogleTrends）共計追蹤了98個搜索關鍵詞。這中包括“債務”、“股票”、“投資組合”、“失業”、“市場”等與投資行為相關的詞，也包括“生活方式”、“藝術”、“快樂”、“戰争”、“沖突”、“政治”等與投資無關的關鍵詞。結果發現有些詞條，諸如“債務”，成為預測股市的主要關鍵詞。

“谷歌流感趨勢”為預測季節性流感的暴發，對2003年和2008年間的5000萬最常搜索的詞條進行大數據“訓練”，試圖發現某些搜索詞條的地理位置是否與美國流感疾病預防和控制中心的數據相關。

谷歌并沒有直接推斷哪些查詢詞條是最好的指标，相反，為了測試這些檢索詞條，谷歌總共處理了4.5億個不同的數字模型。将得出的預測與2007年和2008年美國疾控中心記錄的實際流感病例進行對比後，谷歌公司發現，它們的大數據處理結果發現了45條檢索詞條的組合，将它們用于特定的數學模型，預測結果與官方數據的相關性高達97%。

在大數據時代來臨之前，盡管相關關系已被充分證明大有用途，可是相關關系的應用很少。這是因為用來做相關關系分析的數據同用來做因果關系分析的數據一樣，也很少，也不容易得到，并且收集有關的數據，在過去相對來說，也費時費力，也會耗資巨大。不過現如今，可用的數據如此之多，也就不存在這樣的難題了。特别是現在，有關專家們正在研發能發現并對比分析“非線性關系”的必要工具。總之，一系列飛速發展的新技術和新軟件從多方面提高了有關分析工具發現宏觀經濟變量相關關系的能力，這就好比立體畫法可同時從多個角度來表現人物或事物。

在大數據時代，這些新的分析工具和思路為我們提供了一系列新的視野和有用的預測，使我們看到了很多以前不曾注意到的宏觀經濟中的聯系，掌握了以前無法理解的複雜的國民經濟動态。

時滞變即期

目前對宏觀經濟的分析研究所采用的資料，主要依賴于各種統計調查系統發布的統計數據，但面臨的最明顯的缺陷之一便在于關于宏觀經濟統計的數據具有很強的時滞性。而大數據經濟模型可以充分利用數據的實時性，提高分析或預測的時效性，為經濟預警和政策制定提供最快速的資料和依據。

一般來說，依賴統計部門的宏觀經濟數據的發布都存在時間滞後的問題。由于不能及時獲取宏觀經濟發展的數據信息，也就不能對當下的宏觀經濟形勢作出準确判斷。例如，政府公布的季度GDP往往會有1個月的滞後期，而反映全面經濟社會狀況的統計年鑒的滞後期會達到3個月左右，這對及時了解宏觀經濟形勢、預測與預警都是非常不利的，基于此統計進行的預測甚至被認為助長了宏觀經濟波動。

在互聯網技術的輔助下相關宏觀經濟的分析部門能夠快速地收集到主要宏觀經濟發展數據，如全社會的用電量、全社會的商品銷售總額以及商品房的購買量等。這些大數據的獲取時間較短，有的數據甚至是立即可以獲得。

而随着互聯網尤其是移動互聯網的發展，産生了大量的即時傳播數據，如企業通過微博、微信第一時間發布産品、人事等重要信息;普通用戶實時針對特定事件或對象發表見解和态度，等等。

這些即時傳播的非結構化數據對宏觀經濟的走勢也産生了重要影響。通過大數據軟件處理平台，可以實時追蹤和搜集這些即時數據，并快速對數據進行分析和處理，從而提高宏觀經濟的時效性，為經濟活動參與者赢得決策時間。

在日本北九州市八幡東區東田地區實行的“八幡東區綠色鄉村構想”中，日本IBM公司除了設立城市整體能源管理系統、綜合性移動管理系統外，還參與了控制整個城市的城市指揮中心建設。得益于該公司處理和分析大數據的高效工作，當地行政機關可以實時掌握城市能源的情況，并将分析的結果同氣象信息結合，詳細預測48小時之後電力等能源的供需狀況。如果發現将有電力不足的情況發生，行政部門可直接采取抑制電力消費或讓電動汽車釋放電能等措施，提前進行預防。

近來，在利用大數據對宏觀經濟進行預測方面，“現時預測(NowCasting）”受到特别關注。“現時預測”一詞最初起源于氣象學領域，是對現在已經發生的事由于信息發布滞後等原因難以馬上知道準确情況，因而根據其他可得信息進行推測。

目前“現時預測”的主要應用範圍為預測通脹指數、GDP,基礎信息可以為消費數據,如私人消費,或其他與産出相關的變量,如工業産出。“現時預測”基本原理是充分挖掘比目标變量頻率更高的曆史基礎信息,以在官方數據公布前獲得目标變量的提前估計量,這對政府了解宏觀經濟情況制定經濟政策有很大的作用。

宏觀經濟分析如何借助大數據

熱門書籍

熱門文章