如今,利用大數據方法和技術進行宏觀經濟預測越來越受到宏觀經濟政策制定者和學術界更高的重視,國内外許多機構和研究人員進行了大量研究和應用,産生了一系列意義深遠的成果。基于大數據進行的宏觀經濟預測和分析,将發生多方面的變革,并且呈現出顯著的優勢。不過,由于數據來源、技術研發等多方面的限制,以大數據為基礎的宏觀經濟分析現在尚并不能完全取代傳統的宏觀經濟分析。
宏觀經濟預測和分析何以借助大數據
長期以來,各國政府都非常注重對影響總需求、總供給、國民生産總值、物價水平、就業率、财政收入、貨币和信貸總量等因素的信息進行搜集、整合、分類、加工和處理,進而在獲得一定認知的基礎之上,對宏觀經濟調控和調節的策略和手段做出決定和選擇。這在很大程度和範圍内解決了經濟運行中的“市場失靈”,解決了許多市場機制難以甚至無從解決的問題。
可是,受制于科學技術發展水平和時代的局限性,政府宏觀調控(或調節)抉擇中所能夠獲得的信息,往往隻是部分信息、滞後信息。在這樣的背景下,不僅“市場失靈”問題不能完全解決,而且,政府宏觀調控還往往會出現“政府失靈”的問題,從而飽受诟病。
大數據時代,科技水平和技術手段存在着搜集和提供完全信息的可能性。政府可以通過對極大量、多維度和完備性的大數據進行搜集、整合、分類、加工和處理,也就存在着獲得實時信息、完全信息和準确信息的可能性。毫無疑問,這為政府采用大數據思維模式進行宏觀調控創造着條件。
當前,随着互聯網等新一代信息技術的發展,涉及生産經營銷售活動和人們交往交互情況的、實時的、非結構化的海量數據不斷湧現。整個社會周而複始地創造和運用大數據所催生的新經濟,正在誘導或驅動着追求最大化的個人、廠商和政府直接或間接利用雲端(雲計算)和運用人工智能來處理和匹配大數據,以實現消費和投資的理性選擇(何大安,2018)。而在這實時、交互、離散化、非結構化的海量數據中,蘊含着經濟社會運行的各種先行指标信号。
正因為如此,大數據不僅是國家新型戰略資源,也是評判經濟走勢的支撐。黨中央、國務院高瞻遠矚,深刻把握新興高技術變革帶來的這一重大機遇,對大數據的整合、分析、利用做出了系統部署。
“十三五”規劃綱要中指出“完善政策制定和決策機制:注重運用互聯網、統計雲、大數據技術,提高經濟運行信息及時性、全面性和準确性”。國務院相關部門正在積極采取多種方式開發社會上數量巨大、來源廣泛、形式多樣的大數據,并與政府信息整合,構建大數據經濟分析模型,對國民經濟各領域的運行狀況及時監測,提高了宏觀調控的精準性和有效性。
現在,大數據對宏觀經濟分析的革命性影響,越來越受到宏觀經濟政策制定者和學術界更高的重視。目前,國内外運用大數據的概念、方法和技術進行宏觀經濟分析的研究主要集中在宏觀經濟預測(尤其是現時預測)、宏觀經濟政策制定、宏觀經濟分析技術和宏觀經濟數據挖掘等領域。
從已有研究來看,在宏觀經濟預測中運用大數據的方面,從新型宏觀經濟指數構建,到在傳統宏觀經濟模型中運用大數據成果,再到建立新型大數據宏觀經濟預測模型,一些意義深遠的研究工作逐步興起。
通過梳理相關的一系列研究可以看出,基于大數據進行的宏觀經濟預測和分析,将主要在四大方面發生變革,并且呈現出顯著的優勢(見表格所示)。除此以外,還有學者指出,以大數據做宏觀經濟預測分析,還将派生出相對低成本、顆粒度高等其獨特的優勢。
由于網絡大數據均在事件或交易發生時自動被記錄下來,無須人為調查和搜集,通過技術方法提取出來加以整理得到,能夠極大程度上降低獲取數據的成本。同時,傳統的數據搜集過程為了降低成本,會盡量搜集總體數據,而非細化地搜集數據信息。而在網絡大數據時代,提取總體數據信息和單獨搜集某一類别的數據的區别并不大,可以在不顯著增加成本的前提下,提供更加詳細和更加有意義的數據信息。
國内基于大數據宏觀預測的新進展
目前,利用大數據方法和技術進行宏觀經濟監測預測已經在國際上引起相當程度的重視,不同機構的學者和研究人員已經進行了大量研究和應用,而且産生了豐碩的成果。但從國内來看,這一領域的研究和應用都處在起步階段,與國外相比,還有很大發展潛力和空間。
國内生産總值(GrossDomesticProduct,GDP)作為衡量一個國家或地區宏觀經濟整體狀況的核心指标,其長短期走勢和增速拐點判斷通常是宏觀經濟預測的重心。目前,利用大數據預測GDP走勢的研究主要是綜合使用網絡搜索數據、網絡爬蟲數據等大數據以及傳統政府統計數據,結合經典時間序列模型、計量經濟模型以及新型的高維數據模型、機器學習等方法進行預測,并把“預測(Forecasting)”的内涵拓展到“現測(Nowcasting)”。
清華大學經濟學研究所的一項研究表明,在充分利用了GDP自身信息和其它結構化的統計指标的基礎上,再增加互聯網搜索行為幾乎總能有效地改進預測。
對于GDP預測而言,如果在政府統計變量的基礎上,增加互聯網搜索行為變量則可以幫助改進預測。
清華大學社會科學學院劉濤雄教授指出,其背後的機理是:一方面,新興非結構化大數據信息往往包含了大量的噪音,從信息質量而言,相對于傳統的統計數據具有明顯劣勢,但并不構成對傳統統計數據的替代。另一方面,新興非結構化大數據往往包括了傳統統計調查數據所沒有的其它信息,如最新的實時信息,因而是對統計數據的有益補充。
互聯網是大數據時代人們經濟生活不可或缺的工具,人們的網絡生活占據日常生活中愈發重要的位置,信息獲取方式向網絡渠道轉移。通過對網民搜索行為的分析可以得到用戶的關注重點和消費需求,尤為重要的是,由于網絡搜索數據具有即時性的特點,可以實時反映用戶心理變化和需求變化,許多學者将網絡搜索應用到預測需要傳導時間的指标或經濟行為的研究中。
中國科學院大學管理學院學者孫毅和呂本富依據百度指數中的搜索數據構建基于網絡的消費者信心指數(ICCI),可以更準确地預測社會商品零售總額,作為領先宏觀經濟景氣一緻指數的先行指标,具有更強的預警能力。劉偉江等學者利用主成分分析法合成分類搜索指數,研究了網絡搜索關鍵詞與台灣地區消費者信心指數之間的關系,所建立模型能夠較好地預測出消費者信心指數的拐點,模型拟合度亦較高。
在宏觀經濟運行中,物價總體水平的波動反應着宏觀經濟運行狀況,亦是經濟發展和社會穩定的重要影響要素。随着經濟結構的調整和經濟的複蘇與繁榮,物價水平的上升成為必然,然而,過低和過高的通貨膨脹水平均不利于經濟的穩定發展。提前準确預測未來的通貨膨脹水平一向極為重要。
孫毅和呂本富的另一項研究表明,基于百度數據而合成的網絡通脹預期指數與通貨膨脹趨勢高度相關,并證明了我國通貨膨脹預期是一種适應性預期。而張崇和呂本富利用關鍵詞合并的方法得到搜索指數,而後構建模型對CPI進行線性拟合,證明了網絡搜索數據與CPI之間存在長期穩定的關系。他們發現網絡搜索數據與居民消費價格指數(CPI)之間存在一定的先行滞後關系。他們建構的模型具有很強的時效性,比國家統計局的數據發布提前一個月左右,而且與傳統的預測方法相比,模型還具備一定的轉折點預測能力。
國内學者也在利用搜索大數據研究失業率方面有所探索,王勇、董恒新(2017)利用網絡搜索數據,采用5種不同的預測方法研究分析了中國季度失業率問題,研究表明基于網絡搜索數據預測的失業率能夠比官方數據更早反映失業率趨勢變化。而彭庚等(2013)利用Google提供的關鍵詞搜索數據,采用改進的逐步回歸方法分層建立了三個模型來預測失業率。結果發現,三個模型的拟合優度均在90%以上,說明網絡搜索數據對經濟、社會問題可以進行有效的預測。
總的來說,上述研究都表明網絡搜索關鍵詞和經濟行為之間存在密切的聯系,引入網絡搜索數據的研究預測更加精确、誤差更小。
大數據應用于宏觀經濟分析的主要瓶頸
目前,由于數據來源、技術研發等多方面的限制,以大數據為基礎的宏觀經濟分析現在尚不能完全取代傳統的宏觀經濟分析。
最近發展起來的大數據以及大數據相關技術,無論是爬蟲技術,還是分布式儲存技術,抑或是雲計算等,這些都是圍繞大數據獲取、保存和應對超大型數據的計算問題而發展起來的技術方法,而真正能成為大數據獨有的宏觀預測模型卻較為缺乏。并且,大數據在分析經濟問題時,更多地是采用描述性的方式,較少采用結構性的方法來分析,缺乏經濟理論支撐。
眼前,應該以傳統宏觀經濟分析為主,輔以大數據方法,不斷提高宏觀經濟分析的精準性、客觀性和時效性。中國社會科學院數量經濟技術經濟研究所學者指出,通過大數據技術和方法,獲取及時性的數據,結合傳統的宏觀預測和分析模型,既能有效利用經濟理論解釋經濟問題,又能通過大數據獲取的數據信息突破傳統統計數據存在的問題,有效提高宏觀經濟預測和分析的效果,為宏觀經濟預測和分析帶來新的突破。
總之,大數據并不是對傳統宏觀預測模型方法的革新,而是對傳統模型宏觀經濟分析預測方法的補充和改進。應積極通過對傳統統計分析方法使用數據的改進,突破傳統方法的根本局限,從而提高模型的預測效果和應用範圍。
在大數據分析的運用、提高效率與其他政策和技術協同,以及為公共服務領域帶來變革等方面,政府可以加大重視和投入力度,為經濟的進一步發展提供支持。首先,面對大數據帶來的技術變革,政府應該将其納入政府統計之中。經濟統計要充分利用大數據時代提供的技術和條件,促進政府統計工作的變革。
其次,面對大數據帶來的統計資源的拓展,政府應該将其統計資源拓展到政府以外,重視拓寬其他數據資源。在過去,政府靠自己的力量收集數據,但在大數據時代,人人都是數據的制造者。例如,谷歌和百度等數據巨頭擁有大量政府無法獲取的數據資源。政府要想辦法讓數據巨頭将數據放到統計中來,而不能僅靠自己調查統計。
再次,面對大數據帶來的統計對象擴充,政府不但應當重視結構化數據,更應當重視挖掘非結構化數據,以期找尋出恰當的經濟統計指标。大數據時代,非結構化數據包含更多信息,而且利用互聯網進行的數據挖掘,不僅可以得到數字資源,文本數據也可以通過挖掘獲得。國家自然科學青年基金項目的一項研究認為,對于政府統計部門而言,應利用政府的影響力優勢不斷加強對基于信息技術的非結構化數據(包括來源于網絡的與宏觀經濟相關的文本圖像等)的收集與整合。
最後,無論是關于宏觀經濟的結構化統計數據還是非結構化整合數據,都需要提高數據的頻率,如周數據日數據等,高頻數據才能發揮大數據實時性的優勢,對宏觀經濟進行及時預警與風險管理。
在大數據分析技術方面,機器學習等數據挖掘方法在圖像或語音識别自然語言處理等方面的應用已發展成熟,同樣,機器學習對複雜知識的獲取能力會使得它應用于宏觀經濟分析成為一種必然,這就需要學者們進一步探究宏觀經濟分析與大數據技術之間成功的契合方式,并在此基礎上構建專門的宏觀經濟預測系統,實現對宏觀經濟實時有效的監控和風險管理。