人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 相信大數據還是相信邏輯?

相信大數據還是相信邏輯?

時間:2024-10-28 10:38:12

盡管經濟劇烈波動時政府會采取逆周期政策,但要麼難以避免危機,要麼會付出債務高企和經濟停滞等代價,這是邏輯的力量。

“大數據”是指以多元形式,通過許多來源搜集而來的龐大數據組,往往具有實時性。大約從2009年開始,“大數據”成為互聯網信息技術行業的流行詞彙。如美國互聯網數據中心指出,互聯網上的數據每年将增長50%,每兩年便将翻一番,而目前世界上90%以上的數據是最近幾年才産生的。

此外,數據又并非單純指人們在互聯網上發布的信息,全世界的工業設備、汽車、電表上有着無數的數碼傳感器,随時測量和傳遞着有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也産生了海量的數據信息。

有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據并不在“大”,而在于“有用”,價值含量、挖掘成本比數量更為重要。對于很多行業而言,如何利用這些大規模數據成為赢得競争的關鍵。

例如,2011年諾貝爾經濟學獎獲得者托馬斯·薩金特(ThomasJ.Sargent)近期在中國公開演講時就認為,人工智能實質上就是統計學。我覺得他說的有一定道理,但過于簡單粗暴了。其實,他想表達的是人工智能中運用的不少方法就是過去的統計方法。

又有人認為大數據就是全樣本統計,這樣理解大數據未免有點淺薄了,全樣本統計隻是大數據的一種形式而已。因此,大數據的涵義要比傳統意義上的統計數據廣泛,但确實又具有統計數據的很多屬性,因此大數據需要通過合适的方法才能發揮其作用。

相信個案還是大數據

舉例來說,兩年半前,我曾經從螞蟻金服公布的居民網絡消費數據中,發現天津在網絡消費上的怪異現象:作為直轄市的天津,人均網消水平上明顯低于上海、北京、浙江、江蘇、海南、福建、廣東,而且由于這前七個省市占比較大,天津甚至低于全國平均水平。

由于天津的人均GDP水平在2016年及之前一直為全國省市自治區中排名第一,為何網購數據那麼弱呢?我當時就認為天津有誇大GDP的可能。因為查閱《統計年鑒》,發現天津的人均可支配收入與人均GDP水平不匹配。即人均可支配收入不僅低于北京和上海,而且還低于浙江、江蘇。

如2015年浙江城鎮居民可支配收入占GDP之比為56.3%,上海為51.3%,但天津隻有31.9%,與前者竟然相差20%左右。如果說人均可支配收入偏低與通過大數據獲得的人均網購額還是比較匹配的話,那麼,人均GDP或GDP總額就大大偏離正常水平了。

2018年年初,天津重新調整了其濱海新區2016年GDP的數據,從過去公布的10002.31億元調整為6654億元,縮水3348億元,縮水幅度達三分之一。可見,如果把從支付寶獲得的網購大數據與統計部門公布的數據進行相互比對,就可以及早發現問題所在。這可以說是運用好大數據的意義所在。

“文革”期間,有一句口号叫“工業學大慶,農業學大寨”,但為何學了那麼久,經濟增速仍然那麼低,工業品和糧食那麼短缺呢?因為大慶和大寨都屬于少數“成功”的個案,難以複制。而且,計劃經濟模式所隐含的邏輯存在明顯缺陷。

筆者曾經舉過一個例子:讓1000隻猴子擲硬币,每次出現正面的概率為50%,如果讓所有的猴子連續擲硬币10次,那麼,連續10次均為正面的概率就是50%的10次方,約等于千分之一,即1000隻猴子中應該有一隻猴子會連擲硬币10次均為正面。難道我們需要把這隻猴子作為典型案例,号召所有猴子向它學習,将其“成功”擲币的經驗進行推廣嗎?

因此,步入信息化社會,大數據概念的流行對于習慣于形象思維的國人是一個很好的開闊眼界的機會,從古到今,相信奇迹的人為數不少,而相信常識或相信概率的卻不那麼多。例如,為何澳門博彩業會如此繁榮,規模是拉斯維加斯的四五倍呢?就是因為“相信一夜暴富奇迹”的國人太多了。在國内,你會發現類似“成功學”的書特别暢銷,但就“成功”本身而言,其比例一般都很低,否則就不叫成功了。也就是說,成功隻能是個案,但大部分人隻對成功的個案有興趣,對成功率卻茫然無知。

盲目相信大數據并不可取

上一部分的核心觀點是大數據比個案更有說服力,但是,過度迷信大數據也有問題。以股市為例,目前,A股市場的上市公司數量已超過3000家,所有上市公司的盈利等财務數據累加起來也構成了大數據。

從2016年開始,上市公司的整體ROE都在上升,但為何股市的估值水平卻在下移呢?為何商品房銷量屢創新高,房企的盈利也出現了高增長,但房地産股卻大幅下跌?說明借助大數據來預測未來,必須搞清楚數據與預測對象之間的邏輯關系。其實,股價應該是領先指标,或稱晴雨表,大數據則是滞後指标。房地産股的下跌,或是反映了股市投資者對國内樓市未來下跌的擔憂。

同樣,2017-2018年,上市企業盈利整體增速超過兩位數,但不意味着2019年盈利增速不下降,當投資者看到經濟增速下行的長期趨勢,就會對企業未來的盈利前景感到擔憂。

此外,大數據總量數據固然重要,但“内部結構”還需要分析:為何這兩年股市中的“中小創”跌幅較大?是因為其曆史的估值水平較高,盡管其盈利增速并不低,但卻面臨市場趨向理性之後的估值水平下移壓力。

所以,盲目偏信大數據反而容易産生誤判,隻有運用合适邏輯分析方法,才能把大數據的結構和特征描述清楚。例如,由于A股中大市值公司的估值水平比較低,如銀行股的利潤總額加起來要占到所有上市公司總利潤的一半左右,且大部分銀行的PE隻有5-7倍;所有上市公司PE加權平均之後,就很低了,但從PE的中位數看,估值水平仍然不低,目前在23倍左右。

中國的成語中也有類似對大數據“滞後”特性的描述,如盛極而衰,表示數據雖然非常好看,但可能意味着衰退。而且,正是由于人們偏愛“用數據說話”,因此,數據作假現象也屢見不鮮,從而導緻總量數據與實際相背離,或者數據之間的勾稽關系出現矛盾。

黑天鵝事件:還是要相信邏輯

17世紀之前,歐洲人都認為天鵝都是白的,因為他們所見到的各大洲(歐洲、亞洲、非洲)及各個地方的天鵝,無一例外地都是白色的——這就是用歸納法對大數據處理所得出的結論。一直到人們在澳洲發現第一隻黑天鵝之後,天鵝都是白色的結論就被推翻。

從此之後,人們就把意想不到事件的發生稱之為“黑天鵝事件”,這說明大數據的缺陷所在——樣本不能被窮盡。因此,大數據可以用來“證僞”,卻不能用來證明。

例如,外星球究竟有沒有生命的問題,大部分科學家都認為肯定有生命,其邏輯就是概率分布,因為茫茫宇宙中的星球不計其數,難道隻有唯一一個地球上有生命?但概率隻是代表可能性,觀察的樣本數量再大,也無法找到一個例證來證明外星球上确有生命。

而大數據的運用,大部分采用歸納法——人類思維中90%以上的幾率都在使用歸納法,因為歸納法不需要運用太多的知識;不像演繹法,它先要掌握不少知識或定理,然後再據此去推理。

例如,前段時間英國皇家學會前主席阿提亞爵士宣稱證明了“黎曼猜想”,是否真的證明了姑且不論,但證明過程所需要的深奧的專業知識,肯定不是一般人所能觸及的。

事實上,西方在基礎研究領域的巨大成就,大部分都是在17世紀之後取得的,遠沒有跨入大數據時代,且大部分沒有采取實驗室研究的方式,但至今大部分成果都被廣泛應用到社會經濟、科技生産的各個領域。

也就是說,17世紀之後,西方抽象思維得到極大發展,建立了數學、物理的科學體系,進而又推動了科技進步,從而拉大了中西方在科技領域的差距。

相比之下,從中國曆史上所取得的科學成果看,能體現抽象思維的東西比較少,形式邏輯在中國沒有充分發展,春秋戰國時代,形式邏輯也曾有過發展,但最終卻演變成了“詭辯術”,如公孫龍(前320年-前250年)就提出了“白馬非馬”之說,因此,中國曆朝曆代的思維還是見長于歸納法和辯證法。

舉個例子:南宋數學家楊輝在1261年所著的《詳解九章算法》一書中,展現了二項式系數在三角形中的一種幾何排列,因此,“楊輝三角”實質上是把二項式系數圖形化,把組合數内在的一些代數直觀地從圖形中體現出來。

但楊輝并沒有在其著作給出具體推導過程,所以,我們隻能認為“楊輝三角”是通過歸納總結發現的,未能把它進一步抽象為“二項式定理”,而牛頓就給出了二項式定理的一般公式和推導過程。

由于形式邏輯、演繹法在中國五千年的漫長曆史中沒有得到充分發展,這才是導緻中國近代科技發展遲緩的根本原因,而不是所謂的制度因素。為什麼哲學、宗教、文化乃至醫學等都有中西方之分,但數理化就沒有“中國數理化”而是照搬西方的呢?因為這些學科都不能通過經驗(或稱大數據歸納)、傳承或辯證法來創設的。

在大數據面前,更要相信邏輯,雖然大數據比個案更有說服力,但大數據同樣存在失真、變異、滞後甚至被操縱的可能性。例如,2017年以來公布的統計數據顯示,企業的盈利增速大幅提高,但為何企業的投資增速卻大幅下降呢?大數據不能解釋,但邏輯卻可以做合理解釋:供給側改革、環保标準提高等導緻供給端被壓縮,進而導緻上遊商品價格上漲,大企業盈利增速上升。

社會經濟的發展看似千姿百态,但也有其共性。比如,二戰之後的今天,市場經濟最終成為全球幾乎所有國家的共同體制,說明這個體制合乎經濟可持續增長的邏輯。這正如價值投資成為全球絕大部分資本市場的共同理念一樣,唯有如此才能獲得較大的回報。

縱觀全球各國經濟走勢,都會發生波動,盡管波動劇烈時政府部門會采取逆周期的政策,試圖通過幹預市場來避免發生危機,但事實上卻很難避免。也有些國家盡管沒有爆發危機,但其代價往往是經濟停滞和債務高企。因此,就像價值投資理念對資本市場的影響一樣,邏輯産生作用可能會遲到,但不會缺席。

李迅雷為中泰證券首席經濟學家
   

熱門書籍

熱門文章