人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 樸素的數據價值觀

樸素的數據價值觀

時間:2024-10-28 11:22:28

對數據分析價值的判斷,同數據的大小、分析方法沒有必然聯系。純粹的數據不産生價值,純粹的算法更不産生價值。價值的産生一定依賴于具體的業務場景和商業模式

人們為什麼關心數據?因為數據中蘊含着商業價值。更具體地說,數據,作為一種電子化記錄,描述刻畫了各種各樣的不确定性,而不确定性蘊含商業價值。因此,數據分析的對象不是數據本身,而是分析數據所描述的那個不确定性。同樣,數據分析的目的也不是分析數據,而是創造價值。隻要是能夠創造價值的數據分析,都是好的數據分析。相反,則不然。對數據分析價值的判斷,同數據的大小、分析方法是否高大上,沒有必然聯系。這種樸素的數據價值觀的形成,并不是憑空臆想、突然形成的,它得益于真實的數據産業實踐。

例如,有朋友很困惑地說:“我們做了一款這麼棒的數據産品,數據量這麼大,體驗這麼好,可視化創意如此獨特。可是,客戶怎麼就不願意買單呢?”最開始,我也有同感,但是,随着時間的推移,我的看法在慢慢改變。就像老師不能挑選學生一樣,在商業實踐中,我們很難挑選客戶。因此,不能把數據産品的失敗歸咎于客戶的無知,這樣做沒有任何建設性意義。而一個更加具有建設性的思考是:為什麼我的數據産品客戶不認可?歸根到底是:價值不明晰。具言之,數據産品之于客戶的重要業務,所創造的商業價值不明晰。這裡有兩個可能:一個可能是數據分析根本就沒有創造價值;另外一個可能是數據分析所産生的價值難以被客戶感知。無論是哪種情況,都會極大地影響數據産品的推廣。

數據商業價值的三個表現

企業靠什麼活着?答:收入!即使沒有現在的收入,那也得有未來可預期的收入。第二,企業為了達成收入,需要做什麼?答:支出(或者說成本)。收入減去支出,就是利潤。在資本當道的今天,利潤可以暫時是負的。第三,沒有任何企業對自己未來是100%确定的,因為這裡面有很大的不确定性,而不确定性帶來的是什麼?答:風險。接下來,就這三個方面,予以分别探讨。

第一個方面:收入。

數據産品能否幫助客戶帶來額外的收入?這裡的關鍵詞是“額外”。客戶是賣豆漿的,以前沒有你的數據分析,他每天賣100碗。後來呢,有了你的高大上的數據分析之後,如果客戶開始每天銷售豆漿150碗了,那麼你數據分析的價值就體現出來了。這個價值有多大?就是那額外的50碗豆漿!再看一個例子:個性化推薦。客戶是一個電商網站,他的主頁上有一個推薦欄。過去這個推薦欄的轉化率是2%。通過你的數據分析,推薦欄的轉化率提高到5%了,直接大幅度提高了客戶的銷售收入。這額外的3%的轉化率,就是數據分析的價值。

第二個方面:支出。

有人說:“我們的數據距離收入有點遠,不能給客戶增加收入。但是有可能給客戶節約不必要的支出,也就是成本。這樣行嗎?”當然行啊。為什麼?因為收入的增加往往具有很強的不确定性。這些不确定性來自于市場的波動、政策的變化、競争對手的博弈等,都不在企業的控制範圍内。但是支出,卻更多地掌握在企業自己手裡。因此,相對收入增加而言,控制支出更可預期。

假設,客服中心有1000個接線員,每天接聽海量電話,解決各種客戶問題,其中絕大多數問題都是很标準的典型問題。現在,通過語音識别技術,自動識别客戶問題,通過AI助手,自動回答解決。因此節省下來的工作量和成本,就是你數據分析的價值。

第三個方面:風險。

還有人說:“我的數據分析,第一不能直接增加收入,第二不能直接節省成本,但是可以控制風險。這樣的數據有商業價值嗎?”當然有了。事實上,風險就是連接收入和支出的一個轉化器。對風險的把控,或者可以增加收入,或者可以降低成本。

很多商業銀行都有網上申請系統,但缺點是風險比較大,見不到真人,有些線下才能提供的材料無法獲得。那就隻能提高在線申請的門檻,降低通過率。這樣做的優點是安全,把壞人攔在外面;缺點是錯殺了很多好人。如果能夠通過數據分析,幫助這家銀行更加準确地區分好人和壞人,那銀行就可以放心大膽地給更多的好人發卡、放貸,增加收入和利潤。同時,還能保證壞賬率在合理的範圍之内。這樣的價值是把對風險的把控,轉化為收入的提高。同時,因為你風控做得好,所以壞賬率就低,還節省了催收成本。這就是數據分析的價值。

建立可量化的參照系

數據的商業價值最可能體現在收入、支出、風險,但這三方面還不夠。真實的業務環境很複雜,最終産生的價值(例如:收入的提高),往往難以被感知。為什麼難以被感知?往往是因為缺乏一個可量化的參照系。

有業内朋友說:“我們最近給一個客戶做流失預警模型,準确度75%!”但是他說領導很不滿意,準确度太差,連99%都不到!客戶流失行為是一個高度不可預測的不确定性行為,其中有無知的成分,也許可以通過數據分析去學習把握。但是,這裡面更有無奈的部分。例如:同行競争對手為了争奪同一個客戶資源,它會采用什麼手段?會産生什麼效果?這誰說得清楚。因此,客戶流失行為的預測不可能特别精準。但是,領導并不明了這個道理。這裡最主要的一個困難是,領導對客戶流失的預測精度沒有一個合理的預期。因為他沒有合理的參照系。在沒有參照系的情況下,領導對客戶流失預測精度的大小無法評估。于是,他就隻好參照小學生的考試成績:認為99%才優秀!我們應該給他樹立一個可量化的參照系。

為此,可以研究一下:客戶在沒有數據分析的幫助下能做多好?在你到來之前,客戶自己是有流失預警得分的,這個得分準确度如何?很多時候,客戶自己都從來沒有評價過。你可以這麼說:“領導,您看,之前咱們這邊的精度是65%,已經做得非常不錯了。但是呢,現在咱們雙方共同努力,這個精度提高到了75%。為此您可以節省多少不必要的支出,或者增加多少額外的收入,等等。”這樣就更有說服力,因為你确立了一個可以量化的參照系:客戶現有系統的65%。如果沒有這個參照系,而你又想說明75%的精度有價值,會無比艱難。數據價值依賴于業務場景

純粹的數據不産生價值,純粹的算法更不産生價值。價值的産生一定依賴于具體的業務場景,尤其依賴于帶有強烈不确定性的業務場景,簡稱為“場景”。

所謂場景就是價值創造所必須的一系列業務元素與條件的集合。兩個要點:第一,有場景,就自動有價值。因為“産生商業價值”是定義“場景”的一個必要條件。不産生價值,不成為場景。第二,場景是一系列業務元素和條件,因緣際會和合而成。場景的定義跟數據沒有多大關系。定義場景的關鍵就是創造商業價值,隻要有商業價值創造就一定有場景,隻要有場景就一定有商業價值創造。商業價值創造與場景互為充分必要條件。

因此,如果“數據”能夠傍上“場景”這個大腿,那價值創造不是問題。畢竟,純粹而孤立的數據,哪有什麼價值?再厲害的算法也敵不過獨特而精準的數據。所以,我的觀點很簡單:場景第一、數據第二、算法排最後。由此可見,要踐行數據商業價值,首當其沖需要分析業務,并尋找高價值場景。但是,這樣的業務場景應該如何尋找?

假設一個便利連鎖集團的領導找到你,說:集團有上百家便利店,遍布北京各個城區,每天小十萬的客流量,留下了不少購物數據。請問:這些數據能為我創造什麼價值?也許你會說:咱們做個菜籃子分析吧,看看有沒有可能發現一個啤酒跟尿布的故事?或者說:咱們研究研究天氣吧,看看天氣跟雨傘銷售量有啥關系?這些數據分析所對應的場景,太瑣碎,甚至壓根不存在。在這樣的場景下,數據所創造的價值,不可能太大。因此,場景自己的重要性極其重要,決定了數據商業價值創造的上限。如果你希望用數據創造更重大的商業價值,你需要關注企業的核心業務,在核心業務方向上,尋找重要的業務場景。

回到連鎖集團的案例,你也許應該先問:領導,請問咱們集團今年的戰略目标是啥?因為,戰略目标決定了集團的價值取向。隻有跟集團戰略目标高度一緻的價值才會被高度認可。因此,在數據分析之前,首先應該關注集團的戰略目标,跟這個戰略目标相關的核心業務,以及同核心業務相關的業務場景。也許,領導會告訴你:“我們集團現在才100多家門店,今年能否開到1000家?這是集團今年的戰略目标。”請問:開店最重要的問題是什麼?答:選址!因為一個位置的好壞,可以直接決定未來便利店的收入和利潤。因此,“選址”即是一個業務問題,也是一個具備價值創造屬性的“場景”。作為集團創始人,在選址方面都獨具慧眼。開一兩家新店、可能需要考察一二十家店址,也許領導還看得過來,因此跟數據分析關系不大。但是,如果要開1000家新店,那得考察多少個店址?領導不可能有精力看得過來。誰來替代?質量如何保證?

這個時候,數據分析就能幫大忙了。已開的100多家店過去的經營業績,一定有相對好壞。而這些相對好壞和它們各自所處的位置,一定存在某種相關性。例如,一個店面業績的好壞,是否與寫字樓有關系?是否跟周圍的交通量有關系?是否跟地鐵站、周圍的小區以及周圍的競争對手有關系?這就是數據分析要研究的具體問題,可以通過數據模型規範出來,形成一個綜合科學的打分系統,從而代替領導的英明決策。這樣的自動化決策系統,随着數據的積累、模型的改進,能夠最終做得比領導還優秀!

這樣的數據分析,瞄準的是企業戰略性的核心業務,傍上了“選址”這個高價值的場景,因此産生的價值被認可度更高。

數據價值與商業模式息息相關

價值是業務的核心訴求,而後者是企業的商業模式确定的。不同的商業模式,産生不同的業務訴求,需要不同的價值體現。因此,數據價值的創造與企業的商業模式緊密相關。在不同的商業模式下,對收入、支出、風險的定義各不相同,因此對數據價值的期待各不相同。對商業模式的錯誤理解,可能帶來錯誤的數據分析方向,無法踐行數據商業價值。

看一個失敗案例。曾經幫一個連鎖便捷酒店分析數據。發現該便捷酒店的定價策略似乎很混亂,有很大的改進空間。此外,通過對曆史數據的分析,發現可以用當天的數據,對明天的客流量做一個相當不錯的預測。然後根據預測客流量的高低,做每日的動态價格調整,增加收入。通過對曆史數據的大概測算,我們預計能夠幫這種類型的分店提高至少20%的收入。

但是,當數據分析團隊向對方領導彙報這個結果的時候,被潑了一大瓢涼水。對方說:“我們對這不感興趣。”為什麼?我們的分析直接瞄準的是企業收入!前文提到,數據商業價值的第一個表現就是收入,第一次聽說有企業會跟收入過不去。對方說了:“我這個連鎖店啊,絕大多數都不是直營店,而是加盟店。因此,作為總公司,我的收入主要來源于加盟費。由于,我對加盟店的收入不抽成,因此這些加盟店收入跟我關系不是特别大,或者至少不是我最關心的事。”

我們分析的各個分店的運營收入,是各個分店的收入,不是集團總店的收入,因此不是集團領導關心的主要問題。這是由該連鎖集團的商業模式(加盟模式)所決定。因此,該連鎖集團的商業模式,決定了集團總店的收入模式。集團總店的收入模式,決定了業務的核心訴求,決定了數據分析價值的方向。

跟對方進一步溝通發現,所看到的混亂定價現象,很可能是人為造成的數據質量問題。各個加盟店,跟總公司有着複雜的合作與博弈關系。它們之間,顯然是要合作的,因為都在享用同一個品牌。分店向總店繳納加盟費,總店對整個集團的品牌推廣負有重大責任。但是,從分店的角度看,它們并不希望總公司對自己的實際收入情況了解太多,尤其是那些收入很好的分店。他們擔心,如果讓總店知道了他們的卓越業績,明年的加盟費會增加。因此,分店有很強的沖動去虛報部分數據。

這麼看來,上述數據分析結果,對于一個以加盟為主要商業模式的連鎖酒店意義不大,對以直營為主的連鎖酒店,也許更有意義。這說明對商業模式理解的重要性。對于一個具體的企業,正确理解它的商業模式,是創造數據商業價值的基本前提。小結

這是一個所謂的大數據時代,又是一個極其浮躁的時代。人人都在讨論數據,人人似乎都在讨論“價值”。太多人在讨論N個V,還有“磚家”說他家的AI整合了2000億個算法!在我的眼裡,這些觀點和方法無法對真實的數據産業實踐,做出任何有實際意義的指導。因為真實的産業實踐全部基于卑微的業務。而整個行業,無論是學界,還是業界,都鮮有人從業務的角度去定義“價值”,去理解“價值”。對這樣一個根本性的問題,都缺乏科學系統的見解,如何踐行數據商業價值?整個行業缺乏對業務足夠的敬畏,而被“大數據”“人工智能”等一大堆被定義得似是而非的概念迷惑了頭腦。

(作者為北京大學光華管理學院商務統計與經濟計量系系主任、教授)
   

熱門書籍

熱門文章