确切地說,Tableau帶着喬布斯時代的蘋果基因——顔值高、門檻低。
王衆/文
把Tableau和蘋果拽上聯系,絲毫不牽強附會,畢竟,Tableau的首席科學家就是和喬布斯并肩創立皮克斯的PatHanrahan。作為BI界兩大成功的攪局者,Qlik和Tableau之間的區别可以追溯到基因區别。
顔值高、門檻低
Hanrahan曾在喬布斯的皮克斯動畫工作室負責視覺特效渲染,使得在電腦上繪制漫畫成為可能。他還憑借《玩具總動員》和《魔戒》兩度獲得過奧斯卡最佳科學技術獎。通過這兩部大片的畫風,就可以想象Tableau出色的視覺風格。
Hanrahan與蘋果并無關系,至于Tableau的易用性,則可能緣于它的軍方基因——戰場的實時分析,當然操作越簡單、顯示越直觀越好。離開皮克斯後,Hanrahan教授回到斯坦福教授計算機圖形學,期間和他的一個博士生ChrisStolte受美國軍方邀請,研究實現戰地可視化,為了盡快繪制出戰地數據的邏輯,他們研究了基于表格的多維關系數據展示。
他們把關系型數據庫的語法與驅動圖像展示的編程腳本整合在一起,開發出了一種全新的可視化關系數據庫VizQL,并且提供了一個高度定制的界面,可以從多種角度高效、直觀的展示多維數據庫的數據結構與邏輯關系。
到了2003年,斯坦福校友、軟銀合夥人ChristianChabot說服Hanrahan師徒将VizQL商業化,成立了Tableau,這個詞語的本意就是造型和美術作品。也就是說,這款産品生來就是為了給數據造型的。
Tableau大中華區銷售總監葉松林描繪這個技術時說:“依靠數據科學家解讀數據的日子一去不複返了。現在,通過數據可視化軟件,一線的業務人員就可以整理、分析他們的數據,并呈現為多種形式,伸直可以直接發給上級、納入綜合報表中。這種自助分析的文化将幫助企業運營得更快捷、更智能。”不獨企業,這種自助分析文化也可以應用到個人生活中。
我的朋友Z統計專業畢業後,留在紐約做數據工程師,他所供職的公司是Tableau的大客戶,Z當時的應聘材料中就包括了一個Tableau的操作視頻,“3分鐘制作紐約地産租金分布圖”,使用的開源數據是紐約市地産租賃業的公開數據和谷歌地圖。我看了這個視頻,整個過程與編程、函數無關。
也就是說,屏蔽掉Z本人的身份,一個數據技術的外行也可以便捷的做出這樣一張圖。他可能是個正在找房的租客,通過這張圖定位符合自己預算的區域;也可能是地産從業人員,通過這張圖了解全市的業态;也可以是準備招租的房主,通過這張圖給自己的房子合理标價。
BI的最後一公裡
與Qlik不同,Tableau是一款輕量級産品,扮演的角色是BI的最後一公裡。已經建有BI系統的企業可以直接将它集成到已有的系統中,放在最後一步。比如Tableau的中國客戶靈北(北京)醫藥信息咨詢有限公司。
該公司的業務運營總監孫雲峰看中的,是它能夠讓BI經理對IT團隊的依賴降到最低、也将數據處理的用時降到最低,從而将更多的時間放在數據分析以及與相關業務部門的溝通上。BI是孫雲峰優化業務運營的其中一個工具,而這個工具的負責人隻有一個,即BI經理。他要有能力解讀BI分析結果,并與相關的業務部門或個人充分溝通問題的症結或優化的建議。
最理想的狀态是,BI經理既懂行業又是技術大拿,孫雲峰說,這将是未來對BI人才的要求。但起碼在目前的情況下,假設真有這樣完美的BI經理,他再修煉幾年就能夠成為該細分行業的數據科學家,這個崗位又該另招人了。現階段的BI經理通常也要兩手抓,但分析業務的那隻手更硬。
對于BI經理來說,分析時使用的變量越多、維度越多,對問題分析得越透徹、得出的結論越準确。而傳統的BI系統,需要先對數據建模、再分析,建模的過程對IT技術要求高,以至于每一次更新都是一次開發的過程,需要仰仗IT團隊,周期長、靈活性差。
Tableau幾乎抹去了開發周期,隻要有結構化數據,BI經理就可以通過拖拽數據項目即時建模、并生成圖和表。尤其是圖形表達,可以讓結果呈現得更加直觀。舉個簡單的例子,要分析多種藥品在限定時間段内、在全國各地的銷售情況,可以直接将銷售量顯示在地圖上,每種藥品用不同顔色的氣泡表示,銷售量的大小則用氣泡的大小表示,這樣一張圖就可以指導各地的配貨。
更重要的是,便捷性可以讓BI分析成為探索過程,時間和技術成本的急劇降低,允許BI經理探索多維數據間的關系,從而發現更多的業務秘密。
但這裡需要注意的是,Tableau處理的是結構化數據,如果是絲毫未經整理的數據源,恕不接待。
Z所在的公司是一家視頻網站,其數據分析是真正的實時大數據分析,每一幀視頻的數據及網站上同時發生的所有數據信息都不放過,這樣才能精準地分析出網站用戶的行為規律,并據此給出最精準的廣告投放方案。
這就需要先通過Hadoop提取出數據、再由數據工程師将其結構化,數據工程師們可以使用這些數據監測錯漏、實時修複;數據的使用者們才能借助Tableau分析這些實時海量數據,迅速做出業務決策。面對互聯網企業吞吐的、如此多維的元數據,根本無從建模,所謂的分析過程就是探索過程。
再往後看幾年,到了物聯網時代,數據将更加海量和複雜。葉松林分析;“交互性、可研究性和共享性是使物聯網數據有用而無需龐大數據項目的關鍵。理想情況下,用戶将能夠與他們的數據和其他數據探索進行随意且深入的對話,使他們能夠發現各種排列,甚至有時發現他們未知的存在着的模式。”到時,易用的探索型BI工具則會成為必需品。