“數據科學家”這個BI核心人才根本就是個古董職業,最近它在創新解決方案——數據可視化——的幫助下走下了神壇。
王衆/文
今年可能會有大批企業在BI部門新撥一筆錢,因為企業們重要的參考指标GartnerMagicQuadrantforBusinessIntelligenceandAnalyticsPlatforms2016(商業智能和分析平台2016魔力象限)出現了大變臉,原本熱鬧的領導力象限隻剩下3個品牌,其中Qlik和Tableau都是BI的攪局分子;隻有微軟這個經典品牌留了下來,至于之前一直強勢的SAP、IBM、SAS、MicroStrategy等均降到了有遠見者象限,Oracle幹脆出局。
在這源于市場對BI的需求已經有了根本性的轉變,簡言之,是由IT主導的企業報表轉向了業務主導的自助分析;BI的應用從管理層向業務層、個人層面普及。稍微深究一下,當然是大數據煽的火。
從桌餐到農家樂
商業智能的定義是由HowardDresner在1989年的通俗化而被人們廣泛了解。當時将商業智能定義為一類由數據倉庫(或數據集市)、查詢報表、數據分析、數據挖掘、數據備份和恢複等部分組成的、以幫助企業決策為目的的技術及應用。
提到數據分析,一定要提美國,不僅是因為Gartner魔力象限上的公司的總部幾乎都在美國,實在是作為《老友記》鐵粉的我深深記得,在這部20多年前的肥皂劇裡,Chandler的工作就是數據分析及重構;Joey去參加猜詞節目,搭檔的職業就是數據科學家。從這個角度看,“數據科學家”這個BI核心人才根本就是個古董職業,雖然它近幾年才随着大數據和雲計算在我國為大衆所知。
這個古董職業最近煥發了新的生機,它在創新解決方案——數據可視化——的幫助下走下了神壇。這種方案的魔力就在于無限降低技術門檻,讓普通人能夠通過拖拽的方式“分析”數據,還能生成漂亮的報告。
比較起來,傳統BI就像一桌套菜,把行業内多年的經驗整合和展示出來,幫助企業做出明智的業務經營決策,通常企業在部署BI的時候會選擇一個大品牌的整體解決方案。新型BI在推廣的概念是自助,但如果從整體架構和長期使用來看,與其說是自助餐,更像是農家樂——你可以直接購買現成的軟硬件,也可以自主開發、輕松集成。
知易行難的互聯網+
物理網、大數據、新型BI,看上去大數據應用就要幫助企業創新、營收了,實則不然,尤其對于互聯網+過程中的傳統企業來說。
所謂大數據,并不隻是數量大就夠了,一個企業在傳統BI系統中累積下來的幾個數據庫,不能叫做大數據,隻是曆史數據,分析它們是對數據降維,描述過去,解釋現狀。大數據除了海量,更重要的是來源廣泛,尤其是來自網上的非結構性數據,新型BI就是要對付它們,對當下的數據升維,影響現在,改變未來。後者是傳統企業最大的挑戰,因為它們根本沒有外
部數據,已有的BI也不支持這種分析。聯想對新型BI的部署就是在為積累大數據之後的應用做準備。
早就和大數據密不可分的是互聯網行業,阿裡巴巴是其中的領頭羊,它不僅自建BI支撐起龐大的阿裡系,而且在數加平台上将BI的各個環節産品化。數加團隊對于傳統BI的七寸之處,自然多有研究。阿裡雲BI産品經理解敏總結了幾個常見的技術難點:數據倉庫的建設,ETCL(抽取、轉換、清洗和加載)過程涉及面廣,工作量大;多種數據源的數據管理困難;BI建模實施時間長;海量數據分析處理速度慢;大多數深度的數據挖掘算法及工具還沒普及到普通用戶都可觸手可及的地步。這些困難都是企業接入互聯網數據後将要遇到的困難。
在走訪了多家努力實現互聯網+的傳統企業後,我愕然認識到,傳統企業的互聯網+過程絕不是加減法,而是脫胎換骨的大手術,包括大數據的積累和應用;要渡過這個劫,直接引入互聯網企業的經驗遠遠不夠。