3月,谷歌AlphaGo與韓國圍棋國手李世石的“人機.."/>
人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 釋放大數據的能量

釋放大數據的能量

時間:2024-11-06 07:21:49


    3月,谷歌AlphaGo與韓國圍棋國手李世石的“人機世紀大戰”,刷爆全球輿論圈。

說到底,AlphaGo獲勝,在于擁有人類曆史高手海量的棋局和不斷試錯改進的自我學習能力。大數據+深度學習,造就了AlphaGo的勝利。

海量數據的彙聚,促成了大數據時代的到來,然而,問題普遍存在,那些希望通過海量數據總結和發現科學的規律,或者是刻畫用戶畫像的設想,遭遇了諸多挑戰。

随着高校信息化的發展,積累了二十餘年的各類數據,當我們面對龐大的校務數據,希望藉以了解學校師生教學和生活行為的發展趨勢時,數據隐私保護、數據質量、數據分析技術以及數據應用服務等的問題,均接踵而來。

在數據開放政策與機制相對缺失的當下,數據的供需矛盾也顯得尤其突出。數據隻有開放,并按需彙聚起來,才能成為大數據,才能刻畫并總結出科學的規律,但如何開放大數據資源,在人們對數據“淘金”的期望越來越高的當下,将數據當做寶貝,秘而不宣,使得數據供與需之間,存在壁壘。

雖然大數據催生了科研的第四範式——數據密集型科學,但“大數據在計算機中,科研的人在科學中”,卻還是全球性的難題,要破解這樣的困局,需要從機制體制上進行整體規劃。高校數據中心或者即将到來的科學大數據庫建設中,需要解決數據管理及評價機制的問題。

首先,評價體系需要适應新的情況進行相應的變革。很多應用學科隻将計算機技術單純作為一種載體,或者是簡單的處理工具,因而從事計算科學的研究人員,也常常被視為科研輔助人員,其科研成果并不能得到認定,認識上的局限性使得學科交叉越來越困難。

第二,數據的規範管理。目前關于數據的标準規範雖然形成于2010年前後,但其中關于數據歸屬、數據版權等焦點問題,并未有清晰的界定,這對于數據的生産者及數據的使用者,都構成了風險。

目前國際上非常關注的“數據出版”,可以是一個新模式的探索。數據出版首先明确了數據的知識産權,清晰界定數據的擁有權,但并不妨礙其使用權;第二,注明來源;第三,數據擁有一個标識,可以提供使用者随時訪問到需要的數據。如此,既可以讓數據的開放共享更規範,也可以讓科研人員更願意開放數據,供需的矛盾或能得以化解。

大數據帶來機遇,也帶來許多挑戰,需要我們條分縷析,因時應勢,破解束縛,才能釋放出大數據無窮的能量。

中國科學院計算機網絡信息中心科學數據中心主任

CODATA中國委員會秘書長黎建輝
   

熱門書籍

熱門文章