人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 知識圖譜的行業應用與未來發展

知識圖譜的行業應用與未來發展

時間:2024-10-26 01:36:20

大數據時代的到來,使得人工智能技術獲得了前所未有的長足進步。同時,随着人工智能對數據處理和理解需求逐日增加,知識圖譜升溫。融合知識圖譜與深度學習,已然成為人工智能進一步發展的重要思路之一。知識圖譜應用領域日趨廣泛,如互聯網金融、醫藥等領域,本文就知識圖譜的行業應用與未來發展進行深入闡述。

劉柳賽迪智庫互聯網研究所

圖1知識圖譜實例多領域發揮重要作用

知識圖譜本質上是基于語義網絡(semanticnetwork)的知識庫,旨在描述客觀世界的概念、實體、事件及其之間的關系。

知識圖譜(KnowledgeGraph)的概念最先是由谷歌于2012年正式提出,主要用來支撐下一代搜索和在線廣告業務。2013年以後知識圖譜開始在學術界和業界普及,并在搜索、智能問答、情報分析、金融等領域應用中發揮重要作用。

搜索:理解自然語言

基于知識圖譜的搜索引擎開始具備更精确的語義分析能力,可以清晰辨别出自然語言問題。

坐擁海量數據的互聯網巨頭,基于生态閉環,其數據能夠自我生長、消化吸收、形成新的知識體系,源源不斷地産生知識庫和知識圖譜。

基于龐大的知識庫和知識圖譜,産生了支持自然語言溝通的SIRI、EVI和GoogleNow等語音個人助理。2011年,IBM研發了Watson問答系統,Watson參加了Jeopardy!(危險邊緣)問答類電視節目,打敗人類冠軍。

臉書利用知識圖譜技術構建興趣圖譜(interestgraph),用來連接人與人之間分享的信息,2013年基于此構建了社交圖譜搜索工具graphsearch。當時,《連線》雜志認為臉書推出社交圖譜搜索工具一方面是要在網頁搜索領域擊敗谷歌;另一方面是要在垂直搜索領域擊退求職領域的LinkedIn、約會領域的Match,以及餐館點評領域的Yelp。

在國内,微軟必應、搜狗、百度等搜索引擎公司在谷歌提出知識圖譜一年後紛紛發布了自己的知識圖譜産品,如百度“知心”、搜狗“知立方”(現為“立知”)等。搜狗作為國内首家構建和應用知識圖譜的搜索引擎,将基于知識圖譜的人工智能技術和差異化内容内置到産品中。根據搜狗2016年财報顯示,其搜索流量急速攀升,移動搜索流量較2015年底增長70%。百度的知識圖譜也已廣泛應用于衆多産品線中,從2014年上線到2017年,其服務規模已增長約160倍。

騰訊彙總了微信、QQ和公衆号超過20萬億次的閱讀點擊量,數百億筆支付數據,全年約1300億次視頻點擊量,70億次新聞點擊量,四十餘萬款上線APP等數據,構建了社交知識圖譜,并用于服務旗下衆多産品,并在語音搜索、智能問答等新趨勢中積蓄勢能。

今日頭條每一個用戶的每一次操作行為都幫助它提高關系的準确度和維度,以此構建更加完善的知識圖譜。

生命科學:降低研發診斷成本

由于研發新藥花費較高,醫藥公司非常關注如何縮短新藥研制周期,降低研發成本。歐盟第七框架下的開放藥品平台OpenPhacts項目,就是利用來自實驗室的理化數據、各種期刊文獻中的研究成果以及各種開放數據,包括ClinicalTrials.org,美國開放數據中的臨床實驗數據,來加速藥物研制中的分子篩選工作,已吸引輝瑞和諾華等制藥巨頭參與。

Watson取得巨大成功之後,IBM成立了Watsongroup(事業部),對各種行業進行認知突破。其中在醫療方面,IBM啟動了登月計劃(moonshot),通過整合大量醫療文獻和書籍以及各種EMR(電子病曆)來獲取海量高質量的醫療知識,并基于這些知識向醫護人員提供輔助臨床決策和用藥安全等方面的應用。

金融:識别及預防欺詐

金融僅次于醫療,是知識圖譜應用最廣泛的領域,在反欺詐、搜索和營銷方面均有深入應用。

國外的Datafox和Spiderbook,國内的通聯數據等,通過從互聯網提取上市公司的相關數據,包括産品、公司供應鍊關系、競争對手關系等,整合為知識圖譜幫助企業或投資機構進行全網數據的關聯分析、影響傳播和預測。

反欺詐在金融風控中舉足輕重,但基于大數據的反欺詐存在兩個難點:一是如何整合不同來源的結構化和非結構化數據,并有效地識别出身份造假、團體欺詐、代辦包裝等欺詐案件。二是不少欺詐案件涉及複雜的關系網絡,如組團欺詐。

知識圖譜是基于關系的表達方式,可輕松解決以上兩個問題,因此在反欺詐中獲得廣泛應用。首先,知識圖譜可以提供非常便捷的方式來添加新的數據源。其次,知識圖譜本身是直觀的關系表達方式,可以幫助更有效地分析複雜關系中存在的特定的潛在風險。

比如,荷蘭的法律對破産不追責,因此很多人利用法律漏洞建立團夥進行企業倒賣,通過将其中一些公司申請破産以非法獲得很多免費資源。荷蘭政府希望找到幕後組織避免大量損失,但政府各個部門和組織的數據非常分散,導緻各個部門無法得到完整的信息判别上述團夥,而傳統的數據集成方法需要依賴經驗豐富的專家對數據庫進行手工集成,大大增加了工作量和處理周期。引入知識圖譜,進行有效的去中心化的高效知識融合,可快速确定可能性最大的元兇,相關部門就可以對其進行有針對性的深入調查。

農業:多媒體知識指導

大量的農業資料以不同格式分散存儲,傳統的關系數據庫模式不适用于複雜多變的領域,無法實現定義所有可能的知識點并構建關鍵數據庫模式,而知識圖譜這種更加靈活的知識表示模型可以實現管理。利用抽取挖掘技術從各種多源異構數據中獲取相應的知識,并用統一圖譜進行表示,形成完整的知識庫,刻畫作物知識、土壤知識、肥料知識、疾病知識和天氣知識等。通過圖譜關聯到圖片信息,形成多媒體知識圖譜,病變圖片信息相比專業知識更加直觀,也更方便農民使用。

客戶服務:個性化前瞻性關懷

維護客戶的原則即希望對于信用好的用戶能前瞻性地了解其需求,并在用戶抱怨或詢問信息時,可以預判其需求,并幫其解決,從而減少溝通次數和溝通時長。為此系統需要判斷用戶的信用等級,并根據用戶的當前消費情況和行為來自動化判斷其可能的行為。

Amdocs是美國最大的第三方賬單審計和客服中心,其客戶包括AT&T、Verizon和SPRIN,Amdocs對電信行業的設備、賬單、支付、消費模式等知識進行數據分類和商業概念歸類,經過提取整合各種數據源,形成統一的知識,并配合業務規則和貝葉斯網絡來形成決策引擎,對用戶的信用和各種行為結果進行預測,最終達到個性化前瞻性的客戶關懷。

此外,知識圖譜在媒體和政府均有不同程度的應用,如英國廣播電台最早采用了知識圖譜技術,近期熱論的新聞自動寫作機器人也是基于知識圖譜技術。Palantir則是美國最早在政府領域使用知識圖譜技術的公司,該公司幫助美國政府成功定位到了本拉登的位置。

表1知識圖譜在金融中的應用賦能認知智能

知識圖譜對于人工智能的價值在于讓機器具備了認知能力。機器認知智能在應用方面是廣泛、多樣的,體現在精準分析、智慧搜索、智能推薦、智能解釋、更自然的人機交互和深層關系推理等多個方面。

智能分析

由于缺乏諸如知識圖譜此類背景知識,各類工具理解大數據的手段有限,限制了基于大數據的精準與精細分析,大大降低了大數據的潛在價值。因此盡管越來越多的行業或者企業積累了規模可觀的數據,但這些數據非但未能創造價值,甚至可能因消耗大量的運維成本而成為負資産。

知識圖譜的發展提供了強大的背景知識支撐,可以賦能輿情分析、商業洞察、軍事情報分析和商業情報分析此類基于大數據的精準分析。

知識圖譜和基于此的認知智能為精細分析提供了可能。如汽車制造廠商等制造企業都希望實現個性化制造運用于精細分析案例。知識圖譜構建關于汽車評價的背景知識,如汽車的車型、車飾、動力、能耗等,提取消費者對汽車的褒貶态度、消費者改進建議、競争品牌等評價與反饋,并以此為據實現按需與個性化定制。

表2智能分析類型及應用領域智能搜索及推薦

第一,精準理解搜索意圖。在缺乏上下文的情況下,基于知識圖譜的認知智能可幫助搜索工具辨别出核心詞和修飾詞,如可應用在電商搜索引擎。

第二,實現對多元複雜對象的搜索。搜索的對象将從以文本為主到圖片、聲音,甚至是代碼和視頻、設計素材等。

第三,實現多元化搜索粒度,如段落級、語句級、詞彙級的搜索。這将率先在知識管理領域得到大範圍應用。傳統知識管理大都隻能做到文檔級搜索,這種粗粒度的知識管理已經難以滿足實際應用中細粒度的知識獲取需求。

第四,實現跨媒體協同搜索。傳統搜索以單質單源數據的搜索居多,文本搜索難以借力視頻、圖片信息,圖片搜索對文本信息利用率不高。未來借助認知智能,可聯合檢索社交網絡、地圖、文本與圖片信息等多個渠道多種媒體的信息。

因此未來的推薦趨勢就是精準感知任務與場景,基于背景知識,實現行為與語義融合的推薦,想用戶之未想。

知識型内容推薦。任何搜索内容背後都體現着特定的消費意圖,很有可能對應到特定的内容、場景和知識背景。建立相應圖譜,實現精準推薦,将顯著增強用戶對于推薦内容的信任與接受程度,這對于電商個性化推薦而言至關重要。

冷啟動下的推薦。利用外部知識,特别是關于用戶與物品的知識指引冷啟動階段的匹配與推薦,讓系統盡快度過冷啟動階段。

跨領域的推薦。有效利用知識圖譜這類背景知識,可以跨越不同平台之間的語義鴻溝,實現跨領域推薦。如微博作為媒體平台,淘寶作為電商平台,二者的語言體系、用戶行為完全不同,實現跨領域推薦以後,可向經常曬山峰照片的用戶推薦購買登山裝備,商業潛力巨大。

智能解釋

可解釋性決定了人工智能系統的發現、推理和決策結果能否被人類采信,因此可解釋性成為了金融、醫療、司法等諸多領域中阻礙人工智能系統落地應用的最後一關,而知識圖譜在實現人工智能可解釋性方面具有重要作用。可解釋人工智能實現以後,将率先大幅度提升金融領域智能投資決策、信貸風險評估的采納率,也将大幅提升人工智能在醫療領域确診方面的采納率和應用範圍。

自然人機交互

人機交互将會變得更簡單自然。自然人機交互包括自然語言問答、對話、體感交互、表情交互等,需要機器能夠理解人類的自然語言,要求其具有較高認知智能水平及強大的背景知識。會話式(ConversationalUI)、問答式(QA)交互将逐步代替傳統的關鍵字搜索式交互。未來,GoogleNOW、siri、amazonAlexa等語音助手及下一代對話機器人将代替我們閱讀、浏覽,甚至代替我們看電影、電視劇,然後回答我們所關心的任何問題。

深刻影響社會結構

以深度學習為代表的人工智能獲得巨大進展,但深度學習的不透明性、不可解釋性已成為制約其發展的障礙,“理解”與“解釋”是人工智能需要攻克的下一個挑戰,而知識圖譜為“可解釋的人工智能”提供了全新的視角和機遇,并帶來新科技、商業和社會新紀元—認知時代的黎明。

對于人類而言,知識圖譜賦能人工智能之後,将增強人類的能力,讓我們可以理解和運作社會中複雜的系統,提升我們駕馭科技的能力,改善人類的生存環境,人類與機器的交互将更加自然、有預見性、有情感性。

對于企業而言,産品和服務将具備認知能力,這将對企業産生颠覆性影響,将重塑其所處行業的形态,革新行業的各個關鍵環節。當前已有越來越多企業将人工智能升至企業的核心戰略,在電商、社交、物流、金融、醫療、司法、制造等衆多領域将會湧現出越來越多的人工智能賦能的案例。

對于社會而言,除了探索發現能力将得到長足進步以外,認知系統接受領先從業人員的訓練,掌握政治、經濟、法律、醫學、銷售和烹調等專業術語,能夠理解和傳授複雜的專業技能,将大大縮短社會培養人才所需的時間,甚至取代人類做出部分社會管理層面的工作決定。越來越多的知識工作将逐步被機器所代替,将對社會結構産生深遠的影響。

總之,知識圖譜将賦能認知智能,而認知智能是一種能夠實實在在落地的、有着廣泛且多樣的應用需求的、能夠産生巨大社會經濟價值的人工智能技術。認知智能的發展本質上是不斷解放人類腦力,伴随而來的将是機器生産力的進一步解放,最終将導緻生産關系的改變。

責任編輯:高津菁


   

熱門書籍

熱門文章