“庖丁”解小度-雜誌-人人書

編者按

這一季，大型科學競技真人秀節目《最強大腦》引入“人機大戰”模式，百度研發的人工智能機器人“小度”将作為特别選手參賽，與人類“最強大腦”現場對決。

無論比賽結果如何，百度又是否以娛樂之名行品牌傳播之實，通過這樣一場比賽，我們看到了人臉識别和“下圍棋”之外，人工智能在更廣泛領域的應用。

本篇文章，我們将以“庖丁解牛”的方式為您來一一解讀“腦王盛典”中的應用到的人工智能技術。

“親愛的”與人臉識别

嘉賓在40張父母合照中随機挑選一張，選手和小度同時觀察該照片，在40位造型一緻，身材接近的女生中，找到該父母的親生女兒，所找出的女兒手中全家福照片與父母合照背面的全家福完全一緻，則挑戰成功。

AI技術解讀——人臉識别

人臉識别是基于人的臉部特征信息進行身份識别的一種生物識别技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流，并自動在圖像中檢測和跟蹤人臉，進而對檢測到的人臉進行臉部識别的一系列相關技術。

隔代識别仍屬于圖像識别分類中的人臉識别，隻是難度更大。其技術原理與人臉識别相同，形成灰度圖，分别提取父母面部的特征點和孩子的特征點進行比對。賽前通過多次機器學習，在各種變量中間平衡，提高識别的正确率。

實際上，人臉識别遠超人類且可靠性很強，在過去的3場比賽中，人類選手做對了2道題，而機器卻做對了5道題，機器識别的準确率遠高于人類。

技術應用：

目前，百度的人臉識别技術已經對寶貝回家的人尋家、家尋人兩個數據庫的6萬多條數據進行技術分析，這批數據已經交給警方，警方會對這些尋親人進行DNA核實認證，目前已經有一例通過了DNA比對。

截至2017年3月，百度與民政部合作推出的基于人臉識别技術的百度尋人平台，已對接民政部全國救助尋親網27003名走失者的數據。

“滄海桑田”與圖像檢索

老華僑手中唯一一張老城市的老照片，其中一個很小的細節會遺留在現代城市中，小度和人類選手依據這個小細節中模糊的信息幫助老華僑尋找家鄉。舞台上呈現30張城市街景圖，嘉賓在30張老照片剝離的30個含有唯一有效信息的碎片中，任意抽取一個碎片。選手雙方共同依據這個有效信息的碎片，在30張城市圖中尋找匹配。

AI技術解讀——圖像檢索技術

計算機分類和提取出圖像的重要特征，并對多餘的無用特征加以有效地排除，以此實現對圖像的識别。

此外，這局比賽中還用到了語義圖像檢索，這是一種在互聯網上進行圖像檢索的方法，它是根據圖像的邏輯特征和抽象屬性進行檢索，使計算機檢索圖像的能力接近人的理解水平的檢索技術。

技術應用：

小度在本局比賽中所展現的語義圖像檢索能力，是基于百度在日常圖片搜索技術上的升級，百度利用深度學習的方法，讓圖像特征抽取的過程更加穩定，不受模糊、噪點等信息的幹擾，讓搜索結果更精準。這是百度最新的技術，會盡快把這個技術在搜索中落地，讓大家可以更快更順利地在互聯網中找到想要的圖像。

“永不消逝的電波”與聲紋識别

現場30段情景的說話聲，與30個笑聲相匹配。小度采集完整的30段說話聲，随後根據嘉賓随機你挑選的一個笑聲，找到對應的說話聲。正确找出，挑戰成功。

AI技術解讀——聲紋識别

聲紋識别和語音識别一樣,都是通過對采集到的語音信号進行分析和處理，提取相應的特征或建立相應的模型,然後據此做出判斷。

但不同于語音識别，聲紋識别的目的不是識别語音的内容,而是識别說話人的身份。其理論基礎就是“每個人的說話特性都具有其獨特的特征”，聲腔的差異以及發聲的操作方式都是聲紋識别的獨有特征。

聲紋識别主要分為聲紋确認技術（1:1）和聲紋識别技術（1：N）兩類。聲紋确認技術回答的是兩句話到底是不是一個人說的問題，而聲紋識别技術回答的則是“給定的一句話屬于樣本庫中誰說的”問題。

技術應用：

目前，百度在聲紋識别技術的應用上，已經有了以下的幾個方向：金融領域反欺詐（用聲紋識别确認用戶信息，提高客服和系統反欺詐的能力）；客服呼叫中心，快速定位用戶身份等；智能硬件的聲紋識别能力，讓機器人知道自己在和誰對話以及聲紋喚醒能力；安全領域的聲紋認證，類似于人臉閘機；輔助個性化語音識别和語音合成。

“庖丁”解小度