在2016矽谷高創會(北京)暨全球産業互聯網大會上,創新工場董事長、首席執行官李開複發表了演講,他認為:“有關機器會取代人腦的讨論,我認為這種說法沒有足夠的科學根據值得讓人們想那麼多、擔心那麼多。在短期内更應該思考如何讓人工智能成為人類的工具、人類的奴隸,來為社會創造價值,為創業者創造機會。”他這樣說
2016年,人工智能得到全球性關注,主要是因為AlphaGo擊敗了李世石,于是,人們在全世界的媒體上都看到有關機器會取代人腦的讨論,我認為這種說法沒有足夠的科學根據值得讓人們想那麼多、擔心那麼多。在短期内更應該思考如何讓人工智能成為人類的工具、人類的奴隸,來為社會創造價值,為創業者創造機會。
為什麼人工智能會這麼強大呢?就是因為今天人類所做的大部分工作是重複性的,是基于一個有限領域的,是基于可以客觀思考。這些工作在未來的十年都會被人工智能取代。舉幾個例子:如今美國的美聯社90%的稿件已經被機器人取代了;在過去十年間,華爾街的交易員已經一半下崗離職了;未來人們肯定會看到無人駕駛的車,無人駕駛可能還需要十年的時間,但是十年不是很久。當人工智能時代來臨時,全世界的人約有9%的部分或全部的工作就即将被智能機器人取代。
如何做到呢?其實在上述領域裡,人工智能不是模仿人類,也不僅僅是取代人類,所謂的人工智能就是用特别巨大的數據集看到一個人一生,甚至一百個人一生也不能看到的海量數據,然後用數據推算出邏輯進行判斷和推測,作出比人更好的判斷。AlphaGo就是研究了幾百萬的棋譜和用無數小時的時間來學習并最終打敗人類專家的。有人說這樣不公平,一個棋手不可能花一百萬個小時研究棋譜。但這不是公平不公平的問題,而是我們如何用人工智能做出人類不能做的事。好比特斯拉的無人駕駛汽車可以用幾億小時在車的行進中彙集數據,擁有這些數據集成的司機難道不會比人類親自駕駛更好嗎?雖然這一天還沒有到,但是如果有一個智能司機做十億小時的駕駛練習,哪怕它開始像個孩子,學完以後難道不會超過人類嗎?我們還可以想象一下,如果有一個人臉識别的機器,它能把全世界罪犯的臉都背下來了,有人類能夠做到這一點嗎?所以這兩個例子可以看到,人類不用絲毫懷疑人工智能會全方面地超越人類。當然,也并不是在所有的領域裡都可以超越,僅是在一些可以窮舉的領域;可以客觀分析的領域;有正确答案的領域;有大數據的領域;有專家參與的領域。因此,人工智能時代會逐漸的發生,不會一次到位的發生。
深度學習帶來巨大變革
我個人有幸在30年前開始做人工智能,可惜當時因數據不夠,所以并沒有做出太多可以超越人類能力的智能機器功能。以往人工智能的對弈也隻是在遊戲的領域,本身并不帶來巨大的商業價值。近幾年,人們在業内看到更多的可能是感知,就是用算法,用人工智能來做判斷或者反饋,此時機器就要動起來了。人工智能在過去七八年間有特别大的進步,特别是智能識别領域,這是為什麼呢?因為在機器學習的領域有一套技術叫作深度學習,它帶來了巨大的變革。
簡單來說,就是過去人類是需要一步一步地告訴電腦該怎麼走,該怎麼做,而後人們發現一步一步地教可能會讓機器犯錯,教得也不全面,也不适合計算機的結構,而更适合人腦的結構。由人告訴機器一切,然後機器來計算,這大概是30年前的技術。而15年前的技術是人類找特征,機器學參數。就是人類告訴機器識别人的時候找眼睛、嘴巴,然後再來計算,技術已經有了提升,屬于人機結合的學習。
而深度學習的技術應該算是21世紀才推出的技術。這個技術特别神奇的地方是幾乎人類都不參與了,給機器看一億張臉,機器自己看,學習眼睛、嘴巴或是别的事情,不用再假設人的作用比機器更重要,就把大量數據給機器,讓它收取人認為重要的特征,而且這些特征隻有機器懂,人都聽不懂的。這就是阿爾法狗戰李世石的時候,下出了人類頂尖棋手都沒有辦法看懂的步驟的原因,這就是深度學習。機器能自我學習是一個抽象的概念,而且這個抽象概念超越了人類的想象,因為機器用的數據集比人類思維更大。好比一個孩子能夠自我學習,且彙集數據量夠大,什麼都學的會。大概在2011年,智能識别機器跟人的差别還是74%對94%的差别,如果計算錯誤率的話,可能要比人類差六至七倍,不太能夠用到實際的場景裡。但是,每一年智能識别技術都在快速地進步,可以看到在2014~2015年的時候已經超越人類了,而且差距越來越大,這意味着當機器可以識别人臉比人類識别更厲害的時候,以識别人臉為工作的人就要下崗了。此外,其他領域的識别能力也超過了人類,比如語音識别能力已超過人類,應用到客服領域的話,以後每天打電話賣房地産産品的可能都不是人類了,機器比人更聽得懂客戶的需求。
因此,當某個技術超越人類自身能力的時候,所帶來的機會是巨大的。下一個階段,比如未來五年什麼東西會産生巨大的價值呢?我比較看好一個領域,就是大數據挖掘領域,如果一個領域有特别大的數據,隻是這個數據沒做挖掘,就沒有産生價值。比如說商業化的流程、互聯網的數據。那麼,今天誰最适合做大數據人工智能呢?中國就是百度、阿裡巴巴和騰訊,在美國就是Google、微軟和Facebook。這些公司已經有互聯網大數據了,但怎麼做到呢?比方說用百度搜索出了十個結果,但我一個都沒有點,這暗示這十個結果都不是我想要的,說明起不到絕對暗示的作用,但如果數據足夠多,就可以充分地學習。這種數據挖掘已經被百度、阿裡巴巴、騰訊、滴滴、美團所使用,隻是在創業領域還沒有足夠的機會被普及。
目前,全世界範圍内還是Google在這個領域做得最好,因為它有全世界最大的數據集,也是世界上做人工智能做得最早的,再加上Google多年累計了大量的技術人才和特别快的機器,所以Google做出來了AlphaGo,而不是百度、阿裡巴巴、騰訊、美團和小米。但是Google的野心不僅僅是AlphaGo。2015年10月,Google自我命名為Alphabet,它不僅是一家互聯網公司,它可能還有做醫學的公司,可能還要做基因檢測的公司,甚至做汽車等等領域。Google在做智能産品的過程中發展了一套Google大腦,Google裡其實有兩套大腦,可以用到各個領域。這個發現才是它的最大價值,無論在其他任何領域,隻要有數據就可以啟動這個大腦,這讓Google擁有了巨大的數據量,可同時啟動數十個不同的項目。Google有這麼大的野心,就是使用深度學習,在過去的三年間可以看到在應用領域有大提升。美國已經有一些機構,比如OpenAI就擔心Google擁有這麼多數據,還有沒有機會跟它競争,它會不會已經比人類知道得太多了。我覺得對Google的這個問題來說,百度、阿裡巴巴、騰訊,甚至普通消費者和媒體都會擔心。當然,最好的辦法就是讓更多的人參與到這個領域來創業,就不會被某一個公司所壟斷了。
做深度學習需解決六個問題
深度學習領域的機會應該怎麼捕捉呢?我稍微保守地認為,并不是人人都能做的,且做起來也不簡單,還需要解決以下六個問題:
第一,有些領域需要平台化,比如開發一個蘋果系統的APP,或安卓系統的APP,隻要是計算機程序員就可以學會開發一個APP,但即便是一個優秀的程序員也沒法使用深度學習,因為還沒有平台化,裡面需要很多微調的東西,學習如何調參數很重要,而這方面的專家可能隻有幾百個人,人才很稀缺。
第二,需要海量的數據問題。不是一千萬的數據就是大數據了,這僅是小數據。真的要機器進行深度學習要有用武之地,要有更巨大的數據量。思考怎麼用草船借箭的方法,從用戶那邊拿更多的數據,就像孔明當年沒有箭就去借一樣。不一定要買。而後有了數據量就意味着需要完善數據的存儲以及解決存儲量的問題。
第三,思想上要相信人工智能。人們普遍認為,既然人工智能已經超越人了,就可以合理解釋給人類它的分析原理,但是機器學習是沒有辦法告訴人們它是怎麼作出決定的。換言之,人們要相信機器的判斷,不要總想着追根溯源地去找判斷過程,就像AlphaGo打赢李世石,每一步的計算依據是說不出來的。
第四,找專家,但這方面的專家真不多。Google已經開出九位數的薪酬來挖這樣的專家,這是以往難以想象的情況。而中國也同樣存在挖專家的情況,比如Face++,最近也是努力挖到了在深度學習的華人研究員。人才的價值特别巨大,因非常稀缺,但稀缺現象也僅是未來兩三年的現象,我覺得以後會有很多聰明人,尤其在中國湧入這個領域之後,重賞之下必有勇夫。
第五,靈活運用深度學習。當所有的準備工作都完成了但還是不能完成應用該怎麼辦呢?此時就要用巧妙的,非技術的方法。不要它來取代人,而是輔助人工作就好了。比如在安防領域,不一定需要帶着槍的機器人,它隻要帶着攝像頭,拍出來東西告訴人現場的情況就夠了。還有在醫學領域,不讓機器取代醫生,但可以給醫生做一些工具是完全可以的。此外,我們可以有容錯的界面,其實搜索引擎就是容錯的界面,界面設計得好也能彌補人工智能的不足。
第六,人工智能存在局限性問題,但人們不用解決這個問題,更應該思考如何能在局限的領域和場景内做好。比如說,為什麼要在可控的領域做好無人駕駛呢?特斯拉的自動駕駛汽車出車禍就是因它分不清巨大的卡車和天空的顔色,我們就可以在不會有巨大卡車出現的地方使用它。AlphaGo也怕天黑和下大雪,我們就創造适合它的場景,就像在智能倉庫裡做機器人,倉庫裡的燈光和環境都是可控的,不會下雨和下雪,不會有卡車出沒,用聰明的局限領域來創造價值。
人工智能的未來藍圖
我預測人工智能未來會普遍應用在以下三大領域:
第一,我們團隊相當看好大數據,尤其是在金融領域的應用,因為它有最大的黑盒測試,能夠産生最大的效應,也能吸引最大的應用。
第二,智能機器人。人們對機器人在感知方面有個誤解,就是自然語言理解能力。不是聽到語音了,轉變成字了,機器人就懂了,人類很容易懂,但對于機器人來說,聽見和識别人講的字與理解意思是特别大的鴻溝。這個問題我覺得至少五年,甚至十年的時間才能突破。目前,業内都想做家庭機器人,因其具備商業價值,既能讓開發者掙錢,又能讓用戶省錢。可是家庭用機器人不僅隻是在家裡多了兩條腿、兩隻手和家裡人打招呼,這滿足不了家庭期望值。這種機器人在日本可能會有市場,但我并不看好,這樣的機器人好玩兒,可以做老人陪伴,可以做小孩的玩偶,但僅此而已。要期待它可以炒菜、掃地、成為家庭主婦,或者家庭的新成員、新電器還是天方夜譚。不過,我們可以把這個機器人做成一個音響,或者做成陪伴老人的小機器,類似小魚在家的陪伴機器人是可以做的。此外,人類所想象的高智能機器人一定會先在商業領域出現,之後才會有希望在家庭中應用。
第三,無人駕駛領域,它至少在十年以後才會被普及。2014年,我們團隊就悄悄地耕耘這個領域了,之所以沒對外公布,是因為有些領域的投資一旦被公布,這個領域很快就被玩壞了。目前,我們已向20餘家公司投資了近一億美金,未來,人工智能會迅速滲透到各個行業,改變人類的社會。(本刊記者承安報道張宇佳攝影)