人工智能正在成為新經濟領域的核心技術,智能語音助手作為人工智能的最佳切入點,正在成為各大公司布局人工智能市場領域的關鍵。比如蘋果的Siri,微軟的Cortana、亞馬遜的Echo以及谷歌的谷歌助理。雖然智能語音助手尚處發展期,但智能語音助手已開始逐步滲透入人們的生活之中。智能語音助手逐漸從被動變為主動,通過搶占AI入口市場,很多服務和商業行為都可以通過語音識别技術來實現智能化操作,特别是與物聯網硬件的結合,能夠為用戶提供更加全面的服務。
從蘋果的SIRI到星巴克的語音點單
提到智能語音助手,我們首先想到的應該是這項技術的先驅—蘋果Siri。自從蘋果2010年收購Siri公司為蘋果設備開發虛拟助理後,Siri就成為蘋果手機的賣點之一。Siri的出現也是消費電子界第一次向市場科普性地介紹智能語音助手。
Siri可以支持自然語言輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調,提供對話式的應答。Siri可以令iPhone4S及以上手機(iPad3以上平闆)變身為一台智能化機器人,利用Siri用戶可以通過手機讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等。
在技術的不斷追逐中,人們看到智能語音助手展現的巨大價值。雖然蘋果的Siri自面世以來就成為了智能語音助手的代言人,但更多的公司希望用新的人工智能技術來超越現有的智能語音助手所覆蓋的領域。
2014年,微軟官方發布了Cortana(小娜)這個類似Siri的個人語音助理平台。微軟的小娜不僅可直接與微軟搜索引擎必應相連,還能真正的充當個人助理。這意味着,它可以為主人做很多事情,比如安排會議、訂購機票、設置鬧鈴,甚至能夠講笑話。
2014年3月,谷歌宣布GoogleNow語音服務正式登陸Windows和Mac桌面版Chrome浏覽器。但是由于推廣效果不佳,2016年初,谷歌又推出了基于人工智能技術的語音數字助理“谷歌助理”(GoogleAssistant)、家用智能硬件“谷歌家庭”(GoogleHome)以及智能短信和視頻通信應用等最新産品。
從2015年起,國内也陸續出現了靈犀語音助手、百度語音助手、出門問問、歐拉蜜等多種應用。比如靈犀是由中國移動和科大訊飛聯合推出的智能語音助手,既能為您語音打電話、發短信、查天氣、設置提醒,又能幫你查話費、查流量、買彩票、訂購彩鈴,還可以陪你語音聊天
如今,越來越多的公司希望将将智能語音助手背後的自然語言解析技術運用到包括電子商務、娛樂行業等領域,使各個領域的客戶能夠創建自己的語音助手。
比如全球最大的語音識别公司Nuance針對企業市場也不斷推陳出新。Nuance的虛拟客服助理Nina集成了語音識别、語音合成以及自然語言理解技術。很多品牌都采用了由Nina平台提供技術支持的虛拟助理,其中包括達美樂比薩的Dom、荷蘭國際集團的INGE、捷星航空的Jess以及美國聯合服務汽車協會網站和澳大利亞稅務局(ATO)新推出的虛拟助理。
Nuance進入中國市場後在國内市場早已和HTC、華為、宏碁和上汽等知名公司在移動終端設備和汽車領域建立了良好的合作關系。在中國企業客戶自助服務方面,中國移動江蘇省在10086客服号使用了由Nuance及華為合作實施的自然語言導航應用,浦發銀行信用卡中心也同樣部署Nuance自然語言理解(NLU)以及來電導航技術(小浦随心聽),為客戶提供更加直觀、拟人對話式的用戶體驗,成為了國内信用卡行業首家提供語音導航服務的銀行。
2017年,咖啡連鎖巨頭星巴克在公司的移動應用MyStarbucks裡推出了一項新的語音助手功能,方便用戶通過語音點單和支付。借助該功能,用戶便可修改自己的訂單,就像在現實世界中與真的咖啡師交流一樣。
通過硬件搶占AI入口市場
智能語音助手真正的付費用戶還是企業級用戶,正如星巴克利用語音技術來點單一樣。多以圍繞着企業級用戶群體,新的商業合作馬上就如雨後春筍一般開始成長。
2016年Alphabet推出了能通過語音助理“聲控”的GoogleHome。GoogleHome可以讓你聽音樂,處理很多的任務,隻需要跟GoogleHome對話就可以了。在CES2017展會上,Alphabet圍繞GoogleHome發布了新消息,将虛拟助手放進了現代、克萊斯勒汽車;Alphabet還收購了LimesAudio,這家公司專門開發語音通信系統,未來LimesAudio的技術可能會植入GoogleHome、Hangouts及其它産品。
微軟也與日産合作,将Cortana裝進汽車。根據CES2017上日産發布的概念視頻來看,Cortana現階段的功能僅限于通過語音修改日程表、路線規劃等簡單任務。概念視頻還展示了Cortana在到達目的地後詢問駕駛員是否需要開啟自動泊車,預示了Cortana日後可以更多地參與汽車操控。
同時,為了搶占AI入口,微軟公布了一系列有關語音助手的開發工具,包括CortanaSkillsKit和CortanaDevicesSDK,極大地擴展了Cortana虛拟助理的适用範圍。這些工具将讓物聯網領域的OEM和ODM廠商能夠圍繞Cortana輕松打造第三方智能物聯網設備,以及開發與這些物聯網設備相關的應用程序。微軟表示,Windows10的遠場語音交互正在完善中,未來将能夠讓用戶在房間的另一端,直接向微軟小娜提問或者讓它播放一首歌,再或者語音喚醒和關閉電腦。與此同時,物聯網版本的Windows10IoTCore在CreatorsUpdate更新中将加入Cortana。2016年Alphabet推出了能通過語音助理“聲控”的GoogleHome。GoogleHome可以讓你聽音樂,處理很多的任務,隻需要跟GoogleHome對話就可以了。未來廠商基于Windows10IoTCore所打造的冰箱、洗衣機、恒溫器、智能鏡子等物聯網設備,無論是有屏幕還是沒有屏幕都将支持與Cortana進行交互。
蘋果也在開發受虛拟語音助手Siri支持的智能家居設備。據悉,蘋果開發的智能家居設備能夠通過語音控制屋内的各種電器、開關、燈光等。該設備的測試階段還使用了面部識别技術。不同的是,Siri智能語音控制家居設備制勝的法寶分别是高質量的麥克風和語音處理技術。另有消息人士稱,蘋果還添加了臉部識别傳感器。
同時,蘋果開始向外界授權Siri技術。2016年6月,蘋果宣布開放Siri後台代碼,通過API提供給第三方開發者,用戶可以用語音Siri命令激活APP,還可以為Siri增加新功能和新數據,避免犯下當年蘋果将操作系統的蛋糕讓給了微軟的錯誤。
谷歌則将“谷歌助理”與家庭産品結合,推出了名為“谷歌家庭”的家用智能硬件。“谷歌家庭”猶如一隻胖肚花瓶,是一款無線聲控小型音響,可以連接電視、燈具和空調等家用電器。“谷歌家庭”這款家用智能硬件設備可通過與用戶雙向對話的形式開展持續“互動”,幫助用戶完成一系列家庭日常活動。融合“機器學習”和在線搜索等技術,“谷歌家庭”可以對用戶的語音指令作出反應,執行一系列家庭日常任務,比如播放音樂、關閉房間的照明、回答知識性問題、查詢交通狀況、幫用戶修改預約等。用戶通過自然說法的方式即可控制設備。
目前谷歌正在Pixel中為GoogleAssistant添加全新功能,允許用戶通過GoogleAssistant虛拟助理來控制智能家居設備,該功能被稱為“HomeControl”,而目前支持的智能家居廠商和産品包括貝爾金的Wemo,谷歌的Nest,飛利浦Hue以及三星的SmartThings系列。此次讓Pixel擁有智能家居控制功能無疑帶來許多便利:用戶無需針對某個智能設備去單獨下載操作該設備的APP。而且這種通用性也讓用戶無需購買Google自家的智能家居設備就能享受到語音控制的便利。如果家中的智能設備支持,用戶能夠向Pixel發出語音指令,就能調節屋内溫度,控制照明,切換電視頻道,播放音樂等。
位于愛爾蘭都柏林的Voysis公司則希望通過自己的AI平台來切入企業級語音助手市場。2017年初,Voysis公司獲得了800萬美元A輪投資,由PolarisPartners領投。Voysis公司開發了一個深度學習引擎,專門用于模拟語音和語言任務。不同于GoogleAssistant,Voysis公司開發的VoysisSearch可以直接集成到網站或應用程序中,用戶可以直接與品牌的網站或應用程序交互,浏覽可使用的産品。
據悉,Voysis平台可以獲取所有相關數據,包括産品名稱、類别、描述、評價以及元數據等,以創建用于強化語音體驗的強大模型。即使在初始問題已經提出後,Voysis還可以細化搜索,這是其他虛拟助手在今天還無法實現的。目前,Voysis的平台支持16種語言,包括普通話、俄語、阿拉伯語和其他歐洲語言。
市場咨詢公司Tractica發布的報告稱,雖然目前最流行的還是智能手機消費者虛拟數字助手,但是虛拟助手技術已經開始進入其它設備,比如智能手表、健身追蹤器、PC、智能家庭系統、汽車。
是什麼讓亞馬遜的Alexa取得了成功?答案是高質量、低價格和開放的推廣策略。Alexa平台的高質量體現在其獨特的語音識别技術上,低價格體現在其建立用戶群的思維中。亞馬遜Alexa的成功之道
在使用智能語音助手搶占AI入口市場的戰鬥中,美國電商巨頭亞馬遜公司推出的内置“亞曆克薩”(Alexa)語音助理功能的“亞馬遜回聲”(AmazonEcho)智能音箱獲得了巨大成功。該産品是貝索斯在2014年11月推出的,可以接受各種語音命令,使用的時候,隻要說一聲“Alexa”。
亞馬遜在語音技術方面的投入算來有些晚,亞馬遜2011年收購語音識别公司Yap,這家公司成立于2006年,主攻語音轉換文本的技術。2012年,亞馬遜又收購了語音技術公司Evi,其在商品搜索的語音識别上有獨特技術。2013年亞馬遜又收購IvonaSoftware,做文本語音轉換技術。
Alexa的主要功能是讓用戶可以通過Echo的語音識别功能,操控任何一項具有聯網功能的設備,比如電燈、電視、空調等等。得益于高效率的語音識别功能,Alexa可以幫助用戶通過語音指令迅速驅動相關軟件。據亞馬遜的數據,Alexa在2014年最初發布時隻有13個内嵌的技能,到了2016年11月,這項功能已經兼容6000款應用,包括連接Uber、Twitter等應用程序。到2017年3月,亞馬遜宣布其Alexa智能語音助手平台的功能已經突破了一萬種。或許你覺得一萬算不了什麼,但你知道嗎,2016年1月,這個數字才不過130,而2016年11月也才6000,如今才過了不到4個月的時間,就已經翻倍到一萬,這種增速讓人大為吃驚。
是什麼讓亞馬遜的Alexa取得了成功?答案是高質量、低價格和開放的推廣策略。Alexa平台的高質量體現在其獨特的語音識别技術上,低價格體現在其建立用戶群的思維中。2016年下半年,亞馬遜推出EchoDot二代産品,售價僅50美元,成為去年假日購物季最熱賣的産品之一。據悉,2016年,亞馬遜Alexa成為最炙手可熱的語音助手,在2016年12月的假日購物季,Echo的銷量同比增長了9倍。
所謂的開放性,那就是開放自己的Alexa智能平台,允許第三方開發者和第三方硬件廠商在該平台上開發各種基于語音的技術功能。這是一項非常了不起的舉措。
正是通過對第三方的免費開放策略,Alexa吸引了大量的個人開發者和廠商,也獲得了日益豐富的功能。Alexa幫助各種硬件設備連接、控制家居設備,幫助打造一個完整的生态閉環,進而成為萬物互聯的智能樞紐和控制中心。這種開放策略與當年谷歌開放Android技術類似,從這種策略我們可以窺測出亞馬遜的野心和意圖,那就是通過開放,把Alexa打造成智能家居、萬物互聯版的安卓。
據悉,如果你是Echo用戶,就會知道每周AlexaAPP都會增加新功能,随着第三方開發者越來越多,Alexa會的本領技能越來越廣泛,除了基本功能、訂餐、購物、打車、控制電器等功能外,新聞、遊戲、教育等方面的技能也日益凸顯,亞馬遜甚至還建立了一個Alexa技能商店,頗有點想建立另外一個“蘋果帝國”的意圖。
2016年12月,英特爾與亞馬遜聯合宣布,雙方未來将在一系列智能家庭項目上合作。汽車生産商福特在CES2017上也宣布與亞馬遜合作,未來車主将能夠在福特的車輛上體驗Alexa語音服務,實現聲控購物、搜索導航,甚至車主在家就可以通過語音指令啟動引擎、鎖定或解鎖車門。華為也宣布今年1月6日在美國開售的Mate9智能手機成為第一個預裝Alexa虛拟助手的智能手機。Mate9将于1月6日在美國市場發售,售價為600美元。
亞馬遜已經成為通過智能語音助手搶占AI入口的真正大赢家,它與LG、DishNetwork、惠爾浦、華為、英特爾、福特的合作,不斷擴大了Alexa的版圖。
智能語音助手将成為AI的主戰場
人工智能将成為人機互動的砥柱,語言是人類用來交流的最廣泛的一種工具。人類在地球上的成功,很大程度上依賴于複雜的語言和如此多樣的詞彙。而且語言交流迅速、直接,是布局人工智能市場的最佳切入點。
2016年被認為是主流科技公司迎接智能語音助理的發展元年,近期在歐美持續走紅的亞馬遜Echo更凸顯了該趨勢,通過Echo的智能語音助理Alexa,用戶直接說話,即可完成設置鬧鐘、叫車、訂餐等。用戶需要調整什麼業務,這些事情都可以通過虛拟助理來完成。
如果智能語音助手技術成熟,Echo将有望替代目前的人工客服。亞馬遜的雲服務部門AWS正在為常設客服崗位的各類企業開發一套雲端軟件,讓Alexa接聽用戶打進來的電話,或者用文字回複顧客咨詢。這個内部開發代号為Lily的軟件,據稱包括了亞馬遜去年推出的文本和語音互轉服務Lex和Polly,預計在今年3月中旬發布。
伴随着諸多科技企業紛紛涉足虛拟助手技術,社交網絡霸主Facebook也欲憑借着語音助手“Moneypenny”進入該領域,這項綜合功能能夠幫助消費者完成産品購買和在線服務等在内的多項任務操作。據報道該項目正處于内部測試階段,聲稱為現代化數字助手服務帶來人性化體驗,例如用戶可要求Moneypenny對目前市場HDTV市場行情作為判斷和研究,并下單購買。
諾基亞也在準備推出自己的虛拟助手,名字可能為“Viki”。諾基亞在歐盟為“Viki”申請了注冊商标。在應用程序的産品描述部分,公司描述Viki“用于創建和監控使用數字知識的移動和Web助手,并将所有數據源合并在單獨的語音界面顯示。這也意味着諾基亞也即将加入激戰正酣的虛拟助理大戰。
雖然智能虛拟助理技術已經曆了較長時間發展,但科技巨頭們都認為,智能虛拟助理尚處發展期,未來智能助理發展的道路仍任重而道遠。
智能語音助手逐漸從被動變為主動,通過搶占AI入口市場,很多服務和商業行為都可以通過語音識别技術來實現智能化操作,特别是與物聯網硬件的結合,能夠為用戶提供更加全面的服務。
鍊接:
2016年Gartner虛拟客戶助理市場指南指出:“虛拟客戶助理供應商正在逐漸意識到使用虛拟客戶助理與客戶進行互動的重要性,并提升相應的技術能力。很多供應商都在對他們的虛拟客戶助理進行升級改造,不再僅僅依靠結構化内容庫中的答案對問題進行回答,而是通過頂尖技術對個人特征進行分析,使用機器學習技術,提供語境化和個性化的回應,甚至替客戶着想,觸發相關操作。”