作者簡介
陳孝良
博士、聲智科技創始人,曾任中科院聲學研究所副研究員和信息化辦公室主任,中科院上海高等研究院客座教授,北京市公安局首屆網絡應急專家,主要從事聲學信号處理和GPU深度學習算法研究工作。
智能語音助手成火爆話題
說到語音交互,這其實并不是什麼新東西。在中國手機市場上,若幹年前就出現過一些簡單的語音操控工具,比如用戶可以對着手機說話,進行發送短信、撥打電話、點播歌曲等操作,但是這些産品并不屬于智能語音助手。真正的智能語音助手主要是基于人工智能、機器學習等技術,它們能夠理解用戶的日程安排和興趣愛好,能夠提供各種信息和服務,甚至能夠智能分析兩人的聊天對話,從而給出快速答複的建議。
近年來,随着人工智能技術的不斷發展,基于人工智能技術的智能語音助手也得到了人們的關注。從亞馬遜的Echo開始,這種外形簡潔美觀,看上去隻是一個藍牙音箱,但卻因為具備智能語音助理能力而内藏乾坤的小玩意兒就成為了熱點。除了前文說到的百度和華為,幾乎國内外所有IT巨頭都相繼進入了智能語音交互市場。
去年10月,英特爾與科大訊飛簽署合作備忘錄。根據英特爾内部消息,英特爾将與科大訊飛合作共同研發AI芯片,該芯片将麥克風陣列、遠場語音識别等功能集成到SoC當中,以形成完整的遠場語音交互鍊條。此次合作也正式宣告英特爾将進入智能語音交互市場。除了英特爾,三星同樣在語音助手領域的積極布局。三星于去年10月份收購了緻力于打造開放式人工智能助理平台的初創公司VivLabs,同時以80億美元收購哈曼國際,随後又聯合GPU巨頭英偉達投資SoundHound。SoundHound是一家緻力于語音識别與搜索的初創科技公司,最初SoundHound的主要服務是提供和音樂有關的信息。
Facebook創始人紮克伯格也在2016年花費100小時完成了AI管家Jarvis的開發。紮克伯格及家人可用語音向手機或計算機下達指令,實現燈光、溫度、電器、音樂和安防設備的控制操作。Jarvis系統具備的學習功能可使其識别主人的偏好模式、學習新詞彙與相關概念。
更有甚者,微軟在Build2016大會上幾乎完全放棄了實際的産品,而主講人工智能和它可以覆蓋到的那些服務;GoogleCEO桑達爾·皮查伊在GoogleI/O2016開發者大會上重複得最多的詞語也是自然語言處理、人工智能和機器學習。
随着亞馬遜、谷歌、微軟相繼在語音交互設備上發力,市場已經看到了這一領域的無限潛力。語音作為人類交流最自然的方式,比文字和圖像更具天然的優勢。尤其是亞馬遜Echo的成功,把人們帶到了無屏時代的門前。智能語音助手也因此成為了非常火爆的話題,幾乎掀起了全行業研究亞馬遜Echo的熱潮。
為何智能語音交互市場如此火爆?
VoiceLabs近日發布了《2017年語音報告》(The2017VoiceReport)。報告對亞馬遜Alexa和谷歌GoogleHome的開發者和消費者進行了調查,總結了目前的智能語音市場,并對2017年的趨勢做出預測。該報告預測,2017年語音産業結構将按照硬件産品、AI軟件、語音應用App、生态系統服務相結合的架構繼續向前發展。預計2450萬台以語音為主要交互方式的智能硬件産品發貨,市場總量将達到3300萬台,市場規模超過200億美元。而對各種智能語音助手以及語音交互App而言,競争将更加激烈。
亞馬遜于2014年底推出智能音箱Echo如今已成為美國使用最廣的智能家居産品,根據CIRP的報告,自2014年11月發布到2017年1月,亞馬遜Echo系列(包括Echo、EchoDot和Tap)用戶已達到820萬,同比增長2倍,較2016年11月時的數據增長60%。而亞馬遜公司2017年的銷量目标是1000萬,銷量激增的背後是Echo正迅速從早期用戶的小衆圈子進入大衆市場。
從産品銷量、技術進展,到相關創業公司的興起以及資本市場的頻繁運作,種種迹象表明,智能語音交互市場的趨勢已經明朗,語音是AI領域中最先落地的應用之一。這從電子技術發展曆程中也可參考類比,以語音為核心的電話是20世紀最偉大的發明之一,而其後相當長的時間才出現以視頻為主的電視,移動電話同樣遵循了這個規律。從物理層面來看,語音信号無論是從數據量還是計算量方面都低于視頻信号,這在趨勢剛興起的時候,更容易适用于遠未标準化的硬件體系,但是随着技術的發展,多傳感的融合仍然是根本趨勢。
目前,智能語音被重視的程度正日益加深,人工智能的較量在智能語音方面顯得異常激烈。
随着智能家居的逐漸普及,智能語音助手作為一個強大的處理單元,能夠擔當控制中樞的角色。
語音作為人類交流最自然的方式,比文字和圖像更具天然的優勢。語音交互市場的全球競争态勢初顯
VoiceLabs預測,亞馬遜或Google今年會通過類似手機上的推送通知來加強新應用的分發,并試圖解決用戶留存率低的問題,而2017年也将是語音應用貨币化的起步元年。當智能語音助手充分了解“主人”需求之後,應有能力在合适的時間主動提示合适的應用,既提高用戶的使用價值,又解決了語音應用的分發留存問題。
從全球來看,亞馬遜Echo最有競争力的對手當屬GoogleHome。GoogleHome自2016年推出以來一直與Echo明争暗鬥,争搶智能家居中樞的角色。通過亞馬遜和Google在美國“超級碗”投放的電視廣告就能體會到這種競争的激烈,兩家不約而同地打出了溫馨家庭“懶生活”牌,突出産品智能管家的功能。
美國市場調查機構SliceIntelligence近日發布的一份報告,對在線購買Echo消費者的性别、年齡、購物習慣等特征進行了統計。某種層面上,這意味着Echo在消費者眼中不再是隻有極客和技術控才感興趣的“玩意兒”,而是獲得廣泛認同的大衆消費品。當電子消費品獲得了女性用戶的認可,并且呈現出女性消費者占據市場購買主導優勢後,産品将逐漸成為成熟品類,并迅速出現銷量攀升态勢。Google已經意識到與亞馬遜的差距,正盡力通過收購等方式快速彌補這種差距。2017年1月初,Google宣布收購LimesAudio并表示将會把LimesAudio集成到自己的視頻會議解決方案中,為客戶提供低成本、高質量的音頻體驗。此外,微軟、蘋果等公司也在不斷強化自家的智能語音助手。
反觀國内,類似Echo的産品始終沒有吸引到消費者的眼球。一般來說,國内相比國外市場有6-18個月的延後,但是以國内的技術水平來看,可能需要的時間更長一些,國内在語音助手方面的布局略顯不足。科大訊飛雖然在技術鍊條上最為完善,也推出了類似Echo的叮咚産品,但是市場反響一直沒有達到預期。百度、阿裡、騰訊、360也加大投入做了布局,但是技術鍊條仍不完善,産品和服務始終沒有很好的落地。即便在技術環節,國内活躍的創業公司相比國外也少了很多,語音識别領域主要還是雲知聲和思必馳,NLP領域主要是三角獸、蓦然、竹簡等,顯然技術也制約了國内智能語音交互市場的發展。
可見,在智能語音交互的全球競争之中,國内的AI巨頭似乎才剛剛蘇醒。