盡管識别率已不再是問題,但無論是大名鼎鼎的Siri和GoogleNow,還是《訊飛語音》和Cortana等語音助手們,在被用戶調戲幾天之後紛紛被打入冷宮。而谷歌助理(GoogleAssistant)的出現,似乎為身陷困境的小夥伴們帶來了轉機。
語音助手這四年
2012年6月27日,一句“OK,Google.”将GoogleNow帶入了公衆的視野。而在4年之後,2016年5月19日,當谷歌在GoogleI/O大會上再次喊起“OK,Google.”時,GoogleNow終于脫胎換骨,成了谷歌助理。
不得不說,GoogleNow這四年發展并不如預期中的那麼美好。在初次亮相的發布會上,它便被“黑科技”産品GoogleGlass奪去了風頭,更何況還有蘋果的Siri珠玉在前。起初,GoogleNow隻是谷歌地圖團隊的一個創意,讓用戶不需要點擊屏幕即可完成對智能手機的操控。而在Siri出現後,GoogleNow才搭上了語音助手的東風。
在Siri和GoogleNow之後,微軟、訊飛、搜狗和奇虎360等廠商,紛紛推出了自己的手機語音助手APP。不久後,語音助手甚至開始成為智能手機的标配。然而,好景不長。即便是名聲如Siri,如今也隻有在用戶無聊時,才有機會登台“講個笑話”。
語音助手們的落寞,最核心的問題還是在于自己的“智商不高”。有網友戲稱,你原以為語音助手會是鋼鐵俠的Jarvis,然而事實上它隻是一個高配版的金立語音王。
如果你有深入使用過各類語音助手APP就會發現,這些機械的一問一答破綻百出。盡管表面上交互方式是語音,但其本質上與鼠标點擊和手指觸控别無二緻,死闆的語音反而讓人感到膈應。不僅如此,語音助手們能夠獨立完成的手機操作也十分有限,僅限于部分常用的系統操作,完全不能深入到第三方APP當中。
谷歌助理帶來了哪些啟示?
同樣是一句“OK,Google.”,同樣的機器人“嗓”,但此次出現的谷歌助理似乎要靠譜了不少。從谷歌I/O大會的現場演示中可以看出,谷歌助理可以聽懂更多口語化的表達,它甚至可以和用戶進行日常聊天。谷歌表示,谷歌助理并非隻是執行簡單的一問一答,而是會聯系上下文,給出更精準的答案,用戶還可以進行追問。
比如,當你“招呼”谷歌助理幫你搜索完熱門電影之後,它會因為聽到你剛說了這次會帶小孩一起去,而篩選出那些适合孩童的電影。更強的是,谷歌助理要比此前的語音助手們更“主動”—它會順勢問你是否需要四張票,并幫你搞定訂票和付費。如今,谷歌正在為谷歌助理接入更多的第三方服務,打車出行的Uber、在線聽曲的Spotify以及線上訂座的OpenTable都可以通過谷歌助理搞定。
可以說,谷歌助理将語音助手提升到了一個新的段位。而這一切,都源自人工智能的功勞。事實上,人工智能也正是今年的谷歌I/O大會的一大主題。在發布會一開始,公司CEOSundarPichai便開始強調機器學習在生活中扮演的重要角色。在本次谷歌I/O大會上發布的Allo和GoogleHome中,都有谷歌助理的身影。在Allo中,谷歌助理甚至會根據對方發來的圖片信息,給出回複建議。
語音助手,接下來怎麼走
而在國内,以訊飛為代表的企業已經将中文的語音識别率提升到了很高的水準。可是,“能聽清”的問題解決了,“能聽懂”又成了新挑戰。百度的人工智能研究目标之一便是要攻克這一難題,但目前進展緩慢。要知道,谷歌助理的背後,其實是谷歌在這一領域近十年的耕耘。除了谷歌,微軟、亞馬遜和Facebook等公司也在語音助手領域試水人工智能。更有傳言稱,蘋果的Siri也将迎來重要升級。種種迹象表明,由人工智能引發的語音助手變革,已是山雨欲來風滿樓。
短期内,國内同行要“借鑒”谷歌助理并不容易。不過,由于一些衆所周知的原因,留給國内語音助手們的追趕時間應該還十分充裕。我們認為,在語義理解方面還沒有取得突破之前,國内的語音助手們或許可以從以下三個方面進行突破。
其一是變得更“主動”。使用語音助手時,最讓人費解的是,語音助手們每次回答完問題之後,并不會主動接收下一條語音命令,我們還得自己動手按下話筒圖标。所謂“主動”,就是要從這些細節入手。
其二是擴展第三方服務。目前,當我們打開手機上的XX語音助手,說一句最常見的“附近有什麼吃的”時,得到的答案往往都是一個簡單的列表。為什麼不能進一步,提供餐館和産品推薦并幫助用戶完成點餐呢?也隻有待這類第三方服務豐富起來之後,才能增強用戶打開語音助手的意願。
其三是利用好手機傳感器。如今,手機上提供了多種傳感器,結合傳感器手機其實可以實時感知到我們的狀态。同樣的,這些傳感器可以部分彌補語音助手們“聽不懂”的尴尬。比如,可以轉述家裡領導分派的任務:到小區時買瓶醋。或者,在用戶出門時會主動問一句“帶傘了沒”。