人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 智能語音 :從交互革命到人工智能入口

智能語音 :從交互革命到人工智能入口

時間:2024-11-02 12:43:29

1.科大訊飛超腦魔棒

2.車蘿蔔HUD

3.樂視超級電視x55

4.美的“i+”智能空調2017年,智能語音似乎到了真正能成熟應用的階段。在一年前,《電器》記者對“智能語音”的印象還是“語音交互完整解決方案商”,主要為格力、美的、TCL、長虹、海爾等主流家電企提供技術服務的角色。但在今天,無論蘋果推出的Siri,谷歌發布的GoogleNow,還是微軟推出的Cortana、亞馬遜的Alexa,都希望用最自然的交互方式潛移默化地改變用戶的生活。

在智能語音進階的過程中,中國企業同樣表現搶眼。科大訊飛、思必馳、雲知聲、捷通華聲、百度等公司被人們所熟知,先讓機器“聽到、聽懂、反饋,再讓機器思考、溝通、決策”,成為諸多智能語音企業的願景。

進階的交互模式

從目前市場上智能家電、智能硬件等産品的發展趨勢來看,鍵盤輸入、手機APP、體感交互、圖像識别等多種人機交互并存。但是随着大數據、機器學習、雲計算、人工智能等技術的發展,語音交互正一步步解放用戶的雙手,語音輸入框也大有取代鼠标、鍵盤之勢。伴随着智能移動設備的普及,語音交互作為一種新型的人機交互方式,已引起整個IT業界的重視。

科大訊飛雲平台事業部副總經理馬漢君認為,随着移動設備的不斷普及、當家電、手機、智能硬件都成為通訊終端,當所有硬件都能交互的時候,語音為主的時代就會到來。

談及智能語音行業的重要性,雲知聲IoT事業部總裁謝冠超表示,在人機交互的場景中,語音交互是非常适合的解決方案。“當然也有一些其他交互模式存在,比如說圖像識别、體感識别,從技術發展階段來看,語音交互的可用性要超過前者。”據了解,随着降噪技術、方言識别、“雙工多輪交互”技術、機器學習技術的發展、對語音的準确識别,乃至對語義的準确理解,機器理解并執行人類指令已逐步成為可能。

從用戶反饋上來看,不隻是年輕人,中老年人群對語音喚醒家電、控制開關等方式同樣頗為看好。在這樣的市場環境下,很多家電廠商與智能語音解決方案廠商正頻頻聯手,推出基于語音交互的智能産品。

目前APP交互還是主流。馬漢君說:“目前家居場景下的遠場語音交互雖然已經達到90%的準确率,但還做不到如APP交互的完全可靠,所以未來的交互必然是多模态的融合。科大訊飛也相信随着語音交互的進一步成熟,必然是語音為主、其他交互模式為輔的形态。”至于交互的未來,思必馳CMO龍夢竹認為,随着AI技術的不斷深入,未來智能家居的交互将是多模态交互融合的形式,語音技術、機器視覺、虹膜識别、手勢識别、體感交互等多種技術的融合與應用。任何一種單一形态的交互方式将無法滿足用戶的需求,最終将會被取代。

扮演“AI”的重要入口

以語音交互為入口的認知革命,将推動人工智能夢想成真。這是一條人工智能走認知計算的必由之路。謝冠超表示,用戶看到的僅僅是“語音識别——回饋播報”的過程。“實際上,從技術通路來講,語音識别技術是走了一條完整的人工智能(以下簡稱AI)的路徑,在用戶看不到的地方,有很多‘AI’技術在支撐。”

入局的語音企業心中清楚,萬物互聯的願景一定離不開AI技術,使得萬物具有感知能力的語音交互就變得尤為重要。在馬漢君看來,AI必須要有足夠的用戶才可以更加準确,而語音交互就是一個可以獲得大量用戶使用的入口,所以科大訊飛相信,語音交互是AI的基礎功能。

随着AI技術的不斷深入,智能語音的應用範圍也在不斷拓展,如智能家居、移動互聯網、汽車電子終端、智能機器人、教育、醫療、智能客服等領域。龍夢竹介紹說,汽車電子終端的智能語音技術應用相對成熟,智能家居逐漸興起為新的增長點,未來上升空間十分可觀。與家電企業合作,是構建智能家居重要的一環。謝冠超表示,雲知聲已成功與美的、格力、海爾、華帝等多家知名品牌達成合作,并聯手打造了标杆産品,包括美的i+智能空調、格力金貝空調、樂視超級電視等。

科大訊飛建立的合作則更為廣泛,包括口語翻譯、機器評測、教育、移動互聯、智能客服、智能汽車等。在電視入口方面,科大訊飛已經和TCL、海爾、海信、長虹、康佳、創維六大電視廠商,以及主流的電視盒子商邁樂、小米盒子等,甚至廣電系統的歌華有線、廣東廣電等進行合作。

産業化階段做好技術積累

在産業化的過程中,感知、認知和通用智能是三個不斷深化發展的過程。目前語音交互技術正在經曆着從感知智能向認知智能的飛躍,不僅要讓機器聽見,更要讓機器聽懂并反饋有效信息,甚至自主做出決策。這已是國内AI企業的共識。龍夢竹表示,AI的浪潮将智能語音這一交互手段推向更高的平台、涉及更廣泛的應用、服務更多的産業。作為語音行業的巨頭,科大訊飛在“AI”浪潮下顯得頗為冷靜,産業化階段依然有不可忽視的問題。馬漢君告訴《電器》記者,語音技術在日常複雜場景下的自然語音交互獲得了突破,目前已經可以使語音交互從移動互聯網延展到萬物互聯的現實生活中來。但語音交互與具體場景的融合仍需要時間來逐步成熟。

談及階段性技術發展,龍夢竹曾在朋友圈為科大訊飛的技術點贊。她表示,思必馳也有自己專業專注專長的方向(車載,家居,機器人)。她用“不相伯仲,各有所長”形容各家企業的技術積累。“思必馳已與阿裡、騰訊、小米、聯想、魅族、海爾、美的等企業建立合作關系,聯合推出海爾馨廚冰箱、美的洗衣機、DOSS音箱、小米藍牙遙控器、小米音響等多款具備語音交互的智能家居産品。近期,小米推出的智能音箱也内置了思必馳智能語音方案,實現便捷的人機交互。”她說。

事實上,智能語音産業已經到了厚積薄發的階段。《電器》記者了解到,2016年11月,科大訊飛每日為近30億人次,22萬開發夥伴和9.1億終端用戶提供語音及人工智能交互服務。通過與家電廠商等硬件企業的合作,雲知聲單日調用量也已經過億。謝冠超說,用戶通過各類硬件、家電的使用,調用雲知聲的雲端。随着家電、智能硬件以及更廣闊的語音市場對雲端的調用,在“算法”下,硬件産品對這些海量數據的積累與深度學習,智能産品将完成一些基于信息理性分析做的溝通與決策。

智能語音可構建大生态

馬漢君告訴記者,目前來說電視機和用戶的交互能力還不盡如人意,因此科大訊飛推出了訊飛電視助理、超腦魔盒等産品。他強調:“在過去一年,科大訊飛圍繞語音作為入口的電視屏生态環境,增加了語音交互遊戲、益智教育等内容,完善了整個生态的搭建和更豐富的内容呈現。通過智能家居環境的鍊接,目前電視機可以操控更多的家電,我們也配合遙控器的方案推出了全新的芯片,使得全新的智能家居環境得以構建。”

要構建生态,背後的内容資源必不可少。龍夢竹說,内容資源的豐富從技術上講并不存在難點,而挖掘更實用有效的内容資源成為一大要素,思必馳在技術研發深入的同時,也将不斷豐富後端資源,針對用戶的垂直場景下的實際需求做出更好的人機交互體驗,布局語音生态。謝冠超也有類似觀點。他說:“對雲知聲而言,目标是構建人工智能的完善體系,但是面對階段性的商業應用,語音交互是一個不錯的切入點。”
   

熱門書籍

熱門文章