人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 智能語音開啟人機交互新時代

智能語音開啟人機交互新時代

時間:2024-10-28 12:19:17

随着萬物互聯時代到來,以語音為主、鍵盤觸摸為輔的人機交互正逐漸成為剛需,人工智能會像水和電一樣成為我們生活的必需品

如果你坐在車裡,對着空氣說,“我想在附近找個地方吃飯”。你的車會立即回應說“已為您找到附近10個餐廳”。你接着說:“我想吃火鍋,還想看場電影。”汽車會篩選出周邊有電影院的海底撈王府井店。如果你說現在前往,導航就會立即開始線路規劃。

注意,這不是說夢話,這是千真萬确。整個過程,你不需要打招呼,也不需要動手進行任何操作。對于開車的司機來說,這套由科大訊飛研發的“飛魚助手”語音操作系統簡直是夢寐以求的行車神器。

現在,訊飛、百度等企業的人工智能已經把科幻片一樣的黑科技變成了現實。汽車、電視機、電冰箱、電燈,任何你能想到的電器都能跟你愉快地聊天,并按照語音指令完成各種操作。

這些都是基于深度神經網絡的語音識别技術來實現的。語音識别技術,簡單說就是讓計算機“聽懂”人類的語音,将語音中包含的文字信息提取出來。該項技術在智能計算機系統中扮演着重要角色,相當于給計算機裝上了“耳朵”,使其實現人機通信和交互。目前語音識别準确率可達到97%。

“随着萬物互聯時代到來,以語音為主、鍵盤觸摸為輔的人機交互正逐漸成為剛需。未來5到10年,人工智能會像水和電一樣成為我們生活的必需品,深刻改變我們的世界。”科大訊飛董事長劉慶峰說。

如今,以智能語音技術為主的人工智能已在手機、教育、家具、汽車、醫療、服務機器人等多個領域顯示出巨大的應用潛力。

事件

國内首個動漫IP定制兒童智能語音燈在京東衆籌

國内首個結合《蟲蟲派》動漫IP進行深度定制的智能家居産品——蟲蟲派系列智能語音燈已在京東火熱開啟衆籌。據悉,蟲蟲派系列智能語音燈是輕生活科技根據中國領導力學術帶頭人楊思卓的作品《蟲蟲派》3D動漫進行IP深度整合定制的智能語音燈,是給12歲以下的小朋友特别定制的成長玩伴。

楊思卓長期緻力于領導力研究和少兒教育,非常關注兒童成長,其漫畫圖解領導力的《蟲蟲派》用寓教于樂的形式,依據現代心理學特點,塑造了6個生動活潑的動漫形象,通過他們的成長故事來引導小朋友提升面對困難和人際關系的處理能力,而蟲蟲派系列智能語音燈正好對應了這6個動漫形象。

動漫IP與智能語音燈完美結合。每台智能語音燈那膚如凝脂又亭亭玉立的陶瓷燈身上都有與之相對應的動漫形象,并在靈動的寬檐帽上搭配有與動漫形象性格相匹配的色彩,還動用了《蟲蟲派》原班聲優為角色對應的智能語音燈進行聲音錄制,希望通過動漫IP整合和人機交互的形式,将《蟲蟲派》積極向上的思想理念潛移默化的傳遞出來,陪伴每一位小朋友更健康快樂的成長。

離線智能語音技術強大又有趣。作為主打“智能語音”的燈,蟲蟲派系列智能語音燈的語音操控功能是核心亮點。依托輕生活科技對于智能語音交互、物聯網技術和雲服務軟件技術的超強整合能力,推出了處于行業前沿的離線智能語音技術,即無需聯網和下載手機App,隻需對着智能語音燈喊話就能與《蟲蟲派》中的動漫角色交談,并按你的語音指令進行開/關燈、亮度調節、延遲關燈、歌曲播放等的操作。

另外,經過超1W條錄音樣本的檢測調教,蟲蟲派系列智能語音燈的語音識别正确率高達到95%,真正做到了讓小朋友與智能語音燈溝通無阻礙、玩得更盡興。

設計細節有更多人性化考量。蟲蟲派系列智能語音燈造型婀娜,通體曲線優雅柔和,觸感溫潤不硌手,該設計還斬獲了紅帆工業設計大獎,小朋友可以放心使用。

此外,智能語音燈采用了壽命超過5W小時的LED燈,光線柔和,不傷眼睛,可調節光線強弱來适應不同生活氛圍對光線的要求,還可通過喊話自動設置5~20分鐘的熄燈時間,為了不驚醒淺睡眠的小朋友,智能語音燈采用了漸進熄燈方式自然過渡到睡眠環境。

當小朋友困了或者睡眼惺忪,不想說話的時候,可以用手掌輕壓寬檐帽來調節開關和亮度,也可以通過關閉智能語音燈底部語音交互按鍵,進入到手摸觸控模式。

141%

從市場規模來看,全球大數據總量仍不斷擴大,2015年數據總量達到8ZB(1ZB=1萬億GB),2020年将達到44ZB,今後五年預計仍将維持141%的年複合增長率。

背景人工智能迎來第三次浪潮

人工智能(AI)是2016年除了共享自行車(摩拜、OFO等)外最火的投資主題了,特别是自去年3月份阿爾法狗(AIphago)戰勝韓國圍棋高手李世石的世紀之戰開始,很多投資者及創業者的目光都聚焦于人工智能,資本跑馬圈地,創業BP(商業計劃書)言必稱AI+,不時冒出機器學習、深度學習等炫酷概念,就像幾年前的團購、O2O、P2P、共享經濟的創投浪潮一樣。

實際上,人工智能不是新鮮事物,這已經是人工智能的第三次高潮,第一波高潮是源于1956年的達特茅斯會議,人工智能概念初出茅廬就得到各界的吹捧,然而,人工智能并不如人們所想象的那樣樂觀,1970年左右,研究幾乎停滞,熱情消退。

上世紀80年代,日本提出雄心勃勃的“人工智能電腦”計劃,該計劃随着1987年Lisp機器商業化的失敗,AI再次進入低迷期,人們意識到人工智能的問題不僅僅是硬件,更多的是軟件及算法層面得不到突破。

第三次浪潮源于上世紀90年代,由于摩爾定律所到來的産業變革,人工智能得到長足發展,代表性事件如1997年IBM的深藍在國際象棋比賽中戰勝世界冠軍卡斯帕羅夫,GeoffHinton在2006年發現了訓練高層神經網絡的有效算法,并且在2012年的ImageNet評測領域大大突破了以前的算法。深度學習算法的應用使得語音識别、圖像識别取得長足進步,圍繞語音、圖像、機器人、自動駕駛等人工智能技術的創新企業大量湧現。

長石資本LongCapital合夥人袁皓認為,這次人工智能浪潮興起的原因取決于幾個關鍵變量:

1、雲計算。雲計算技術這些年已經發展成為大衆化的服務平台,這為人工智能技術的實現和應用落地提供了強大的後台保障。雲計算技術降低了IT資源使用門檻,為數據集中化創造了基礎,極大地促進了大數據産業的發展。

2、大數據。大數據是智能的基礎和土壤,沒有數據就沒有智能,所有的智能都是建立在數據的基礎上。近幾年,移動互聯網及物聯網的普及使得大數據技術迅猛發展,從而也助推了人工智能的長足進步,這是因為人工智能技術使用統計模型來進行數據的概率推算,隻有把這些模型經過大數據海洋中的不斷優化或者“訓練”,深度學習算法輸出的結果才更加準确。

從市場規模來看,全球大數據總量仍不斷擴大,2015年數據總量達到8ZB(1ZB=1萬億GB),2020年将達到44ZB,今後五年預計仍将維持141%的年複合增長率。

3、GPU及計算能力。近幾年計算能力的指數級增長、成本急劇下滑是人工智能得以迅速發展的前提,而GPU的崛起則是重要突破點。GPU圖像核心處理器是吳恩達團隊于2009年發現的,GPU芯片相比于CPU擁有更多的計算單元,GPU實現了并行計算架構,可一次執行多個指令,從而可以迅速解決計算問題。

同時微軟及Intel也在力推FPGA(現場可編程邏輯門陣列),相對于GPU來說,FPGA在峰值處理上較弱,但架構靈活性方面更為突出,尤其在處理小計算量大批次的運算時也更有效率,FPGA主要來自一家名為Altera的公司,由于錯過GPU,Intel不惜以167億美金的代價豪賭将Alter收入囊中。

4、深度學習算法。2006年Hinton提出“深度學習”神經網絡是人工智能的重大突破,學術上對神經網絡區分為DNN(深度神經網絡),CNN(卷積神經網絡)、RNN(遞歸神經網絡),CNN最初用來處理圖像,RNN最早用來處理語音。在實際應用中,CNN、RNN等并不是獨立使用,需要與不同算法及策略相結合,AIphago即是結合了增強深度學習和相關搜索的綜合。深度學習的發展大大加速了人工智能的發展。

5、人才。AI的爆發離不開頂尖的科學家,需要有能力部署人工智能技術并且使之産品化的資深工程師,讓我們先看看深度學習的四劍客;GeoffHinton,多倫多大學的特聘教授,GoogleAI團隊領軍人,Hinton是将BP算法應用到神經網絡與深度學習的主導者。YannLeCun,紐約大學終身教授,FacebookAI實驗室負責人,LeCun最負盛名的是在CNN(卷積神經網絡)領域的傑出貢獻。YoushuaBenqio,蒙特利爾大學終身教授,CIFAR項目負責人,Bengio的主要貢獻在于他對RNN領域研究的推動,現任ElonMusk主導的OpenAI首席顧問。AndrewNg(吳恩達),斯坦福大學教授,曾就職于谷歌,現任百度首席科學家。在線教育平台Coursera的聯合創始人,是人工智能和機器學習領域國際上最權威的學者之一。

人工智能的産業鍊一般分為“基礎層-技術層-應用層”,基礎層多為數據源、計算平台、芯片及傳感器等人工智能運營的基礎設施;數據工廠提供海量信息并通過數據挖掘及搜索算法進行分類與關聯,提供給機器學習,GPU并行計算及高性能計算機芯片構成超級運算平台。目前基礎層多為IBM、Intel、Google等巨頭公司的主戰場。

技術層依托基礎層的運算平台及數據源進行機器學習建模,開發面向不同領域的應用技術,包含感知智能和認知智能兩個階段。感知智能包括語音識别、圖形識别、生物識别及自然語言處理等;認知智能主要是利用深度學習等類人腦進行預測、判定等,技術層有大量創業公司,像視覺識别領域的Megvii、Sensetime、格靈深瞳、依圖科技等,自然語言處理領域有雲知聲、思必馳等,其中語音識别是目前最為成熟的人工智能技術,目前全球排名靠前的有Nuance、Google、蘋果,以及來自國内的科大訊飛和百度。

應用層主要基于基礎層及技術層實現人工智能的各行業的場景化應用,諸如智能硬件、工業及服務機器人、智能駕駛、智能醫療、智能客服、智能投顧、BI、個人助理等。應用層因為技術門檻較低,吸引到衆多創業公司的湧入。

焦點人工智能在語音領域商業化應用提速

人工智能發展條件的成熟催生了大量人工智能創業企業。據長石資本統計,截至2016年11月,VentureScanner将1485家人工智能公司劃分為13個細分行業,包括深度學習/機器學習(通用)、深度學習/機器學習(應用)、自然語言處理、計算機視覺/圖像識别(通用)、計算機視覺/圖像識别(應用)、手勢控制、虛拟私人助手、智能機器人、視頻内容識别、内容感知計算、語音識别、推薦引擎、語音到語音翻譯13個細分行業。其中深度/機器學習(應用)分類以約436家企業的數量遙遙領先,自然語言處理公司數量232家位列第二。

AI商業化前景看好。據美國銀行報告,到2020年,人工智能可能形成700億美元規模的市場。元大證券研報認為,2015年至2020年,中國AI行業預期年複合增長率達50%。從融資情況來看,人工智能的資本投入仍保持每年42%的增長,2016年VC投資也達到了創紀錄的25億美元。

随着人工智能技術的迅猛發展,智能語音、智能圖像、自然語言處理等技術的成熟應用,以及VC資本助推的水漲船高,這或許預示着,一個人工智能投資及創業的黃金時代的到來。

目前,以科大訊飛、百度、阿裡、騰訊、搜狗、網易為代表的中國企業正以語音為入口,實現人工智能商業化應用。科大訊飛在語音合成、語音識别、口語評測、自然語言處理等多項技術上擁有國際領先的成果,已經在聲音、輸入、交流、電視、教育、汽車、機器人等七個領域推進人工智能的實際應用。

2015年,科大訊飛推出的訊飛聽見産品,實時将語音轉寫成文字,速度和準确率遠超人工速記,現場識别正确率達到99%以上,标志着科大訊飛在業界率先實現了演講和會議場景下的語音轉寫技術突破。

2016年,訊飛聽見在實時中文語音轉寫的基礎上,融合全新的多語種翻譯技術,可以實時将中文演講翻譯成英語、維吾爾語、日語、韓語,并同步展示在大屏幕上。這也是是全球首次基于人工智能技術的實時機器多語種翻譯技術在大型活動上的展示,準确率比肩同傳翻譯。目前,此項技術已實際應用于上海高院。

而在汽車領域,科大訊飛推出了汽車智能車載系統——飛魚助理。通過接入多種内容渠道,飛魚助理可以在複雜的行車環境中輕松進行通訊和導航操作。目前,科大訊飛已與30多個汽車廠商建立了長期合作,并已在100多款量産車型中搭載産品。

教育領域一直是科大訊飛技術的重要應用領域。據新東方董事長俞敏洪在其個人公衆号上透露,新東方和科大訊飛共同投資成立了一家名叫“東方訊飛”的公司,科大訊飛的智能語音、AI技術,加上新東方的教育資源,兩家公司将一起探索“教育+科技”新形式。

中國工程院院士、中國人工智能學會理事長李德毅看來,人工智能讓我們生活得更加愉快。“在人連網的時代,人工智能應該更多地關注交互認知,研究人與人,人與機器人,機器人與機器人,或者混合的認知主體之間的交互認知。”

賽富投資基金創始合夥人閻焱指出,現在做的車聯網、機器人以及智能家居等等,語音交互都成了第一入口。更重要的是,國内研究語音交互的企業比如科大訊飛,不僅在語音語義,甚至是後方大數據方面,某些領域都超過了國際大牌公司,這是非常了不起的。“在語音領域,中國人工智能商業化應用率先提速。”

啟示未來将是人工智能美妙世界

在12月23日舉行的“2016中國信息産業經濟年會”上,賽迪智庫信息化中心的助理研究員劉鵬宇發布了2017年智能技術發展趨勢,包括人腦仿生、機器學習、智能語音助手、機器視覺、AR、區塊鍊、數字孿生和人工智能等8個領域,讓現場觀衆“腦洞大開”。人工智能已不是好萊塢大片,正悄然來到我們身邊。

AI時代,中國與美國或将并駕齊驅。創新工場創始人李開複在接受《華爾街日報》采訪時表示,中國在AI技術人才、工程教育和AI應用市場領域的優勢,将使中國成為AI技術領導者。據公開數據,中國在AI的兩個核心領域“深度學習”和“深度神經網絡”方面發表的論文數量超過美國。中國擁有世界領先的語音和視覺識别技術,正在成為人工智能的主要市場和技術發源地之一。

就如何打造人工智能産業生态、促進人工智能産業有序發展的話題,劉慶峰表示,人工智能的發展不會是一蹴而就的。2016年,科大訊飛牽頭發布了中國人工智能《深圳宣言》,倡導人工智能産學研用各界聯手共同推進中國人工智能産業發展。劉慶峰指出,未來誰掌握了人工智能産業的主導權,誰就将擁有全球話語權。

據此前發布的《烏鎮指數:全球人工智能發展報告2016》顯示,2015年全球新增人工智能企業數量806家,平均每10.9個小時就有一家人工智能企業誕生。美國在人工智能行業占據領先地位,但歐洲和中國的人工智能産業發展也在迎頭趕上,“我們認為,中國制造2025一定要跟人工智能匹配在一起。”劉慶峰表示,改革開放30年,我們創造了經濟上的奇迹,但在全球産業鍊上,我們仍處于價值鍊的底端。未來30年,如果我們抓住了人工智能産業機遇,将會在全球的價值鍊中有擁有更大的話語權和影響力。

中國移動通信集團公司副總裁李正茂則認為,“如果2016作為人工智能的元年,2018将是奇點的開始。”他表示,未來将是一種人工智能美妙世界。目前,中國移動和科大訊飛有着多方合作,比如在客服領域嵌入了科大訊飛的技術,未來希望與科大訊飛在更多領域深入合作。

根據業内預測,未來三年左右時間内,全球移動智能終端90%以上将配備語音功能,可穿戴設備、智能家居、企業級服務、汽車智能化等将成為智能語音的重要應用場景。正是看到這塊巨大的“蛋糕”,科大訊飛試圖打造基于語音為入口的生态鍊。

在科大訊飛市場部總經理任萍萍看來,未來語音必将成為人機交互、萬物互聯的基礎,這是科大訊飛現在的機會,也是科大訊飛有望觸碰到的未來。“未來我們要成為人工智能領域的産業領導者,我們對未來的期待就是讓機器能聽會說,能理解會思考,用人工智能建設美好世界。”


   

熱門書籍

熱門文章