人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 科大訊飛的人工智能之路

科大訊飛的人工智能之路

時間:2024-10-26 02:47:49

科大訊飛作為中國在人工智能方面的領頭羊企業,主要發展語音識别技術,當前人工智能已經成為風口,科大訊飛專注技術實力的開發,正蓄勢待飛。

站上人工智能産業的制高點

今年,李世石與AlphaGo的人機圍棋大戰吸睛無數,人工智能的話題始料未及地席卷了世界每處。今年也恰逢人工智能學科誕生一甲子,曆經波折的人工智能發展終于掀起全球熱潮,各國政府紛紛提出人工智能發展研究相關計劃,蘋果、谷歌等國際IT産業巨頭也相繼推出一系列人工智能應用,希望在新一輪人工智能技術競争中取得先機。

科大訊飛作為亞太地區最大的智能語音和人工智能上市公司,也是中國智能語音與人工智能産業的領導者,在語音合成、語音識别、口語評測、自然語言處理等多項技術上擁有國際領先成果。目前,科大訊飛已經占有中文語音技術市場70%以上的市場份額。

在人工智能技術鑽研與産業布局上,科大訊飛也較早提出了明确的思路與方向。2014年,“訊飛超腦”計劃應運而生,目标是讓機器實現從“能聽會說”到“能理解會思考”;2015年,科大訊飛發布的具有裡程碑意義的人機交互界面AIUI現在聚合了超過18萬的開發夥伴和8億的終端用戶,以科大訊飛為中心的人工智能産業生态已經逐步構建。科大訊飛力求在人工智能時代真正到來時全面開花,搶占人工智能産業高點。

科大訊飛是如何發展的?

科大訊飛是一家典型的創業公司,身上還有一個特殊的标簽:中國在校大學生創業的第一家上市公司。

1999年,還在中國科學技術大學就讀的劉慶峰面對當時中文語音市場由國際巨頭把持的現狀,懷揣“中文語音技術必須由中國人做到全球最好,中文語音産業必須掌握在自己手上”的信念,毅然創立了科大訊飛。

從6個人的團隊到後來18個人創業,一度并沒有人相信這個“草台班子”能夠與國際巨頭抗衡。初期的科大訊飛遭逢創業的種種艱難,直至5年後,公司才終于實現盈虧平衡。在盈利的博弈與權衡中,語音技術與産業當時被牢牢确立為公司的發展目标和方向。巨大的壓力之下,磨砺出的是堅持創新和堅忍不拔的寶貴品質,這也成為科大訊飛一貫堅守和傳承的核心精神。

創立近10年後,科大訊飛迎來了一個發展拐點—上市。2008年的中國風雲變幻,科大訊飛上市猶如浪潮中的一簇小水花,卻激起了自身的滔天巨浪。技術仍然是核心,産品和市場意識逐漸走上舞台。劉慶峰帶領團隊進一步梳理了公司的願景和使命,立志要讓事業影響中國未來,影響到每一個普通人的生活中。

功夫不負有心人。憑借核心技術的絕對優勢,科大訊飛在曆次的國内外語音合成評測中,各項關鍵指标均名列第一,2008年至今連續在國際語種識别評測大賽中名列前茅,2003年和2011年兩次榮獲“國家科技進步獎”,2005年和2011年兩次獲得中國信息産業自主創新最高榮譽“信息産業重大技術發明獎”。

2010年,科大訊飛發布了語音雲平台和輸入法,雲平台面向所有創業者免費開放,為海量用戶提供服務。數據的抓取、資源的整合,顯示的是科大訊飛決策未來的戰略決心。在此基礎上,随着人工智能時代的來臨,科大訊飛連續發力:2014年發布“訊飛超腦”計劃,核心就是讓機器從“能聽會說”到“能理解會思考”;2015年發布對人工智能産業具有裡程碑意義的人機交互界面—AIUI。在教育、家居、客服、車載、醫療等細分領域,科大訊飛依托人工智能技術達成廣泛合作,推出品類豐富的産品體系覆蓋市場。

2016年5月,ResearchMarkets最新發布的報告稱在全球語音市場,谷歌、微軟、蘋果和科大訊飛獲得了迅速增長,全球市場份額分别為20.7%、13.4%、12.9%和6.7%,科大訊飛已經代表中國民族創新企業站上了國際舞台,在全球競争中占據一席之地。

“訊飛超腦”布局

美國、歐盟等發達國家分别提出了“BrainInitiative”和“HumanBrainProject”等人腦研究計劃,投入巨資并将其提升到與“人類基因圖譜”重大工程并重的高度。蘋果、谷歌等國際IT産業巨頭亦相繼推出了Siri、GoogleNow語音搜索等一系列人工智能應用。全球政府、企業都已将目光投向人工智能行業,各顯神通。

人工智能的突破與“認知革命”緊密相關。七萬年前,人類發生了“認知革命”,核心是智人擁有豐富的語言,可以更好地描述自然世界、執行更加複雜的計劃,關鍵是可以描述夢中和想象的東西,從而産生虛構、宗教和各種概念。正因如此,目前很多正在做人工智能研究的專家,包括MichaelJordan和YannLecun等都已經意識到,自然語言理解對于人工智能來說是一個突破口。

科大訊飛目前正在執行的“訊飛超腦計劃”,就是希望實現包括感知智能和認知智能在内的全面突破,也是在人工智能領域的核心布局内容。在感知智能領域,語音識别、手寫識别方面每年保證30%50%的錯誤率的下降;在識别普通話的基礎之上,進一步識别方言;不僅能夠理解人類和機器的對話,還能理解人和人之間的對話;不僅能夠識别聯機手寫的字符,還能識别離線手寫的字符。在認知智能上的研究目标,關鍵是讓機器能理解會思考,這必須要突破語言理解、知識表示、聯想推理、自主學習等多個方面。

目前,科大訊飛的“訊飛超腦”已取得了階段性的進展。作為計劃的重要組成部分,科大訊飛正牽頭進行科技部863重大專項—“類人答題機器人項目”,未來要讓機器人參加高考并考上一本,甚至是清華、北大、科大這樣水平的高校。而在口語翻譯和評測方面,目前科大訊飛口語翻譯技術已達到英語六級水平,在國際機器翻譯評測(IWSLT2014,NIST2015)等大賽中奪得冠軍,口語作文評測機器已可替代老師進行自動評測,在廣東高考英語口語作文考試中得以全面應用。在主觀題閱卷上,科大訊飛将業界獨家的人工智能核心技術應用于考試以及傳統線下作業的自動批閱,不論是手寫識别的還是選擇題塗抹,都可以先通過OCR轉變成計算機可以理解的文本和圖像,再讓計算機自動對答案的正确程度進行評判,這其實是感知智能和認知智能的結合。現在安徽省合肥市和安慶市的會考中,英文和中文的考試已經全部使用了整套感知智能和認知智能技術進行自動評分,取得了非常好的效果,以後此技術将會被全面推廣到包括文科和理科的所有課程。

在産品應用之外,基于多年積累,目前科大訊飛在各項大賽中都取得了優異的成果。以今年為例,在年初舉行的國際語音合成大賽上,科大訊飛通過承建的語音及語言信息處理國家工程實驗室報送的參賽系統,不僅繼續在自然度、相似度、可懂度等傳統指标上保持國際領先,還在語篇段落表現測試中所有7項測試指标位列第一。這是科大訊飛自2006年首次參賽以來,第十一次參與該項賽事,持續鞏固了在智能語音技術的全球領先地位。

随後,在今年的全球人工智能比賽WinogradSchemaChallenge中,科大訊飛再次榮獲第一。WinogradSchemaChallenge作為意圖取代圖靈測試(Turingtest)的人工智能測試項目,着重考察認知、推理和常識判斷能力。

此外在美國當地時間9月13日,科大訊飛領銜的中國技術團隊又在國際多通道語音分離和識别大賽(CHiME)中包攬了賽事全部三個項目的冠軍。據介紹,CHiME比賽重點解決的是真實、複雜場景下的語音識别,因此是語音識别領域最高難度的比賽之一。參賽的各個語音系統需要克服高噪聲、混響等幹擾,在咖啡廳、公交車、街道等日常生活場景中,準确地識别和處理英文語音。

以各項賽事成績名列前茅的技術為保障,“訊飛超腦計劃”的目标就是讓各類智能終端實現從“能聽會說”到“能理解會思考”的演進,進而實現全球第一個中文認知智能計算引擎,在語音合成、識别和人工智能等各項領域引領智能應用潮流的發展。

風雨過後見彩虹

雖然人工智能現在已經大熱,但對于這個行業将來在技術和産品等方面的具體發展前景,學界與業界也有諸多讨論。

在科大訊飛輪值總裁、訊飛研究院院長胡郁看來,大家普遍更為關心的是人工智能的突破問題。目前,深度神經網絡與大數據兩個關鍵要素的結合是當前人工智能研究的一條主流路徑,這條路徑中還有一個非常重要的内容,就是基于互聯網和移動互聯網的“研究-工程-産品-用戶”大閉環優化,用簡單的四個字概括就是“大、智、移、雲”,它推動了工業界人工智能技術直接邁過了可用性門檻。

現在工業界所依賴的大閉環優化、深度學習和大數據,跟腦科學的研究思路結合也是完全有可能的。因為現在人工智能網絡借助于新的學習機理甚至拓撲結構上的改進,将可以進一步成為人工智能發展強有力的推動力。漣漪效應、深度學習和大數據的結合成為目前推動人工智能向前發展的最有效的路徑。

技術的突破從源頭上推動了人工智能産業的發展,而人工智能産業的發展又帶來了嶄新的問題:人工智能是否會威脅人類,搶人類的飯碗?胡郁認為,現在的人工智能跟我們的意識其實沒有任何的關系,所以機器的發展将來不會殘害人類或者替代人類,反而會讓我們的生活更加輕松和便捷。此前科大訊飛董事長劉慶峰曾在今年參與G20峰會下的B20會議接受《人民日報》采訪時表示,人工智能将會使社會的生産效率大幅度提升,社會财富創造的數量和質量呈指數級别增長;同時人工智能也将替代掉大部分的現有勞動力,颠覆現在的很多産業。這既是我們今天面臨的巨大機遇,也是巨大挑戰。

總體來看,未來十年将會是人工智能發展的關鍵階段,在這一行業中,中國現在少有的兼具核心技術能力和産業基礎條件:在國家層面,2014年科技部“863計劃”啟動“基于大數據的類人智能關鍵技術與系統”項目;在企業層面,以科大訊飛為代表的中國自主創新企業已經找到人工智能發展的必由之路—從語音和語音為入口介入認知智能。因此未來中國在人工智能行業和人工智能産業上必将大有可為。

且行且珍惜

一項技術從産生到發展到産業化再到消亡需要經曆很多過程,很多技術就在經曆了這樣的過程後慢慢消失了,而有些又被新的技術代替了。人工智能作為一個寬泛的概念,包含了語音、圖像、語義理解等許多方面,因此在他的發展道路上必然會出現很多的困境和曲折。

首先就是産業化的問題。技術向産品的轉化是技術持續發展的不竭動力。而就産品而言,實用性是消費者追求和喜愛的第一要義。如果現在的人工智能像此前的技術浪潮一樣僅僅止步于概念上的聯網,或者隻是停留在實驗室和研發中心中,那麼缺乏了産業化和商品化的技術就會像是無本之木、無源之水,最終還會走向末路和枯竭。此前科大訊飛董事長劉慶峰在今年全國兩會中提出要将人工智能确立為國家戰略,從國家的層面發展人工智能産業正是充分考慮到了人工智能發展的産業化問題,希望在國家的扶持下形成兼顧競争力和消費者口碑的人工智能産品。目前人工智能正處在商業模式構建和産業雛形生成的階段,以科大訊飛為主體的“中國聲谷”産業園區也在安徽省和合肥市的大力支持下逐步成長,逐步向産業特色鮮明、産業集群優勢突出、産業規模和影響力處于國際前列的階段穩步邁進。

其次,就是入口的問題。人工智能作為具有一定前瞻性的技術,在發展的過程中需要尋求一個合适的切入口融入大衆的生活。未來是一個萬物互聯的時代,面對各式各樣連入互聯網的智能硬件和其他設備,用戶都需要有更方便的手段進行操控。而這一切都将是語音大顯身手的時刻。正如前文所述,目前科大訊飛通過多年的技術積累,借助遠場識别、麥克風陣列、自然語言理解等技術,在多項智能語音和語言理解測試中榮獲桂冠。目前的技術已經具有了實用的能力和推廣的可能性,因此在未來借助語音的入口,實現人工智能的突破和跨越是非常有希望和前景的。

緊接着産業化和産品而來的就是盈利的問題。就人工智能産業來說,目前還處在初始投入階段,離盈利還有一定距離。但是隻要占據了市場和用戶占有率,盈利其實也就近在眼前。以個人用戶和随身可穿戴設備為例,借助認知計算引擎和語音識别功能,目前所有的移動互聯網模式,都可以在語音交互的過程中得以實現。人們通過在随身設備上實現基于語音交互的各項功能,可以獲得所需要的各項功能,而企業在這一交互過程中則可以獲得海量的後台大數據,還可以實時推送相關信息;而以商業用戶為例,為了獲取需要的技術保障和增值服務,用戶将會選擇付費的相關服務,這其中的市場規模都可以說是難以估量的。

最後,就是許多企業都會遇到的資本問題。其實并不是所有的企業和行業都适合資本的進入和并購的展開,此前劉慶峰曾提出,在人工智能行業,以科大訊飛為代表的中國企業真正的競争對手是國際上的人工智能巨頭,因此應當學習華為的作風,将工作和精力的重心放在技術研發和創新上。

數百年前的萬戶,不會想到現在NASA已經成功将人類送出地球,遠航太空;百年前的萊特兄弟,不會想到如今的客機已經可以運載相比當年幾何倍數的乘客跨越五大洲四大洋。無論願不願意、無論是否承認,科技進步的速度,總是超乎最前衛的理想主義者的想象。随着技術的發展,人工智能未來将在智能硬件、車聯網、機器人、自動客服、教育等方面發揮越來越顯著的作用。而科大訊飛作為亞太地區最大的智能語音和人工智能領導者,以多年潛心耕耘智能語音和人工智能技術的底蘊,必将堅守“用人工智能建設美好世界”的口号,和大家共同見證人工智能時代的真正到來。
   

熱門書籍

熱門文章