每日經(jīng)濟(jì)新聞 2016-08-04 01:18:20
8月3日,搜狗CTO楊洪濤正式對外發(fā)布了搜狗語音交互引擎——知音,該技術(shù)致力于讓人機(jī)交互更加自然,不僅“能聽會說”,還具有“能理解會思考”的能力。發(fā)布現(xiàn)場,楊洪濤一邊介紹搜狗未來幾年的AI技術(shù)戰(zhàn)略,大屏幕一邊通過知音引擎進(jìn)行語音交互展示,正確率可達(dá)到99%。
楊洪濤表示,自然交互和知識計(jì)算是搜狗在人工智能領(lǐng)域的兩大戰(zhàn)略方向,目前搜狗在AI領(lǐng)域的研發(fā)已經(jīng)全面展開,并在智能語音領(lǐng)域取得了重大突破,“知音”引擎作為搜狗在自然交互方面的重要成果,充分說明了搜狗強(qiáng)大的技術(shù)實(shí)力,未來隨著搜狗在自然交互與知識計(jì)算方面的不斷完善,“知音”將會在更多場景為用戶提供服務(wù)。
給語音識別裝上了大腦
還記得科幻片《鋼鐵俠》中,托尼·史塔克的AI管家賈維斯嗎?隨著科技快速迭代升級,過去在科幻片中出現(xiàn)的情景,很多都將在日后變?yōu)楝F(xiàn)實(shí),聲音的交互會出現(xiàn)在生活的各類場景中。
現(xiàn)場,搜狗語音交互中心負(fù)責(zé)人王硯峰通過文本編輯、車內(nèi)導(dǎo)航、生活娛樂三個(gè)場景為大家演示了語音識別交互的深度應(yīng)用。通過視頻可以發(fā)現(xiàn),首先,“知音”解決了用戶在說話過程中因語速過快而導(dǎo)致的吞音問題,語音識別錯(cuò)誤率相對下降30%以上,語音識別速度提升3倍。
其次,“知音”能夠在語音交互的過程中支持用戶修正錯(cuò)誤的識別結(jié)果,用搜狗手機(jī)輸入法推出的“語音修改功能”,用戶只需通過自然語言即可修改之前的輸入文字,例如用戶可以說:“把‘張’修改為立早‘章’,或者把‘張’修改為文章的‘章’,把(男)他改成女字旁的她”等,輸入法便可以馬上理解并執(zhí)行指令。
不僅如此,“知音”還支持多輪對話,處理更復(fù)雜的用戶交互邏輯,用更自然并且用戶更容易接受和理解的方式進(jìn)行交互,更好地感知用戶語音請求背后的真正需求,從而提供更為便捷的人性化服務(wù)。比如用戶說我要去首都機(jī)場,它會問 T1還是 T2,當(dāng)用戶確定航站樓后,它會問是出發(fā)還是接人。
“現(xiàn)在的語音交互分成三個(gè)技術(shù)環(huán)節(jié),語音識別、語義理解和語音合成。其中語音識別代表的是機(jī)器的耳朵,語音理解代表是機(jī)器的大腦?!簟Z音糾錯(cuò)技術(shù)相對于給語音識別加上大腦,以前語音識別沒有大腦只有耳朵,它并不知道內(nèi)容到底指的是什么?!巴醭幏灞硎?,如果想要做到更聰明的語音交互,要解決兩個(gè)問題——一個(gè)更靈敏的耳朵和一個(gè)更聰明的大腦,這就是我們的搜狗知音引擎?!?/p>
據(jù)了解,搜狗從2012年開始研發(fā)智能語音技術(shù),并在2013年開始進(jìn)行深度學(xué)習(xí),目前搜狗的智能語音技術(shù)已經(jīng)成功應(yīng)用到搜狗的全線產(chǎn)品中。數(shù)據(jù)顯示,搜狗搜索日均語音搜索次數(shù)增長超過4倍,搜狗手機(jī)輸入法日均語音輸入超過1.4億次,成為中國語音輸入功能使用量最大的移動手機(jī)產(chǎn)品,搜狗語音技術(shù)也在用戶產(chǎn)品的迭代中快速取得了行業(yè)領(lǐng)先的效果。
依托于搜狗自研深度學(xué)習(xí)技術(shù)
憑借互聯(lián)網(wǎng)公司的天然優(yōu)勢以及多年來的數(shù)據(jù)和技術(shù)積累,搜狗的“知音”引擎可以做到識別速度更快、糾錯(cuò)能力更強(qiáng)、支持更加復(fù)雜多輪的交互以及更加完善的服務(wù)能力,這背后還有搜狗堅(jiān)持一直以技術(shù)為驅(qū)動的戰(zhàn)略布局。
一直以來,搜狗都將人工智能技術(shù)的研發(fā)與應(yīng)用作為自身的戰(zhàn)略發(fā)展方向,早在兩年前就宣布實(shí)施“智慧戰(zhàn)略”,深入于包括深度學(xué)習(xí)在內(nèi)的前沿技術(shù)的研究、布局人工智能、引領(lǐng)未來搜索。
今年4月22日,搜狗宣布捐贈清華大學(xué)1.8億元人民幣,聯(lián)合成立“清華大學(xué)天工智能計(jì)算研究院”,深入開發(fā)包含人工智能在內(nèi)的前沿技術(shù),相關(guān)研究成果將應(yīng)用于搜狗的下一代產(chǎn)品中。該研究院也是目前國內(nèi)一家由尖端技術(shù)公司和知名工科院校強(qiáng)強(qiáng)聯(lián)合的人工智能專業(yè)研究機(jī)構(gòu),成為國內(nèi)“校企聯(lián)合”進(jìn)行人工智能科研的領(lǐng)軍企業(yè),未來無疑將會為搜狗創(chuàng)造更廣闊的發(fā)展空間。
搜狗CEO王小川認(rèn)為,“搜索本身就是一種AI,隨著人工智能時(shí)代的到來,搜狗將不斷增強(qiáng)自身技術(shù)實(shí)力的積累。搜狗目前已在語音識別領(lǐng)域取得了重大突破,未來一方面將通過與清華合作進(jìn)行人工智能領(lǐng)域前沿技術(shù)研發(fā),另一方面也將在自然交互與知識計(jì)算上不斷完善自身產(chǎn)品與服務(wù),成為后搜索時(shí)代行業(yè)的引領(lǐng)者。”
分析搜狗近些年的發(fā)展不難發(fā)現(xiàn),搜狗的成功很大程度上得益于公司前瞻性的產(chǎn)品與技術(shù)戰(zhàn)略,無論是PC時(shí)代還是移動互聯(lián)網(wǎng)時(shí)代,搜狗均能在當(dāng)下環(huán)境中開辟出最前沿的發(fā)展思路。
隨著人工智能浪潮的來臨,以及物聯(lián)網(wǎng)場景下應(yīng)用需求的不斷擴(kuò)大,智能語音產(chǎn)業(yè)規(guī)模將持續(xù)快速增長。搜狗適時(shí)推出“知音”引擎,不僅有利于其在即將迎來的行業(yè)爆發(fā)期中占得良機(jī),同時(shí),對整個(gè)智能語音行業(yè)的技術(shù)革新也具有深刻意義。隨著搜狗語音技術(shù)的日趨智能化和服務(wù)化,相信未來“知音”將會在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等各個(gè)方面得到應(yīng)用,并布局到更多的終端入口。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP