
科幻電影里人工智能(Artificial
Intelligence,簡稱AI)被塑造為可以跟人類相親相愛,并肩戰斗的一份子。但現實生活中,為了能讓人工智能像人類一樣說話都是一個需要攻克的難題。

科幻電影《我是機器人》劇照
回歸:
舊話題重回輿論中心
“人工智能”是時下非常熱的話題,以至于但凡科技公司都要將業務與它掛鉤。這股熱潮緣于今年年初,谷歌旗下英國公司DeepMind開發的AlphaGO計算機程序,在與世界頂尖棋手李世石的五番棋對決中,以4:1取得勝利。這場人機對決,讓沉寂了20年的人工智能再次回到輿論中心。
今年4月7日,艾瑞發布的《2015年中國人工智能應用市場研究報告》中,將人工智能的發展劃分為了三個階段——計算智能、感知智能、認知智能。
計算智能使得機器能夠像人類一樣進行計算,諸如神經網絡和遺傳算法的出現,使得機器能夠更高效、快速處理海量的數據。
諸如傳感器,圖象,語音識別,大數據的自動駕駛汽車則屬于感知智能,目前的感知階段已經比較成熟,逐漸在向認知智能方向發展。
認知就是具備學習能力,能像人有記憶能力,具備決策能力。在這一階段,機器將能夠主動思考并采取行動,比如無人駕駛汽車,實現全面輔助甚至替代人類工作。
無論是硅谷的科技公司還是國內的互聯網巨頭,對人工智能的投入都是不遺余力的。
谷歌、FaceBook、微軟、IBM都擁有自己的人工智能實驗室。在這個領域最早發聲的谷歌還把人工智能應用到它的各類型產品中。這其中包括我們已經熟知的AlphaGo人工智能系統、無人駕駛汽車、Google
Search緩解交通擁堵等。
百度則早在2013年就在硅谷設立一家人工智能實驗室,取名“深層學習研究所”(IDL),招攬頂尖人才,以促進深層學習研究的開展。
一個不容忽視的發展趨勢是,未來我們的生活將從工業時代完全過渡到一個全新的智能時代。人工智能會受人類的控制而更好地服務于人類,擁有更多的功能,應用到更廣泛的領域。
而這里有一個重要的課題需要解決:人類怎樣才能順暢的與機器進行交流,讓機器真正能與人類實現對話。
難題:
如何讓AI像人一樣說話
科幻愛情電影《Her》講述了一個人類與人工智能相戀的故事。作家西奧多在結束了一段令他心碎的愛情長跑之后,愛上了電腦操作系統里的女聲。這個叫“薩曼莎”的姑娘其實是一款先進的人工智能操作系統OS1,她能夠與人類對話,不斷豐富自己的意識和感情,善解人意的“薩曼莎”很快就與孤獨的西奧多成了無所不談的朋友。

事實上,就目前的技術而言,人類與人工智能實現如同科幻電影里的順暢交流并非易事。因為機器現在的智能語音停留在對關鍵詞的內容識別和上下文分析,而機器是沒有“語感”的,也不懂得什么語法。要將人類的語言用數學邏輯的形式解析并讓機器理解、學習這中間存在的問題就是,語言是不是能夠被數學化?語言如何能被數學化?
最近,谷歌旗下的人工智能公司DeepMind又憋了一個大招,他們研制出了能夠生成模仿人類語音的系統Wavenet,該系統讓機器說話與人類說話之間的差距縮小了50%。
在英文和中文進行的盲測中,聽者普遍認為,相比谷歌任何現存的運用不同科技手段的文字-語音轉換程序,WaveNet生成的語音都更加自然。
盡管Wavenet系統的研發是人工智能領域的重要突破,但這仍然是一個實驗室產品,人類與機器要實現順暢的交互仍然需要等待技術的進步。
競爭:
交互體驗是唯一衡量標準
讓人類和機器對話是人機交互領域長久以來的夢想。語音正在成為人類和機器互動中越來越重要的手段。企業在這個領域的競爭無疑也是激烈的。但TechWeb在與部分人工智能初創企業對話中發現,這個行業的競爭還沒有走向紅海。
驀然認知是一家成立于2016年5月的公司,其創始人戴帥湘曾擔任百度自然語言處理主任架構師。盡管成立時間不長,但驀然認知推出的人機對話引擎Mor首次出現在TechWeb線下沙龍IT龍門陣上時,還是驚艷了眾人。

這款產品的交互體驗十分順暢,響應速度非常快。在其有關訂機票業務的演示中,Mor可以實現口語理解,場景下的上下文理解和多輪對話,不斷修改需求,直至訂單完成。
Mor的聰明之處不是它能夠完成指定的任務,而是能夠進行上下文的聯想,推薦出個性化只適合你的方案?!拔覀兿胱龅木褪亲寵C器更好理解人的語言,幫人辦理各種業務,成為你的私人秘書?!贝鲙浵娓敢膺@樣介紹Mor,“國內唯一一家能夠全語音完成復雜任務的決策引擎?!?/p>
與Siri或者微軟小冰不同,Mor從誕生之初就是為了幫助人類完成任務。而這種任務并不是智能客服式的,從既定的答案庫里挑選出一條給予用戶。戴帥湘向TechWeb介紹稱,“Mor的決策是一個與用戶多輪交互的過程,交互的目的是要將用戶給定的任務完成得最漂亮。這個優化目標是一個動態的過程,機器不能隨機的給你,這不是優化。每個人都是獨特的,Mor會給你更個性化的推薦,Mor在完成用戶給定的任務時是沒有既定答案的,但是有既定的目標,就是要完成你給予的任務?!?/p>
目前無論是科大訊飛、云之聲還是思必馳等都瞄準了語音交互與智能硬件相結合的場景。作為初創公司,戴帥湘在與TechWeb對話中表示,這個市場其實并不是特別激烈,因為用戶使用語音交互的習慣并沒有完全培養起來,另外就是,這個領域其實沒有真正的巨頭。
但不可否認的是,對于語音交互的需求是很大的,一款語音交互體驗好的產品必然會得到更多服務商的親睞。目前比拼的就是誰的產品交互體驗更好。
入口:
未來智能生活的核心
人工智能與人類的生活會有多緊密?科大訊飛輪值總裁胡郁給出的答案是,未來的10年里,人工智能也會像水和電一樣進入到我們的生活當中,讓每個人都離不開。
近日在新浪科技C+峰會上,胡郁演示了科大訊飛的語音轉寫產品。胡郁演講過程中,他的所有發言都能實時轉化成文字展示在屏幕上。而這項語音轉寫技術的反應速度相當驚人,幾乎已經達到了音畫同步的節奏??梢韵胍?,未來的會議當中,有了這項技術,速記這份工作完全可以被取代。
當然,科大訊飛的野心肯定不是要取代人工速記,胡郁在演講中介紹,“我們要做語音和語言為入口的機器認知革命,這里面包括感知智能和認知職能。讓機器模仿我們人類的感知智能,可以對概念進行推理和解決。我們期待將來可以看到非常好的物聯網的世界,手機、智能家電、智能家居……都能夠跟我們自由的交流,我們可以進入一個真正的機器認知的革命時代?!?/p>
瞄準未來物聯網入口的并不只是科大訊飛,戴帥湘在與TechWeb對話中表示,驀然認知在做的正是顛覆現有人機交互方式,顛覆信息獲取方式,打造下一代物聯網入口。
在即將進入的物聯網時代中,語音交互被視作為人機交互的入口,可以想象未來的智能家庭生活中,你所接觸到的冰箱、音響、電視機都將透過語音技術、圖像識別等方式,更好的為你提供服務。未來機器不再是冰冷的器械,因為有了人工智能,有了語音交互技術,它們不僅能聽懂你說的話,更懂你的心。