芥末堆文,9月13日,在“未來之境”第二屆新浪C+峰會上,科大訊飛創(chuàng)始人、輪值總裁、研究院院長胡郁發(fā)表了題為“從能聽會說到能理解會思考,以語音為入口的認(rèn)知革命”的演講。以下為芥末堆對演講內(nèi)容的整理:
什么是人工智能?
胡郁首先回顧了人工智能的發(fā)展歷史。
1946年,世界上第一臺電子計算機(jī)埃尼阿克誕生,許多科學(xué)家對于計算機(jī)未來能代替人類做什么有很多聯(lián)想,其中最著名的一個人是圖靈,他提出了圖靈測試。
1956年,Dartmouth會議上,“人工智能”這個詞被正式提出。
經(jīng)過了五六十年代的發(fā)展,人工智能離大家的期望還很遠(yuǎn),進(jìn)入了沉寂期。
80年代,隨著個人電腦的發(fā)展,人工智能再次引起了大家的關(guān)注。
90年代,人工智能再次陷入低谷,因為很多人發(fā)現(xiàn)信息化技術(shù)能解決生活中大部分問題,并不需要人工智能,而且人工智能也做不到。
21世紀(jì),隨著互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的發(fā)展,人們再次發(fā)現(xiàn),人工智能是有可能做到的。
人工智能會如何影響我們的生活?
對于人工智能對人類職業(yè)的影響,胡郁和大家分享了德勤的報告,報告分析了目前人類的工作有多少已經(jīng)可以被人工智能代替。好消息是,CEO大概只有20%的工作可以被代替;園丁、清潔工被代替的比例更低,只有10%。不好的消息是,機(jī)器人可以直接把語音轉(zhuǎn)寫成文字,同時它也會開始寫稿了,最近美國和騰訊的一些人工智能技術(shù)都在展現(xiàn)這一點(diǎn)。如果由機(jī)器人來寫報道類的、陳述性的稿件,可能比人還要精確。
對于人工智能對人類生活的影響,胡郁認(rèn)為,人工智能的發(fā)展并不是線性的,未來二十年會取得令人驚訝的變化。過去幾年中,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)已經(jīng)像水和電一樣進(jìn)入到我們的生活。而未來10年,人工智能也會同樣進(jìn)入我們的生活,每個人都離不開。
同時,胡郁指出,人工智能還關(guān)系到我們國家。胡郁稱,據(jù)他所知,美國的國防部長卡特最近去了一趟硅谷,去爭奪人工智能的人才,以在軍事上率先做出無人戰(zhàn)車和無人艦艇的部隊,維持霸主地位。
人工智能最需要突破的難點(diǎn)是什么?
胡郁將智能分為計算智能、感知智能和認(rèn)知智能。
在運(yùn)算智能方面,由于計算能力和存儲能力的差異,機(jī)器遠(yuǎn)遠(yuǎn)超過人類。
在感知智能方面,機(jī)器在快速趕上我們,因為機(jī)器的傳感器、人工智能算法越來越清晰。
在認(rèn)知智能方面,現(xiàn)在還有很大的差距,如果機(jī)器能夠趕上我們,是人工智能戰(zhàn)勝人類非常重要的節(jié)點(diǎn)。
關(guān)于認(rèn)知的重要性,胡郁分享了以色列學(xué)者尤瓦爾·赫拉利《人類簡史》中的例子。根據(jù)考古學(xué)發(fā)現(xiàn),地球上所有的人類,祖先都來自于非洲的智人。在智人以前,地球上的人類猿人已經(jīng)存在了三四百萬年,而在七萬年前,智人消滅了其他的猿人,獲得了統(tǒng)治地位。智人戰(zhàn)勝其他猿人的重要原因,在于七萬到兩萬年前發(fā)生的了認(rèn)知革命。
由于語言和智能的發(fā)展,智人一方面可以把客觀事件描述得更準(zhǔn)確,另一方面可以八卦,交流夢中或思維里的東西,從而產(chǎn)生虛構(gòu)的概念,由原來的100人的團(tuán)隊發(fā)展為150人到1000人的團(tuán)隊,成為地球的主宰。在認(rèn)知方面,動物和人類差得很遠(yuǎn),因為沒有語言,就沒有知識,沒有知識就不能做復(fù)雜的推理,因此在政治方面發(fā)展很受限制。
做人工智能的兩種思路
胡郁介紹了做人工智能的兩種思路。
第一種,是科大訊飛正在參與的國家的腦科學(xué)人工智能重大規(guī)劃。他們希望通過對人類大腦的了解,設(shè)計出更好的算法。但是,對于大腦的了解是一個非常漫長的過程。
人類如何從腦科學(xué)中得到幫助?胡郁舉了“鳥飛派”的例子。當(dāng)人類要學(xué)習(xí)飛翔的時候,最先想到的是像鳥一樣,身上貼滿羽毛找一個高一點(diǎn)的地方來跳。后來,人類發(fā)現(xiàn)了空氣動力學(xué),造出了比鳥更好的設(shè)備。研究大腦也是一樣,不一定要把大腦完全的復(fù)制和克隆出來,而是可以找到這里面的智能。胡郁相信,未來可以找到關(guān)于腦神經(jīng)學(xué)習(xí)的機(jī)理、機(jī)制、結(jié)構(gòu),這些可以幫助人工智能的發(fā)展。
第二種,是業(yè)界現(xiàn)在已經(jīng)使用的人工智能的算法,即大數(shù)據(jù)人工智能。業(yè)界正在利用深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù),還有漣漪效應(yīng),來共同的養(yǎng)成視覺、聽覺和自然語言處理方面的能力。
什么是漣漪效應(yīng)?漣漪效應(yīng)和網(wǎng)絡(luò)效應(yīng)有點(diǎn)類似,是利用互聯(lián)網(wǎng)思維來解決人工智能的思路。當(dāng)一個水滴滴到水面時,隨著不斷地擴(kuò)散,漣漪就逐漸消失了。一項人工智能出來的時候不夠先進(jìn),先做一個產(chǎn)品,讓真實(shí)的人員使用它,貢獻(xiàn)真實(shí)的數(shù)據(jù)和經(jīng)驗。錯誤的誤差就像水滴形成的漣漪一樣,一開始是很大的,使用的人越多,技術(shù)就改進(jìn)了,傳播得越廣錯誤就越小。還沒有傳播到整個人群時,就已經(jīng)訓(xùn)練得很好了,水波紋已經(jīng)慢慢消失了。之后再接觸它的人,就會覺得這個東西怎么這么好,這就是業(yè)界現(xiàn)在做人工智能的思路。
科大訊飛在做什么?
胡郁介紹了科大訊飛正在做的訊飛超腦??拼笥嶏w想要做語音和語言為入口的機(jī)器認(rèn)知革命,包括感知智能和認(rèn)知智能。首先模仿人類的感知智能,之后要上升到認(rèn)知層面??拼笥嶏w有個Think Machine,可以對概念進(jìn)行推理和解決,解決之后執(zhí)行。胡郁稱,這項技術(shù)最近已經(jīng)取得了很好的成果。
訊飛語言及語言信息處理國家工程實(shí)驗室的鄧教授,曾和微軟一起把神經(jīng)網(wǎng)絡(luò)共同做成功。2009年的12月份,在他們成功三個月后,科大訊飛就知道了深度神經(jīng)網(wǎng)絡(luò)可以用于人工智能計算。在過去的五到六年間,科大訊飛不止一次的第一次把神經(jīng)網(wǎng)絡(luò)用在語音和語言的各個方面,比如說語音合成、語種識別、自然語言處理等等。目前,科大訊飛可以利用圖像處理的方法處理語音,這和人耳的聽覺系統(tǒng)非常接近。而更重要的,是解決認(rèn)知的問題,包括語音翻譯、知識表示、聯(lián)想推理和自主學(xué)習(xí)。
胡郁介紹了科大訊飛最新發(fā)布的產(chǎn)品是AIUI,希望能夠跟所有的智能硬件進(jìn)行非常自然的交互。利用AIUI,可以將原來單次的交互變成全智能的交互,將語音識別、語音合成、自然語言理解和整個對話過程融為一體。采用這項技術(shù)之后,對話的成功率從40%提升到了90%以上。
訊飛超腦在感知認(rèn)知方面還取得了兩項成就。一個是關(guān)于口語評測,用機(jī)器的方法,可以自動的聽懂口語,并進(jìn)行語音、語義方面的評價。另一個是關(guān)于手寫作文,機(jī)器可以對作文進(jìn)行評價和批改。
胡郁稱,他現(xiàn)在正帶領(lǐng)863的一個專家團(tuán)隊,包括幾百名老師、上百名教授在參與中國的高考機(jī)器人的研發(fā)。他們要做一個機(jī)器人參加高考,之后還能考上清華北大。胡郁認(rèn)為考試是評價人工智能一個非常重要的方法。
大會現(xiàn)場,胡郁還展示了科大訊飛最新的語音轉(zhuǎn)寫技術(shù),他的現(xiàn)場發(fā)言可以變成文字展現(xiàn)在大屏幕上。胡郁稱,目前,這項技術(shù)已經(jīng)被包括中辦國辦、中宣部等國家部門所使用。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。