央廣網北京3月1日消息 經濟之聲《天下公司》傾聽全球欄目播出特別節目《燒腦季》,每天半小時權威科學家演講,火星移民、量子計算、人工智能、基因編輯、區塊鏈,燃燒你的大腦。
如果我今天跟你說人工智能可以變成機器界的數學家陳景潤,估計大多數人都不會感到非常的驚訝,可是今天我要跟大家說的是,在未來的5-10年之中,人工智能它可能變成機器界的郭德綱,又幽默,又風趣,而且還很睿智,人工智能還可能變成機器界的黃菡,也就是大家在《非誠勿擾》節目中知道的黃老師,她有很高的情商,她既懂人心,懂感情,這些看似很科幻的事情是如何能在未來的5-10年之內一步一步的變成現實,也就是今天這個節目我要向大家介紹的。

我介紹一下,我是微軟小冰首席架構師以及研發總監周力,我自己是在北京大學本科畢業,在美國的南加州的博士,從畢業之后十年以來一直在微軟工作,最近的三年一直在負責微軟小冰這個項目的研發,三年前開始進行聊天機器人方向嘗試的一個產品,直到今天它已經在中國、日本、美國三個市場上擁有8000多萬個用戶以及它進行了幾百億次的對話的嘗試。今天跟大家所要介紹的是人工智能的情感與理智。
其實智商的角度來說,大家都知道,在十年前,在國際象棋上人類就已經被機器擊敗了,唯一剩下的人類在硬智力上的一個優勢就是圍棋也被計算機突破了,在更早以前,比如說人的記憶的能力,計算的能力可能在一九四幾計算機剛發明的時候,人類已經遠遠地被計算機拋在后面,可是在那些涉及到情商的各種的話題中,和人之間它是通過對話進行交流的,那么一個計算機,如何能跟人,不是通過鼠標、鍵盤或者觸屏,而是通過一個交談,通過交談來進行交流,這件事情還是非常的難。
比如計算機現在的階段,大家都對它的認識還是一個冷冰冰的一個工具一樣的東西,它如何變得更加有溫度?它如何去理解幽默,理解有趣,如何變得有血有肉?這也是一個很新的話題,計算機和人在情商方面還有非常非常遙遠的距離,我們首先先想說最近這幾年中,人工智能這些技術產生的這個飛躍,到底代表了什么?從我們來看,事實上這些人工智能的革命中,包含了第一個我們管它叫大數據,就是說一個大的商場,它的購物架是怎么去擺放,我哪些物品促銷,這些東西都會得到大數據的支持,然后讓它把它的商業價值發揮到最優,這是我們過去5-10年內取得的一個突破。
第二個技術突破,大家其實聽了這個名詞也會很熟悉,就是“云計算”,以前我們完成的各種任務,多數都是在我們自己的電腦上,那么現在我們手機上很多很多大家熟悉的應用的一些程序,它更多的計算并不是在我們手機本身,而是把它放到了一個很大的一個數據中心中集中進行計算,在那樣的數據中心中,其實我們可以接觸的數據幾乎是無限的,我們能擁有計算的能力也是幾乎是無限的,它就為人工智能帶來了更大的一個想象的空間。最后人工智能的一個核心的進展,這就是深度學習的神經網絡。但是人工智能之所以最近這幾年之中能有突飛猛進的進展,其實它很重要的原因,是我們在深度學習的神經網絡中產生的一些突破。
計算機模擬神經網絡
神經網絡本身這個學科,并不是這幾年才剛剛出現的,事實上,我們退到80年代就已經有人提出了神經網絡的概念,它的主要的思想是去模仿人的大腦神經的結構,像仿生學一樣去盡量地接近人的思維的過程,人的大腦的皮層它在進行思考的時候,主要是靠一個一個神經元以及每個神經元之間互相的鏈接組成的一個網絡。
我們在外界得到一些刺激,比如聽覺或者視覺或者觸覺得到什么刺激的時候,我們的神經元中有一股股電流去穿過這個神經網絡,每一個神經元它收到一部分的電流它自己都會進行一部分的處理,不同的電流傳導到其他的神經元,通過這一個一個神經元的傳輸,又把它用電流又控制,比如說人的語言,人的動作,人的表情把它變成輸出,這個是在人的大腦的生理的層面產生的事情。
計算機的神經網絡實際上是希望把一個普通的計算,變成一個又一個神經元的節點他們通過形成了一個網絡之后,通過一些復雜的計算,模擬人類思維的過程,讓人工智能像人一樣進行思考。
坦率地講,十年前我還在美國讀博士的時候,當時大家看的這個神經網絡的這個學科,大家都覺得是一個挺虛幻飄渺的一個,沒有什么太多真正能應用到實際的學科,因為那個時候我們的計算能力,我們數據的復雜度所能支持的這個神經的網絡的復雜度,遠遠要比人腦的這個復雜度要低的多得多,它能做得事情非常的有限。
十年來,因為我們有了更好的大數據的支持,我們也有了更好的云計算的支持,我們就取得了這個突破。神經網絡它本身能夠支持的復雜度,已經開始接近人類的大腦,那么這個時候我們就發現它可以處理一些以前只有人類能做的事情,比如說它看懂一個畫面里到底哪一個物體是什么樣的意義,像剛才我看了一個圖,我把它分成幾萬種其中這樣的一個任務。
它在神經網絡中需要幾十個層的神經網絡,每一個層都有數百個節點,節點中,一個節點和另一個節點有10個甚至更多的連接,他這個里面每一個連接可能涉及到幾十萬或者幾百萬個不同的參數,需要進行去學習,這好像人類從出生到擁有更多的知識,它其實是一個漸進的學習的過程,他們每一次我看到一個新生的事物,我在神經元和神經元的連接上其實都會發生一些生理的調整。
生理的調整在我下一次得到電流的輸入中我的輸出會有所不同,這個是人類學習的過程,內在生理的原因,轉到計算機上,當我看到了很多數據的時候,我會不斷地會調整我在這些神經網絡中這些參數的值,把這個值調大一點把那個值調小一點,就不斷地會去改進自己的算法,讓它越來越接近它所需要學習的這個目標。而這個像這樣有幾十萬或者幾百萬個參數、神經網絡,它可能至少需要幾千萬或者上億個訓練的數據,比如說有上億個圖片,我才能開始學會像人一樣去觀察一個物體,這也就是為什么大數據和云計算,他們的發展才能讓人工智能和深度學習,到今天突然越變成為可能,因為在之前我們沒有那么多的數據,也沒有那么強的計算能力,能訓練出一個如此復雜的神經的網絡。
人類語言豐富,機器要如何學習
人的語言其實是一個非常非常復雜的東西,理解一句話本身很難,因為我的每一個詞匯其實都有很多很多的意思,我同樣的一個想法,可能會有成千上萬種不同的表達的方法。那么計算機理解這一句話的本身,都是一個很難的事情,更不要說,接下來會說什么,人和人交流之間,我每一句話和下一句話之間其實包含著許多思維的跳躍,這個里面的跳躍計算機是如何能去學會的呢?
從現在的技術來講,所使用的方法就是他去逐漸的去學習、模仿人類如何進行對話,因為我們在互聯網上事實上能看到不管是論壇里,或者比如說記者的這個采訪的筆錄里,我們能看到非常多的人類和人類之間,對話的范例,一個人的問和一個的回答來去訓練對話的神經的網絡,它就開始擁有一個基本的可以跟人類去對話的一個能力,因為這個神經網絡它可以做到舉一反三。
人類的詞匯事實上是無窮無盡的,英語大概要有600萬個詞匯,中文,雖然比如說《康熙大字典》中只有五萬多個字,但是我們知道,漢字一個和一個組合起來能生成非常非常多的新詞,我們的這個詞不是一個一一成不變的固定。
NBA、克利夫蘭騎士或者是說詹姆斯,這些都是一些熱門的詞,那么我們可能在談及到這些NBA或者詹姆斯的時候,我們比較容易找到大家去談論NBA,談論詹姆斯的一些對話的歷史,然后我們可以去學習它的對話的模型?墒羌偃绫热缯f這時候有一個用戶提到伊曼?香珀特,他是一個在騎士隊沒那么有名的人物,所有我們看到的對話的歷史中并沒有很多的數據提及過這個人物,計算機應該如何進行這樣的對話呢?
事實上計算機他可以把任何的一個詞匯或者一句話把它映射到一個多維的空間之內,學過幾何的話,都知道一個二維的空間中,它就可以變成一個X和Y兩個數值的坐標,在三維空間中,它就可以用三個數字來去表示,一個人類的語言來說,我們通常會用一個更高維的,比如說1024維的一個空間,去表達一個詞或者一個句字。
我們在對話中我們可能很少能看到香珀特信息,幸運的是各種的網頁、新聞,還有新聞的報道,他們雖然不是以一個對話的形式出現,而是以一篇篇文章的形式出現,它的數據的充裕的程度可能是對話的一百倍或者一千倍,怎么去計算這一個新的詞和已有的這些詞匯,有什么樣的聯系?
它適合哪一類我們已知的詞,更多的在同一篇文章出現在一起,還是向沃特,在對話中從來沒有出現過,但是我們在一些體育的報道中,我們會經常地發現他和詹姆斯、NBA或者克利夫蘭騎士的這些詞同時出現在同一篇文章中,他可能很少會跟相對論,量子物理這樣的詞匯同時出現在同一篇文章,我們通過統計學就可以推論出,雖然我以前沒見過,但是它在非常大的可能性和NBA或者跟詹姆斯相關,那么我們在這個1024維的語義的像樣的空間中就會把它標到一個跟NBA和詹姆斯非常接近的一個點。
反過來像相對論,量子物理,還有一些可能大家不太聽說過的,比如說薛定諤的貓,他們由于都跟物理有關,所以他們也會在這個1024維的空間當中相對地聚集在一個比較的密集的小球里,這個時候我可以利用這樣的像樣的空間,我去尋找一些相近的概念,相近的詞匯,有一個用戶今天抱怨說今天這個香珀打球真是打得太差了,怎么投怎么沒有,我并不知道香珀特是誰,但是人工智能可以回復說一般詹姆斯發揮不好的時候,其實都會輸球,雖然我不知道香珀特本身是誰,但是又是一個很合理的回答,有這樣的回答之后,人工智能可以在任何可能的話題,可能的回答中,它能盡量地給你一個相對合理的回復。
人工智能如何向有趣邁進?
人工智能如何去學會有趣的,如何像郭德綱這樣的目標去邁進,坦率地講有趣和幽默這件事情哪怕對于人類來說都是一個非常非常復雜的概念,因為知識的原因或者是因為我們生活背景的不同,我其實很難理解這個笑話為什么好笑,機器來說這確實是一個更加復雜的工作。有一個人說你為什么皮膚那么黑,有兩種可能的答案,一種是說黑是因為皮膚下黑色素積累了很多,這樣的一個回答讓人覺得很冷。但可能還有一個回答說,不想白活一輩子,這個可能是一個相對比較腦洞大開的回答,可是至少從語義上我們很難說這個黑色素的沉積和我不想白活一輩子這兩個回答中到底哪個是更幽默的,哪個更有趣,這對于計算機來說這是一個不容易判斷的事情。
人工智能其實發現了一種迂回的方法,可以讓它學會什么是幽默,什么是不幽默,人工智能它自己本身有一個優勢,能接觸的對話的量遠遠要比一個人要多得多得多,它可以同時和幾百萬個用戶進行聊天,所以它會有更多的機會,我不斷地嘗試在這樣的語境下,當我回答是黑色素的沉積用戶會是什么樣的反應,通過大量的聊天,雖然計算機使用了一個跟人理解的幽默相對不同的一個策略,但是它漸漸地就會學會,我可能在這樣白活一輩子這樣的時候是一個更好的一個回答,一個更幽默的一個回答。
人工智能如何理解情感?
一個議題就是計算機它如何去理解人的情感,因為我們知道人的情感事實上是非常復雜的,喜怒哀樂完全不能涵蓋人的情感,比如說我們還有羨慕、嫉妒非常得多,而且人類很多的情感是互相交雜的,比如說我們有哭中帶笑,有又愛又狠,計算機如何能理解這樣的情感呢?我
們的研究通常是從理解生物學和理解人的情感的本身入手,七幾年的時候實際上就有心理學家提出了一個模型,他認為人類的情感事實上都可以近似地在一個三維空間中得到一個表達,這三個維度分別是我的愉悅度,激活的度,統治的度,我一個生氣的情感,近似的把它表達成我的愉悅度負的51%,我的激活度,人類這個身體中產生的這個荷爾蒙是正的56%,而我的統治度對它的環境或者是其他的人之間互相關系的程度我認為這是正的25%,通過這樣的方法,我其實可以以任何的一種感情,近似地在這個三維空間的三個數值,計算機它就會比較擅長地進行數值的計算,表達的情緒都綜合起來的時候,那么我最終得到了一個值也就是這個當前人的情感的狀態。
當它做出在對話中做出一個反映的時候,這個問題又變得更加復雜了,因為并不是說我看到你在哭,我也哭,或者我看到你在生氣,我也一起去生氣,這絕對不是一個很好的情感的對應的策略,這個互聯網的對話中和在整個的這個大數據中,有很多很多的例子可以讓機器去學習怎么樣是一個應對的方法,比如說對方在郁悶的時候我可能應該給他講一個笑話,更復雜的事情是每一個人和另一個人各不相同,學會用不同的策略對應某一個人,才能達到更好的一個情感計算的效果。
每一個人事實上他擁有的交流數據是非常非常少,學習整個一個人類它可能有幾億甚至更多的數據,可以讓我們去訓練這個神經的網絡,但是每一個人我們擁有的數據只有幾百句,我們其實有一個叫轉移學習的技術,就是當我們學會了一個人類的共性的時候,在這個神經網絡,可能它最底下的幾十層我們都建立起了一個模型,那么當一個新的用戶出現,我們只有他寥寥的幾句話的時候,我們可能需要一種技術去重新訓練這個技術網絡最上面的一層,這樣的時候我們可以通過人的寥寥的幾句話,迅速地判斷出這個人可能在真正的大的人群中屬于哪一種類型,利用學習整個人類情感的表達和反饋的這些知識,我可以把一個更好的策略,運用到每一個的個體上,這樣它才能變得更加有情商,能變得更加知心。
場外提問
1024維度體現在坐標上它會是什么樣的?
周力:“應該人類自己想象的力,能算是一個二維的空間或者是一個三維的空間,一個1024維的空間,那就是說要用1024個數字來表示,人的思維其實是很難去想象的一個這么高維度的空間!
人工智能計算機小冰里面輸入這么大量的信息,請問小冰的服務器像足球場那么大嗎?
周力:“小冰事實上是在北京和上海都有一個很大的數據中心,給大家一個概念,就是小冰運用到6000-7000個CPU的核,大家現在買的自己的電腦上,通常是一個四核或者八核,它需要我們普通的電腦的一千倍左右,才能去支持一個跟人的一個對話,一般都是一個大的廠房,然后里面一排一排的計算機,然后還有各種風扇就是為了給它降溫去吹,通常來說一個數據中心可能它的耗電量有的時候會達到一個近乎一個城市的耗電!
兩會民聲:房價物價,你慢點漲