新華社洛杉磯12月18日電(記者郭爽)美國科學家日前報告說,他們從人類大腦的學習方式中獲得靈感,研發(fā)出一種新的“深度學習”算法,可以讓機器像人類嬰兒一樣自主學習視覺世界。
在深度學習領域,科學家喜歡用“這是1,這是2”的方法來訓練機器。這種被稱為“監(jiān)督學習”的技術,在訓練時需要為機器提供成千上萬標記好的樣本,此前被認為是最有效的方法。
不過,人類并不是這樣學習。在大多數(shù)情況下,人類大腦的學習方式都是“無監(jiān)督學習”。在日前于西班牙巴塞羅那舉行的神經(jīng)信息處理系統(tǒng)(NIPS)大會上,研究人員發(fā)表報告說,美國賴斯大學和貝勒醫(yī)學院的神經(jīng)科學和人工智能專家研發(fā)出一種“半監(jiān)督學習”算法,這種機器學習方式與人類更為接近。
研究負責人安基特·帕特爾解釋說,嬰兒出生第一年,父母會告訴孩子這是水瓶、椅子、媽媽……,但事實上,嬰兒并不能理解這些詞語的意思。多數(shù)情況下,他們是通過與世界互動進行“無監(jiān)督學習”的。
據(jù)介紹,研究人員首先僅向新研發(fā)出的“深度渲染混合模型”提供從0到9這10個數(shù)字的10個手寫標準樣本,然后再讓模型去“自學”數(shù)千個樣本數(shù)據(jù),通過這種“半監(jiān)督學習”算法讓模型學習識別手寫體數(shù)字。最終測試結果顯示,在辨別手寫數(shù)字方面,這種模型比此前幾乎所有算法,即一開始就通過數(shù)千個正確樣本訓練機器“學習”每個數(shù)字的方法更為準確。
研究人員表示,這種“半監(jiān)督學習”算法屬于一種“卷積神經(jīng)網(wǎng)絡”。在這種從生物神經(jīng)元中得到啟發(fā)而設計出的多層人工神經(jīng)元網(wǎng)絡中,人工神經(jīng)元(或稱數(shù)據(jù)處理單元)分層排列。第一層掃描圖像,并執(zhí)行相對簡單的任務,如搜索邊緣和顏色的變化等。第二層負責檢查從第一層輸出的內容,并搜索更復雜的模式。從數(shù)學角度上說,這種在模式內尋找模式的嵌套方法被稱為一種非線性過程。
研究人員指出,從本質上說,卷積神經(jīng)網(wǎng)絡是一個“非常簡單的視覺皮層”。舉例來說,如果給這個網(wǎng)絡輸入一個圖像,那么它的每一層就會處理這個圖像的一部分特征,而隨著層級深入,對于圖像的理解也就不斷加深。到最后一層,這個網(wǎng)絡就會獲得關于這個圖像相當深入且抽象的理解。事實上,現(xiàn)今幾乎所有自動駕駛系統(tǒng)都配備了這種網(wǎng)絡,因為卷積神經(jīng)網(wǎng)絡是迄今最好的視覺處理方法。
研究人員認為,他們研發(fā)出的這種人工神經(jīng)網(wǎng)絡還可以幫助神經(jīng)科學家更好地了解人類大腦處理信息的方式,因為人類大腦的“算法”遠遠優(yōu)于任何人類設計的神經(jīng)網(wǎng)絡。