通過(guò)學(xué)習(xí)以與人類相同的方式偏離已知信息,人工智能(AI)的“成像”算法能夠從書面說(shuō)明中識(shí)別以前看不見(jiàn)的物體。
該算法由KAUST研究人員Mohamed Elhoseiny與中央佛羅里達(dá)大學(xué)的Mohamed Elfeki合作開發(fā),為人工想象和對(duì)新動(dòng)植物物種進(jìn)行自動(dòng)分類鋪平了道路。
Elhoseiny解釋說(shuō):“想象力是人類智力的關(guān)鍵特性之一,它使我們不僅能夠產(chǎn)生藝術(shù)和音樂(lè)等創(chuàng)意產(chǎn)品,而且能夠理解視覺(jué)世界。”
人工智能依靠訓(xùn)練數(shù)據(jù)來(lái)發(fā)展其識(shí)別物體并響應(yīng)其環(huán)境的能力。人類也可以通過(guò)積累的經(jīng)驗(yàn)來(lái)發(fā)展這種能力,但是人類可以做AI無(wú)法做到的事情。他們可以通過(guò)想象從書面描述中得出的東西看起來(lái)是什么樣子,或者通過(guò)類似的推論來(lái)直觀地推斷出以前遇到的對(duì)象的可能分類。在AI中,隨著技術(shù)被推廣到復(fù)雜的實(shí)際應(yīng)用中(其中新對(duì)象的錯(cuò)誤分類或錯(cuò)誤識(shí)別可能會(huì)造成災(zāi)難性的后果),這種想象未知的能力變得越來(lái)越重要。
同樣重要的是可靠地為現(xiàn)實(shí)世界訓(xùn)練AI所需的大量數(shù)據(jù)。用AI甚至對(duì)全世界所有已知?jiǎng)又参镂锓N的很小一部分的圖像進(jìn)行訓(xùn)練來(lái)進(jìn)行AI訓(xùn)練是不可行的,更不用說(shuō)無(wú)數(shù)未發(fā)現(xiàn)或未分類的物種了。
Elhoseiny和Elfeki的研究旨在開發(fā)所謂的零擊學(xué)習(xí)(ZSL)算法,以基于沒(méi)有培訓(xùn)示例的班級(jí)描述來(lái)幫助識(shí)別以前看不見(jiàn)的類別。
Elhoseiny表示:“我們通過(guò)將ZSL與人類創(chuàng)造力聯(lián)系起來(lái),為'看不見(jiàn)的'類別建立了視覺(jué)學(xué)習(xí)過(guò)程的模型,觀察到ZSL是要識(shí)別看不見(jiàn)的事物,而創(chuàng)造力是要?jiǎng)?chuàng)造'可愛(ài)的看不見(jiàn)的事物,” Elhoseiny說(shuō)。
在創(chuàng)造力方面,新穎但令人愉悅或“討人喜歡”的事物必須與現(xiàn)有技術(shù)有所不同,但又應(yīng)如此以至于無(wú)法辨認(rèn)。以同樣的方式,Elhoseiny和Elfeki仔細(xì)地建模了一個(gè)學(xué)習(xí)信號(hào),該信號(hào)以歸納方式鼓勵(lì)了與已見(jiàn)班級(jí)的背離,但并沒(méi)有推得太遠(yuǎn),以至于想象中的班級(jí)變得不切實(shí)際,并失去了已見(jiàn)班級(jí)的知識(shí)轉(zhuǎn)移。所得算法顯示出對(duì)ZSL最新基準(zhǔn)的持續(xù)改進(jìn)。
Elhoseiny說(shuō):“我們方法的可能應(yīng)用之一是識(shí)別未知物種。”“采用這種技術(shù)的AI可以幫助報(bào)告物種的目擊情況,而無(wú)需圖片,只需帶有語(yǔ)言描述即可。”