(相關(guān)資料圖)
美國加州大學(xué)洛杉磯分校研究團(tuán)隊(duì)在新一期《自然》雜志刊發(fā)論文稱,他們研制出一種新型圖像生成器,其利用光束而非傳統(tǒng)計(jì)算硬件來生成圖像。與標(biāo)準(zhǔn)人工智能(AI)工具相比,該設(shè)備生成一幅圖像的能耗可降低至十萬分之一,僅幾毫焦耳。
目前大多數(shù)AI模型基于文本生成圖像時(shí),通常采用所謂“擴(kuò)散”方法:AI先學(xué)習(xí)大量圖像,掌握如何用統(tǒng)計(jì)噪聲逐步破壞它們,再將這類變化模式編碼為一套規(guī)則。當(dāng)接收到新的含噪聲圖像時(shí),AI可依據(jù)這些規(guī)則反向操作,經(jīng)過多步處理,最終生成與文本指令相匹配的連貫圖像。
然而,生成高分辨率逼真圖像需要執(zhí)行大量擴(kuò)散步驟,對(duì)算力要求極高,能耗巨大。以美國開放人工智能研究中心(OpenAI)為例,其新型圖像生成器在運(yùn)行第一周內(nèi)生成了超過7億張圖像。為滿足這一需求,需要消耗大量能源和水,用于供電和冷卻運(yùn)行模型的機(jī)器。新型光學(xué)AI圖像生成器或能緩解能耗巨大這一難題。
研究團(tuán)隊(duì)表示,傳統(tǒng)數(shù)字?jǐn)U散模型需經(jīng)歷數(shù)百至數(shù)千次迭代,才能生成圖像,而新系統(tǒng)除初始編碼外,無需任何額外計(jì)算。該系統(tǒng)首先使用基于公開圖像數(shù)據(jù)集訓(xùn)練的數(shù)字編碼器,生成可轉(zhuǎn)化為圖像的靜態(tài)編碼。隨后,借助名為“空間光調(diào)制器(SLM)”的液晶屏幕,將該編碼以物理方式印刻在激光束中。當(dāng)激光穿過第二個(gè)用作解碼的SLM時(shí),便會(huì)在相機(jī)記錄的屏幕上瞬間呈現(xiàn)目標(biāo)圖像。
在測(cè)試中,團(tuán)隊(duì)利用新系統(tǒng)生成了黑白數(shù)字(1至9)、基礎(chǔ)服裝等簡(jiǎn)單圖像,以及梵高風(fēng)格的全彩畫作。結(jié)果顯示,生成效果與傳統(tǒng)圖像生成器大致相當(dāng)。在繪制梵高風(fēng)格圖像時(shí),新系統(tǒng)每幅僅消耗約幾毫焦耳能量,而傳統(tǒng)擴(kuò)散模型則需耗費(fèi)數(shù)百甚至數(shù)千焦耳。
團(tuán)隊(duì)稱,盡管這一系統(tǒng)仍需進(jìn)一步優(yōu)化才能替代當(dāng)前廣泛使用的圖像生成工具,但其低功耗特性尤其適合可穿戴設(shè)備(如AI眼鏡)等應(yīng)用場(chǎng)景。