光學(xué)AI圖像生成器能耗降至毫焦級(jí)

2025-08-29 08:43:36 來源：科技日?qǐng)?bào)

(相關(guān)資料圖)

美國加州大學(xué)洛杉磯分校研究團(tuán)隊(duì)在新一期《自然》雜志刊發(fā)論文稱，他們研制出一種新型圖像生成器，其利用光束而非傳統(tǒng)計(jì)算硬件來生成圖像。與標(biāo)準(zhǔn)人工智能（AI）工具相比，該設(shè)備生成一幅圖像的能耗可降低至十萬分之一，僅幾毫焦耳。

目前大多數(shù)AI模型基于文本生成圖像時(shí)，通常采用所謂“擴(kuò)散”方法：AI先學(xué)習(xí)大量圖像，掌握如何用統(tǒng)計(jì)噪聲逐步破壞它們，再將這類變化模式編碼為一套規(guī)則。當(dāng)接收到新的含噪聲圖像時(shí)，AI可依據(jù)這些規(guī)則反向操作，經(jīng)過多步處理，最終生成與文本指令相匹配的連貫圖像。

然而，生成高分辨率逼真圖像需要執(zhí)行大量擴(kuò)散步驟，對(duì)算力要求極高，能耗巨大。以美國開放人工智能研究中心（OpenAI）為例，其新型圖像生成器在運(yùn)行第一周內(nèi)生成了超過7億張圖像。為滿足這一需求，需要消耗大量能源和水，用于供電和冷卻運(yùn)行模型的機(jī)器。新型光學(xué)AI圖像生成器或能緩解能耗巨大這一難題。

研究團(tuán)隊(duì)表示，傳統(tǒng)數(shù)字?jǐn)U散模型需經(jīng)歷數(shù)百至數(shù)千次迭代，才能生成圖像，而新系統(tǒng)除初始編碼外，無需任何額外計(jì)算。該系統(tǒng)首先使用基于公開圖像數(shù)據(jù)集訓(xùn)練的數(shù)字編碼器，生成可轉(zhuǎn)化為圖像的靜態(tài)編碼。隨后，借助名為“空間光調(diào)制器（SLM）”的液晶屏幕，將該編碼以物理方式印刻在激光束中。當(dāng)激光穿過第二個(gè)用作解碼的SLM時(shí)，便會(huì)在相機(jī)記錄的屏幕上瞬間呈現(xiàn)目標(biāo)圖像。

在測(cè)試中，團(tuán)隊(duì)利用新系統(tǒng)生成了黑白數(shù)字（1至9）、基礎(chǔ)服裝等簡(jiǎn)單圖像，以及梵高風(fēng)格的全彩畫作。結(jié)果顯示，生成效果與傳統(tǒng)圖像生成器大致相當(dāng)。在繪制梵高風(fēng)格圖像時(shí)，新系統(tǒng)每幅僅消耗約幾毫焦耳能量，而傳統(tǒng)擴(kuò)散模型則需耗費(fèi)數(shù)百甚至數(shù)千焦耳。

團(tuán)隊(duì)稱，盡管這一系統(tǒng)仍需進(jìn)一步優(yōu)化才能替代當(dāng)前廣泛使用的圖像生成工具，但其低功耗特性尤其適合可穿戴設(shè)備（如AI眼鏡）等應(yīng)用場(chǎng)景。

關(guān)鍵詞：圖像生成人工智能 AI 系統(tǒng) 生成器能

光學(xué)AI圖像生成器能耗降至毫焦級(jí)

熱門推薦

熱門文章

全站熱門