Google AI輸入文本后可生成圖像騎呢古怪文本都可變圖片

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2022-06-06
2119
Google推出全新文本生成圖像AI工具“Imagen”,并公開一系列由Imagen生成的圖片。

f7480d759a_50189845_imagen-google-ia-images-1280x800.jpg

Google推出全新文本生成圖像AI工具“Imagen”,并公開一系列由Imagen生成的圖片。

Google旗下深度學(xué)習(xí)與人工智能科研項(xiàng)目團(tuán)隊(duì)Google Brain,近日發(fā)布了一系列由新的文本生成圖像AI工具“Imagen”制出的成果。Imagen通過解析用戶所輸入的文本而生成寫實(shí)的圖像,更能突破人類的想象力。

在雪地里戴著空手道腰帶的火龍果。 (A dragon fruit wearing karate belt in the snow.)

機(jī)器人在水浸的莫奈美術(shù)展覽中使用槳板。

(An art gallery displaying Monet paintings. The art gallery is flooded. Robots are going around the art gallery using paddle boards.)

泰迪熊在奧運(yùn)400米蝶泳項(xiàng)目中游泳。 (Teddy bears swimming at the Olympics 400m Butterfly event.)

圖片來源:Google

Google通過DrawBench圖像模型基準(zhǔn)測試來評估Imagen的文本生成圖像能力,較VQ-GAN、LDM及DALL-E 2等同類型工具比,Imagen生成的圖像逼真度更高,語言理解能力也更好,與輸入的文本較為符合,偏好率更高達(dá)50%。與DALL-E 2相比,Imagen能準(zhǔn)確地為圖像配色,而DALL-E 2則容易混淆多個(gè)顏色指令的文本。

圖片來源:Google

Google表示,由于Imagen在生成圖像過程的評估工作尚有不足,導(dǎo)致在生成圖像時(shí)出現(xiàn)一些社會和文化偏見,也傾向西方對性別的刻板印象,例如膚色及對職業(yè)的描繪,更出現(xiàn)色情圖像、種族主義攻擊言論等的不當(dāng)內(nèi)容。因此在有關(guān)問題修復(fù)前,將不會對外開放Imagen的程序代碼,更不會對外展示。

數(shù)據(jù)源:Deccan Herald

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
個(gè)人VIP