Google:公司的新文字轉(zhuǎn)圖像AI模型優(yōu)于其他競爭對手

來源:cnBeta.COM
作者:teikaei
時間:2022-05-25
2173
Google稱,公司的一個新文本到圖像的人工智能擊敗了競爭對手。據(jù)悉,該程序被稱為Imagen,它接收文本--如“一張戴著牛仔帽和紅色襯衫的波斯貓在海灘上彈吉他的照片”--并輸出結(jié)果。Imagen可以生成逼真的圖像或藝術(shù)化的渲染。

Google稱,公司的一個新文本到圖像的人工智能擊敗了競爭對手。據(jù)悉,該程序被稱為Imagen,它接收文本--如“一張戴著牛仔帽和紅色襯衫的波斯貓在海灘上彈吉他的照片”--并輸出結(jié)果。Imagen可以生成逼真的圖像或藝術(shù)化的渲染。

6a15f1c41e36674.webp.jpg

Imagen是繼DALL-E、VQ-GAN+CLIP和Latent Diffusion Models等其他文本-圖像生成器之后的又一成果。Google表示,當被要求比較由Imagen和其他文本-圖像生成器所生成的圖像時,人們發(fā)現(xiàn)其模型在準確性和圖像保真度方面都要優(yōu)于競爭對手。

Google在其Imagen網(wǎng)站上分享了幾個文本提示和AI創(chuàng)建的圖像的例子,但這些可能只代表其產(chǎn)生的最佳結(jié)果。Google拒絕對這一事件發(fā)表評論。

591e779527e4aad.png

文本-圖像學習模型顯示了機器學習系統(tǒng)的力量。在這種情況下,Imagen消除了知道如何使用Photoshop等專業(yè)軟件來創(chuàng)建抽象圖像的必要性。正如本月初在GoogleI/O大會上指出的那樣,AI系統(tǒng)正在幫助該公司接近其環(huán)境計算的未來愿景。環(huán)境計算是指有一天人們能直觀地使用計算機而無需特定的系統(tǒng)或代碼知識。

然而Google并沒有忽視文本到圖像的人工智能的力量,該公司選擇不向公眾發(fā)布Imagen。Imagen從互聯(lián)網(wǎng)上搜刮信息從而學習和創(chuàng)造圖像。由于互聯(lián)網(wǎng)可能充滿了陳規(guī)定型觀念和偏見,這些最終會出現(xiàn)在Imagen中。Google表示,這些偏見包括對淺色膚色的偏愛和某些西方性別定型觀念。該公司還擔心,Imagen可能被不良行為者消極利用。

Google發(fā)表的一份白皮書稱:“生成方法可以被用于惡意目的--包括騷擾和錯誤信息的傳播,并引起許多關(guān)于社會和文化排斥和偏見的擔憂。”

Google告誡其他AI制造商,在沒有密切關(guān)注AI被訓練的信息的情況下,對向公眾發(fā)布文本-圖像模型要保持警惕。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:cnBeta.COM
版權(quán)說明:本文內(nèi)容來自于cnBeta.COM,本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務商推薦
更多