2022年是AIGC,或生成式AI“Generative AI”爆發(fā)的一年。以O(shè)penAI、Stability AI、Midjourney、NovaAI等為代表的企業(yè)和工具,在全球范圍內(nèi)掀起了一場(chǎng)從消費(fèi)者到資本市場(chǎng)的狂熱浪潮。
雖然來到2022年年底、2023年年初,AIGC領(lǐng)域也并不太平,爆發(fā)了比如Art Station上“AI vs人類”的戰(zhàn)爭(zhēng)、三位海外藝術(shù)家起訴了Stability AI、Midjourney公司等事件,以及面臨著第一批AIGC公司,比如StockAI,因?yàn)閿?shù)據(jù)、算力的龐大支出等正式關(guān)停的現(xiàn)狀,但這些挫折和爭(zhēng)議并非不可解決。
Point-E
當(dāng)下AI已經(jīng)在繪畫、音樂甚至是游戲資產(chǎn)的生成方面,展現(xiàn)出了相當(dāng)?shù)臐摿?,OpenAI、谷歌、英偉達(dá)等公司也推出了文字生成3D模型實(shí)驗(yàn)技術(shù)Point-E等工具,未來隨著各國(guó)法律的完善、行業(yè)的競(jìng)爭(zhēng)、自律和規(guī)范,AI作為全新的生產(chǎn)力工具、AIGC作為全新的內(nèi)容創(chuàng)作階段,在2023年及以后在各行各業(yè)繼續(xù)發(fā)展的大趨勢(shì),依舊值得關(guān)注。
近日,騰訊研究院也就AIGC的相關(guān)技術(shù)和應(yīng)用前景,從生態(tài)、趨勢(shì)、挑戰(zhàn)等多個(gè)維度思考,發(fā)布了《AIGC發(fā)展趨勢(shì)報(bào)告2023:迎接人工智能的下一個(gè)時(shí)代》(以下簡(jiǎn)稱為《AIGC報(bào)告》)。
以下圖片均來自報(bào)告中截取的內(nèi)容
消費(fèi)端:AIGC成未來互聯(lián)網(wǎng)基礎(chǔ)設(shè)施
首先是消費(fèi)市場(chǎng),伴隨著現(xiàn)如今全球數(shù)字內(nèi)容消費(fèi)市場(chǎng)的持續(xù)擴(kuò)張、升級(jí)和轉(zhuǎn)型,數(shù)字內(nèi)容進(jìn)入強(qiáng)需求、視頻化、拼創(chuàng)意的螺旋式升級(jí)周期,《AIGC報(bào)告》認(rèn)為,“AIGC有望塑造數(shù)字內(nèi)容生產(chǎn)與交互新范式,成為未來互聯(lián)網(wǎng)的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施”。
得益于過去多年來,大型預(yù)訓(xùn)練語言模型和人類反饋強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)等技術(shù)出現(xiàn)和發(fā)展,當(dāng)下的AIGC技術(shù)已經(jīng)在文字、音樂、圖片、視頻、3D多種媒介形態(tài)的生產(chǎn)中,擔(dān)任了多樣化的助手工作,也已經(jīng)有不少消費(fèi)者體驗(yàn)到了AIGC的優(yōu)勢(shì),就比如米哈游在《未定事件簿》實(shí)裝的AI配音。
“根據(jù)6pen預(yù)測(cè),未來五年,互聯(lián)網(wǎng)上10%—30%的圖片內(nèi)容將由AI參與生成,有望創(chuàng)造超過600億的市場(chǎng)空間,若考慮到下一代互聯(lián)網(wǎng)對(duì)內(nèi)容需求的迅速提升,國(guó)外商業(yè)咨詢機(jī)構(gòu)Acumen Research and Consulting預(yù)測(cè),2030年AIGC市場(chǎng)規(guī)模將達(dá)到1100億美元?!?/p>
而ChatGPT這種級(jí)別的AI問答系統(tǒng)的出現(xiàn),也為數(shù)字人這種元宇宙相關(guān)的領(lǐng)域,提供了全新的可能?!禔IGC報(bào)告》中稱,AIGC工具將在制作效能、交互體驗(yàn)等多方面升級(jí)當(dāng)前的數(shù)字人。
“基于AIGC的3D數(shù)字人建模已經(jīng)初步實(shí)現(xiàn)產(chǎn)品化,目前精度可以達(dá)到次世代游戲人物級(jí)別,通過便捷化地上傳圖片即可生成3D數(shù)字人面部模型?!?/p>
除了數(shù)字人,《AIGC報(bào)告》還從技術(shù)、個(gè)性化、創(chuàng)作自由等方面,論證了未來“AIGC推動(dòng)元宇宙發(fā)展”的重要性。
“在元宇宙發(fā)展的過程中,游戲是虛擬世界重要的載體,AIGC可以極大提高數(shù)字原生內(nèi)容的幵發(fā)效率,降低游戲幵發(fā)成本。具體來說,劇情、角色、頭像、道具、場(chǎng)景、配音、動(dòng)作、特效、主程序未來都可以通過AIGC生成?!?/p>
“同時(shí),AIGC將賦予用戶更多的創(chuàng)作權(quán)力和自由,促進(jìn)創(chuàng)新并提升元宇宙的用戶體驗(yàn)。AIGC將作為生產(chǎn)力工具為元宇宙用戶提供個(gè)性化內(nèi)容體驗(yàn)?!?/p>
產(chǎn)業(yè)端:合成數(shù)據(jù)牽引人工智能的未來
而在產(chǎn)業(yè)端,合成數(shù)據(jù)(synthetic data)領(lǐng)域可以說是當(dāng)下AIGC技術(shù)持續(xù)創(chuàng)新發(fā)展的重點(diǎn),也是全新的發(fā)展契機(jī)所在。
所謂合成數(shù)據(jù),是值得“計(jì)算機(jī)模擬(computer simulation)技術(shù)或算法創(chuàng)建、生成的自標(biāo)注(annotated)信息,可以在數(shù)學(xué)上或統(tǒng)計(jì)學(xué)上反映真實(shí)世界數(shù)據(jù)的屬性,因此可以作為真實(shí)世界數(shù)據(jù)的替代品,來訓(xùn)練、測(cè)試、驗(yàn)證AI模型?!?/p>
《AIGC報(bào)告》中指出,數(shù)據(jù)是當(dāng)前制約AI技術(shù)發(fā)展的最大原因,根據(jù)合成數(shù)據(jù)服務(wù)商AI.Reverie的信息,人工標(biāo)注一張圖片可能需要6美元,但人工合成的話只需要6美分。
除了成本和獲取難度上相較于真實(shí)世界數(shù)據(jù)存在優(yōu)勢(shì),合成數(shù)據(jù)還在隱私、算法偏見、稀有數(shù)據(jù)場(chǎng)景的生成、AI模型訓(xùn)練速度方面,相較于真實(shí)世界數(shù)據(jù)存在優(yōu)勢(shì)。特別是在金融、醫(yī)療等數(shù)據(jù)較為敏感的行業(yè),合成數(shù)據(jù)由于是用程序生成,與真實(shí)世界無關(guān),能夠更好地在相關(guān)領(lǐng)域規(guī)避風(fēng)險(xiǎn),發(fā)力研究,持續(xù)拓展AIGC的應(yīng)用空間。
當(dāng)然對(duì)于市場(chǎng)而言,更大的機(jī)遇在于,當(dāng)前合成數(shù)據(jù)領(lǐng)域還處于互聯(lián)網(wǎng)大廠加大投資布局,創(chuàng)業(yè)公司方興未艾、不斷涌現(xiàn)的狀態(tài)。
“在過去的18個(gè)月,公眾視野中已知的合成數(shù)據(jù)公司融資總額達(dá)到3.28億美元,比2020年高出2.75億美元?!?/p>
“根據(jù)Cognilytica的數(shù)據(jù),合成數(shù)據(jù)市場(chǎng)規(guī)模在2021年大概是1.1億美元,到2027年將達(dá)到11.5億美元。Grand View Research預(yù)測(cè),AI訓(xùn)練數(shù)據(jù)市場(chǎng)規(guī)模到2030年將超過86億美元。Gartner預(yù)測(cè),到2024年用于訓(xùn)練AI的數(shù)據(jù)中有60%將是合成數(shù)據(jù),到2030年AI模型使用的絕大部分?jǐn)?shù)據(jù)將是人工智能合成的?!?/p>
《AIGC報(bào)告》表示“合成數(shù)據(jù)有望推動(dòng)人工智能邁向2.0階段(AI2.0)?!?/p>
社會(huì)價(jià)值和風(fēng)險(xiǎn)
正所謂技術(shù)的革新一定會(huì)對(duì)社會(huì)產(chǎn)生影響,《AIGC報(bào)告》認(rèn)為“AIGC的社會(huì)價(jià)值體現(xiàn)為革新數(shù)字內(nèi)容與藝術(shù)創(chuàng)造領(lǐng)域,并將輻射到其他領(lǐng)域和行業(yè),孕育新的技術(shù)形態(tài)與價(jià)值模式,甚至?xí)蔀橥ㄓ萌斯ぶ悄艿目赡苄月窂健薄?/p>
就比如在過去一年AIGC中最熱鬧的AI繪畫,以及其代表的AI藝術(shù)領(lǐng)域,AI可以解放人類的創(chuàng)造力,革新藝術(shù)領(lǐng)域。通過對(duì)現(xiàn)有藝術(shù)的模仿,在取代大量基礎(chǔ)性的藝術(shù)創(chuàng)作工作的同時(shí),AIGC還可以利用不同于人類思維的模式,為藝術(shù)家的創(chuàng)作提供新的靈感,甚至是新的藝術(shù)風(fēng)格。
“AI雖然不擁有真正的創(chuàng)造力,但是它讓使用者擁有了新的創(chuàng)造力?!?/p>
但隨著AIGC帶來的社會(huì)文化、生產(chǎn)變革而來的,還有已經(jīng)正在發(fā)生,甚至迫在眉睫的一系列問題?!禔IGC報(bào)告》中,主要囊括了“知識(shí)產(chǎn)權(quán)挑戰(zhàn)”“信息安全挑戰(zhàn)”“倫理挑戰(zhàn)”“環(huán)境挑戰(zhàn)”四大AIGC領(lǐng)域目前面臨的問題。
知識(shí)產(chǎn)權(quán)挑戰(zhàn)是在AI繪畫等領(lǐng)域,目前被各界討論最多的主題之一。對(duì)于AI生成內(nèi)容的版權(quán)風(fēng)險(xiǎn),《AIGC報(bào)告》表示“目前國(guó)內(nèi)國(guó)外的通行做法也都是會(huì)考慮除了AI之外,是否有人的智力或創(chuàng)造性勞動(dòng)”
其次安全挑戰(zhàn),主要指的是AI生成的內(nèi)容的安全,以及隱私數(shù)據(jù)的安全。前者最直接的例子就是AI換臉,借助深度偽造的音視頻內(nèi)容以及欺詐勒索等手段,全球各地的不法分子已經(jīng)造成了不小的經(jīng)濟(jì)損失。
而后者在此之前也有過經(jīng)典案例,在GPT-2模型里,只用一段特殊的前綴,AI生成的內(nèi)容就會(huì)包括特定個(gè)人的姓名、電話等信息。
第三點(diǎn)倫理挑戰(zhàn)則主要體現(xiàn)在AI存在明顯的歧視現(xiàn)象,以及AIGC是否具有自我意識(shí)(去年谷歌的工程師曾聲稱旗下的AI已經(jīng)有了自我意識(shí))。
“OpenAI在對(duì)DALL-E 2的生成結(jié)果進(jìn)行公平性測(cè)試時(shí)發(fā)現(xiàn),其表現(xiàn)出顯著的性別和種族歧視。即傾向于更高頻地生成男性和白色人種的人類圖像。”
至于最后的環(huán)境挑戰(zhàn)。作為一個(gè)需要強(qiáng)大算力支撐的新興技術(shù)領(lǐng)域,“有研究人員對(duì)Transformer、ELMo、BERT、GPT-2、GPT-3等進(jìn)行了碳排放研究。在一天的訓(xùn)練時(shí)長(zhǎng)里,GPT-3模型訓(xùn)練的二氧化碳排放量為552噸?!?/p>
Midjourney的創(chuàng)始人大衛(wèi)?霍爾茲也將算力支持而非用戶量,視作AIGC大規(guī)模的商業(yè)擴(kuò)展的阻力,“如果(Midjourney)用戶量達(dá)到1000萬人,那么世界上將沒有足夠的算力來支持?!?/p>