AI根據(jù)歌詞含義生成的圖片
自此之后,“AI作畫(huà)”像病毒一般在B站蔓延。很快,《七里香》《孤勇者》《加州旅館》《波西米亞狂想曲》等傳唱度頗高的歌曲,無(wú)一例外都成了AI作畫(huà)的絕佳素材。
更為出名的要數(shù)今年8月,一幅名為《空間歌劇院》的美術(shù)作品在美國(guó)科羅拉多州博覽會(huì)上獲得一等獎(jiǎng)。隨后其作者Jason Allen透露,這幅作品是出自AI之手。
有趣的是,大賽評(píng)委并未對(duì)該幅作品進(jìn)行改判,并直言:即使它是AI生成的作品,也依舊配得上這樣的成績(jī)。但顯然其他藝術(shù)家對(duì)此憤憤不平,認(rèn)為這屬于高科技對(duì)創(chuàng)意的“剽竊”。
曾幾何時(shí),人們對(duì)AI在藝術(shù)場(chǎng)景上的落地前景嗤之以鼻,認(rèn)為AI只能完成一些依靠算法實(shí)現(xiàn)的計(jì)算工作,而藝術(shù)創(chuàng)作是上帝賜予人類(lèi)的獨(dú)有天賦。而如今顯而易見(jiàn),人類(lèi)這一點(diǎn)最后的驕傲,也正在被AI“吞噬”。
近兩年,DALL·E 2、GauGAN2、Stable Diffusion、Midjourney等各種AI作畫(huà)平臺(tái)快速崛起。去年1月,OpenAI推出了DALL·E,僅僅1年后,其升級(jí)版DALL·E 2的升級(jí)版便以4倍的分辨率開(kāi)始生成更逼真、更準(zhǔn)確的圖像,不到3個(gè)月注冊(cè)人數(shù)就突破100萬(wàn)。
火的不只是AI作畫(huà),還有AI生成視頻。距離Stable Diffusion的正式開(kāi)源還沒(méi)過(guò)去多久,Meta就帶來(lái)了新產(chǎn)品Make-A-Video,它能夠直接通過(guò)文字生成視頻。隨后,僅不到半個(gè)月,谷歌又帶著從文本到高清視頻的AI模型Imagen Video和 Phenaki進(jìn)場(chǎng)(前者傾向于打造視頻質(zhì)量,后者傾向于視頻的邏輯與時(shí)長(zhǎng))。
顯而易見(jiàn)的是,隨著人工智能生成能力的突破進(jìn)展,內(nèi)容生產(chǎn)已經(jīng)從用戶(hù)生成內(nèi)容(UGC)、專(zhuān)業(yè)生成內(nèi)容(PGC),進(jìn)入到人工智能生成內(nèi)容(AIGC,AI generated content)時(shí)代。從AI作畫(huà)到AI視頻的層出不窮,預(yù)示著AIGC時(shí)代已然拉開(kāi)帷幕。
對(duì)于AIGC,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在今年百度世界大會(huì)上解釋?zhuān)篈IGC就是“人工智能自主生成內(nèi)容”。
在李彥宏的判斷中,AIGC將迎來(lái)三個(gè)發(fā)展階段:
第一階段是“助手階段”,AIGC輔助人類(lèi)進(jìn)行內(nèi)容生產(chǎn);
第二階段是“協(xié)作階段”,AIGC以虛實(shí)并存的虛擬人形態(tài)出現(xiàn),形成人機(jī)共生的局面;
第三階段是“原創(chuàng)階段”,AIGC將獨(dú)立完成內(nèi)容創(chuàng)作。
事實(shí)上,AIGC并非新鮮事物,此前已經(jīng)被探討過(guò)很久,例如微軟小冰等人工智能作詩(shī)、寫(xiě)作、創(chuàng)作歌曲的產(chǎn)品,但始終沒(méi)有出現(xiàn)大規(guī)模普及的標(biāo)準(zhǔn)化to C產(chǎn)品。
但為什么幾年后的今天,AIGC又開(kāi)始集中爆發(fā),引來(lái)科技巨頭爭(zhēng)相布局?
據(jù)量子位AIGC圖譜顯示,現(xiàn)在AIGC主要用在文字、圖像、視頻、音頻、游戲以及虛擬人上,里面涉及的初創(chuàng)企業(yè)大多集中在A到B輪,包括DeepMusic、倒映有聲、聆心智能、彩云小夢(mèng)、rct AI、影譜科技、超參數(shù)等。
而國(guó)內(nèi)大廠百度、騰訊優(yōu)圖、阿里巴巴、快手、字節(jié)跳動(dòng)、網(wǎng)易、商湯、美圖等也都在AIGC領(lǐng)域有所投入。
例如,百度推出的AI藝術(shù)和創(chuàng)意輔助作畫(huà)平臺(tái)文心一格;騰訊打造的寫(xiě)稿機(jī)器人“夢(mèng)幻寫(xiě)手”;阿里巴巴旗下的AI在線設(shè)計(jì)平臺(tái)Lubanner,幫助營(yíng)銷(xiāo)人員生產(chǎn)Banner;字節(jié)跳動(dòng)旗下的剪映以及快手云剪都能提供AI生成視頻;網(wǎng)易推出的一站式AI音樂(lè)創(chuàng)作平臺(tái)“網(wǎng)易天音”等等。
國(guó)外在AIGC領(lǐng)域更是神仙打架。既有科技巨頭谷歌、Meta、微軟等,也不乏AIGC的新晉獨(dú)角獸Stability AI、Jasper、OpenAI等。并且科技公司很快又將AI作畫(huà)的熱度延續(xù)到了AI生成視頻。從Meta宣布由文本到視頻的系統(tǒng)Make-A-Video,到谷歌宣布的可以從簡(jiǎn)單的文本提示中生成高清視頻的Imagen Video和Phenaki,AIGC在海外迅速發(fā)展。
國(guó)內(nèi)外各大公司紛紛入局AIGC領(lǐng)域的一個(gè)重要原因,就是文本-圖像生成模型Stable Diffusion的正式開(kāi)源。
此次開(kāi)源,Stable Diffusion開(kāi)放的不僅僅是程序,還有其已經(jīng)訓(xùn)練好的模型,這意味著后繼創(chuàng)業(yè)者能更好的借助這一開(kāi)源工具,挖掘出更豐富的內(nèi)容生態(tài)。Stable Diffusion的開(kāi)源,為更廣泛的C端用戶(hù)普及起到至關(guān)重要的作用。
其次,AIGC的爆火,也得益于生成擴(kuò)散模型和多模態(tài)預(yù)訓(xùn)練模型等技術(shù)的快速發(fā)展,在圖文生成效果上有了顯著進(jìn)步,讓AI可以快速、靈活地生成不同模態(tài)的數(shù)據(jù)內(nèi)容。
在2021年之前,AIGC還主要是文字生成。而新一代的模型可以處理任何內(nèi)容格式,包含文字、語(yǔ)音、代碼、圖像、視頻、3D模型、機(jī)器人的動(dòng)作等等。比如近期以DALL-E2和stable-diffusion為代表的AIGC技術(shù)在圖文生成效果上,能夠廣泛應(yīng)用于內(nèi)容生成、編輯和創(chuàng)作等領(lǐng)域。
快手Y-tech AI技術(shù)中心負(fù)責(zé)人萬(wàn)鵬飛告訴「甲子光年」,生成式技術(shù)的一大優(yōu)勢(shì)在于,它不但能夠在工具層面提升內(nèi)容獲取與編輯的效率,還能在創(chuàng)意和策略層面為人們提供參考。(注:生成式技術(shù):即利用現(xiàn)有文本、音頻文件或圖像創(chuàng)建新內(nèi)容的技術(shù)。通過(guò)生成AI,計(jì)算機(jī)檢測(cè)與輸入相關(guān)的基本模式并生成類(lèi)似內(nèi)容)
與此同時(shí),如今各類(lèi)社交和流媒體平臺(tái)的普及,也驅(qū)動(dòng)著內(nèi)容生產(chǎn)方式的演變。AIGC作為繼PGC、UGC之后的新一代內(nèi)容生產(chǎn)方式,其中的底層原因肯定是需求驅(qū)動(dòng),隨著人們對(duì)內(nèi)容的需求越來(lái)越旺盛,內(nèi)容產(chǎn)業(yè)也必須去升級(jí)迭代。這讓AI從以往輔助內(nèi)容創(chuàng)作的工具逐漸演變成可以直接創(chuàng)作,并且在寫(xiě)作、繪畫(huà)、作曲、設(shè)計(jì)等諸多創(chuàng)意類(lèi)上已經(jīng)能夠勝任。
最后是外部環(huán)境因素,在經(jīng)濟(jì)低迷時(shí)期,科技行業(yè)會(huì)選擇相應(yīng)收斂開(kāi)支,并將重點(diǎn)放在像是人工智能商業(yè)化這類(lèi)更務(wù)實(shí)的地方。
疫情之下,企業(yè)更加強(qiáng)調(diào)降本增效,人工智能生成技術(shù)因此成為創(chuàng)造者和團(tuán)隊(duì)在增強(qiáng)自身創(chuàng)作能力時(shí)的首選工具。所以當(dāng)市場(chǎng)低迷需要內(nèi)銷(xiāo)時(shí),這項(xiàng)業(yè)務(wù)將加速爆發(fā)。正猶如每一次金融危機(jī)時(shí),都會(huì)有一些做娛樂(lè)性的互聯(lián)網(wǎng)公司出現(xiàn)。
國(guó)際咨詢(xún)公司Analysis Group發(fā)布報(bào)告稱(chēng),到2031年,元宇宙對(duì)全球GDP的貢獻(xiàn)可達(dá)到3萬(wàn)億美元。圍繞虛擬世界、元宇宙基礎(chǔ)設(shè)施建設(shè)而來(lái)的數(shù)字人生態(tài)和圍繞互聯(lián)網(wǎng)新媒介構(gòu)建的音樂(lè)生態(tài)已初具雛形,AI技術(shù)規(guī)?;瘧?yīng)用落地,也只是時(shí)間問(wèn)題。
一個(gè)產(chǎn)業(yè)爆火后,最先嗅到“芬芳”的總會(huì)是資本。
10月19日,主打文字生成的AIGC公司Jasper.ai宣布完成了1.25億美元的A輪融資,估值達(dá)到了15億美元,而Jasper AI從產(chǎn)品上線到現(xiàn)在也就18個(gè)月時(shí)間。
而就在Jasper.ai宣布融資的前一天,AIGC領(lǐng)域的另一龍頭公司Stability AI則宣布獲得1.01億美元,來(lái)自Coatue和光速的投資,公司宣布會(huì)繼續(xù)研發(fā)用于生成圖片、語(yǔ)言、音頻、視頻和3D的AI生成模型。投后估值達(dá)到10億美元,成為新晉獨(dú)角獸企業(yè)。
不過(guò),相較于海外市場(chǎng)已經(jīng)出現(xiàn)數(shù)家獨(dú)角獸的情況,中國(guó)創(chuàng)投圈還沒(méi)有真正在出手上“熱”起來(lái)。截至目前,國(guó)內(nèi)可以公開(kāi)查詢(xún)到進(jìn)入融資階段的AI作畫(huà)初創(chuàng)公司,只有在10月份獲DCM中國(guó)數(shù)百萬(wàn)美元的天使輪投資的TIAMAT。其他該領(lǐng)域的公司或平臺(tái)如6pen、draft.art、大畫(huà)家Domo、盜夢(mèng)師等,均未進(jìn)入融資階段。
資深投資人高寧,最近一直在關(guān)注AIGC領(lǐng)域,他在與「甲子光年」進(jìn)行交流時(shí)表示,AIGC確實(shí)是資本市場(chǎng)近期所重點(diǎn)關(guān)注的領(lǐng)域。
他認(rèn)為如果在AIGC領(lǐng)域創(chuàng)業(yè),最好是做全球市場(chǎng),因?yàn)樵谶@里面少不了中文或者是中國(guó)元素的文化載體,會(huì)誕生很多機(jī)會(huì)。
中國(guó)內(nèi)容產(chǎn)業(yè)規(guī)模龐大,領(lǐng)域眾多,有超過(guò)5億用戶(hù)的中國(guó)網(wǎng)絡(luò)文學(xué)市場(chǎng)、千億的國(guó)漫產(chǎn)業(yè)、市場(chǎng)規(guī)模破萬(wàn)億的中國(guó)廣告行業(yè)以及3萬(wàn)億的中國(guó)傳媒產(chǎn)業(yè)等。
在當(dāng)前新冠疫情反復(fù)的背景下,對(duì)數(shù)字內(nèi)容的需求也更加強(qiáng)烈,紅杉資本預(yù)計(jì)生成式人工智能將“產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值”。
實(shí)際上,近年來(lái)隨著全球信息化水平的加速提升,人工智能與傳媒業(yè)的融合發(fā)展不斷升級(jí)。AIGC作為當(dāng)前新型的內(nèi)容生產(chǎn)方式,已經(jīng)率先在傳媒、電商、影視、娛樂(lè)等數(shù)字化程度高、內(nèi)容需求豐富的行業(yè)取得重大創(chuàng)新發(fā)展。
除此之外,在推進(jìn)數(shù)實(shí)融合,加快產(chǎn)業(yè)升級(jí)教育下,金融、醫(yī)療、工業(yè)等各行各業(yè)的AIGC應(yīng)用也都在快速發(fā)展。
人工智能生成內(nèi)容(AIGC)應(yīng)用視圖
圖源:中國(guó)信息通信研究院
總體來(lái)說(shuō),在當(dāng)前數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)的合并、虛擬自我和真實(shí)自我合體的趨勢(shì)下,AIGC發(fā)展的前置條件已經(jīng)具備,這極大帶動(dòng)了相關(guān)產(chǎn)業(yè)的發(fā)展。
從今年9月以來(lái),Meta和Google先后公布了自己在AIGC最前沿領(lǐng)域的最新成果。尤其是Google團(tuán)隊(duì)推出的AI視頻生成模型Phenaki,能夠根據(jù)文本內(nèi)容生成可變時(shí)長(zhǎng)視頻的技術(shù),在公布的DEMO中,Phenaki基于幾百個(gè)單詞組成一段前后邏輯連貫的視頻只需兩分鐘??梢?jiàn),Phenaki瞄準(zhǔn)的是長(zhǎng)視頻制作。Phenaki的出現(xiàn),勢(shì)必會(huì)對(duì)未來(lái)整個(gè)視頻行業(yè)造成沖擊。
同時(shí),運(yùn)用AIGC技術(shù)能夠有效激發(fā)影視劇本的創(chuàng)作靈感,AI虛擬數(shù)字人也能夠出現(xiàn)在影視劇本中扮演不同角色,在短劇中極大地提升影視產(chǎn)品的后期制作質(zhì)量,幫助影視作品實(shí)現(xiàn)文化價(jià)值與經(jīng)濟(jì)價(jià)值的最大化。
當(dāng)前AIGC在電商行業(yè)的應(yīng)用已經(jīng)比較廣泛,通過(guò)打造虛擬主播,電商能為觀眾提供24小時(shí)不間斷的貨品推薦介紹以及在線服務(wù),商戶(hù)直播門(mén)檻因此降低。
除將數(shù)字人用于電商輔助帶貨之外,數(shù)字人還被用在諸如影視創(chuàng)作、動(dòng)畫(huà)、VR、AR、MR、電視主持、虛擬偶像等場(chǎng)景。
「甲子光年」了解到,在AIGC領(lǐng)域,有不少企業(yè)選擇將落地場(chǎng)景放在數(shù)字人上,這里面既有像是亞馬遜、谷歌、蘋(píng)果、微軟小冰、百度、騰訊等中外互聯(lián)網(wǎng)大廠,也有不少創(chuàng)業(yè)公司。
數(shù)字人作為近兩年才開(kāi)始出現(xiàn)的賽道,競(jìng)爭(zhēng)遠(yuǎn)還沒(méi)有像是TTS(語(yǔ)音合成技術(shù))那么“卷”。當(dāng)前國(guó)內(nèi)做數(shù)字人的企業(yè),大多還在初創(chuàng)階段,這在一定程度上也意味著,創(chuàng)業(yè)公司的機(jī)會(huì)或許潛藏在更加垂直的應(yīng)用賽道之中,找準(zhǔn)方向十分關(guān)鍵。
倒映有聲是一家提供虛擬數(shù)字人技術(shù)解決方案的公司。其通過(guò)神經(jīng)渲染技術(shù),打造了眼科醫(yī)生陶勇的AI數(shù)字分身,實(shí)現(xiàn)AIGC在健康科普?qǐng)鼍暗穆涞亍?/span>
憑借輸入文字即可生成科普音頻/視頻的內(nèi)容生產(chǎn)方式,神經(jīng)渲染技術(shù)充分解放了醫(yī)學(xué)專(zhuān)家的真人勞動(dòng)力。相對(duì)于傳統(tǒng)的3D建模方式,神經(jīng)渲染技術(shù)可以更快速地創(chuàng)建AI數(shù)字分身,降低時(shí)間成本與財(cái)務(wù)成本,這讓AI數(shù)字人擁有了更廣泛的落地場(chǎng)景,也更容易向C端用戶(hù)去下沉。
據(jù)萬(wàn)鵬飛介紹,未來(lái)1-2年,數(shù)字人+AIGC是比較有前景的商業(yè)化方向。數(shù)字人是一種新的人機(jī)交互和人人交互模式,AIGC是一種新的內(nèi)容生產(chǎn)模式,兩個(gè)概念可以互相組合并解鎖眾多有價(jià)值的應(yīng)用場(chǎng)景,可廣泛應(yīng)用于娛樂(lè)直播、電商直播、視頻制作、數(shù)字員工、虛擬偶像等領(lǐng)域。
在AIGC加成下,各行各業(yè)的創(chuàng)作者經(jīng)濟(jì)迎來(lái)了新的增長(zhǎng)點(diǎn)。比如有聲書(shū)的配音行業(yè),影視配音行業(yè)、動(dòng)漫制作畫(huà)師,或者是一個(gè)營(yíng)銷(xiāo)廣告公司的設(shè)計(jì)師,都可能是未來(lái)AIGC的主要使用者,來(lái)輔助自己的產(chǎn)業(yè)去做效能優(yōu)化。
經(jīng)濟(jì)學(xué)人用Midjourney生成的圖片做的雜志封面
在AIGC領(lǐng)域,目前并沒(méi)有多少公司在垂直賽道里深耕。除去已經(jīng)相對(duì)成熟的金融零售和客服賽道,心理健康是與AIGC深度融合的最具潛力的行業(yè)之一。但心理健康賽道雖然大,由于天花板高的原因,大部分AIGC公司都因受到了專(zhuān)業(yè)領(lǐng)域融合的限制而難以發(fā)揮技術(shù)優(yōu)勢(shì),行業(yè)內(nèi)高質(zhì)量解決方案供給嚴(yán)重不足。
實(shí)際上,通過(guò)AIGC的技術(shù)和手段,醫(yī)療行業(yè)能夠在供給側(cè)實(shí)現(xiàn)標(biāo)準(zhǔn)化地有效干預(yù)和治療。例如可以利用虛擬人來(lái)模仿心理治療師或是醫(yī)生助手,用AI生成的對(duì)話(huà)與用戶(hù)建立起深層次信任的基礎(chǔ),再通過(guò)角色化、個(gè)性化的溝通去達(dá)到治療效果。
由清華大學(xué)計(jì)算機(jī)教授黃民烈所創(chuàng)辦的聆心智能,是典型的AIGC企業(yè),深耕心理健康行業(yè)多年,沉淀了海量的中文對(duì)話(huà)數(shù)據(jù),基于大模型在情緒支持、傾聽(tīng)陪伴、角色扮演、開(kāi)放閑聊等多個(gè)層面構(gòu)建了特有模型框架,通過(guò)以生成式對(duì)話(huà)模型為內(nèi)核驅(qū)動(dòng)、其他AIGC能力為表現(xiàn)形態(tài)的產(chǎn)業(yè)應(yīng)用邏輯切入心理健康賽道。
其研發(fā)的對(duì)話(huà)機(jī)器人“Emohaa”,主要用于構(gòu)建以AI生成對(duì)話(huà)為核心的交互式數(shù)字診療方案,讓機(jī)器人能夠表達(dá)對(duì)用戶(hù)的理解和共情,并進(jìn)行及時(shí)的情緒支持和心理疏導(dǎo),來(lái)達(dá)到好的治療恢復(fù)效果。
游戲行業(yè)能夠利用文本生成能力創(chuàng)建豐富有趣的游戲NPC能力。根據(jù)游戲中的不同場(chǎng)景,來(lái)設(shè)置NPC的對(duì)應(yīng)話(huà)術(shù),所有NPC的回答都能夠根據(jù)設(shè)置詞語(yǔ)的提示實(shí)時(shí)生成。另外,將AIGC用于一些微觀素材創(chuàng)作上,也是短期可行的機(jī)會(huì)。
不過(guò),從當(dāng)前AIGC在產(chǎn)業(yè)中的發(fā)展來(lái)看,最大的一個(gè)問(wèn)題在于行業(yè)尚未建立起明確的變現(xiàn)方式。
以寫(xiě)作機(jī)器人、自動(dòng)配音、AI作畫(huà)等場(chǎng)景為例,大部分產(chǎn)品仍處在流量吸引的免費(fèi)試用階段,收費(fèi)空間較??;且大多還是輕量級(jí)的工具產(chǎn)品,不具備更大的內(nèi)容場(chǎng)景。能否在互聯(lián)網(wǎng)流量相對(duì)穩(wěn)定的前提下有效接觸C端用戶(hù),達(dá)到好的活躍度和留存率,依舊是一項(xiàng)挑戰(zhàn)。
當(dāng)前,無(wú)論是巨頭互聯(lián)網(wǎng)公司還是創(chuàng)業(yè)公司,都在循序漸進(jìn)地摸索AIGC方向,當(dāng)前多集中在感知層面的AIGC方向,去探尋這上面的商業(yè)化落地場(chǎng)景。
黃民烈告訴「甲子光年」,從產(chǎn)業(yè)的角度看,雖然國(guó)外走的相對(duì)靠前,但是一些比較典型的公司,主要還是做視覺(jué)感知智能層面居多,比如文到圖的生成或者文到視頻的生成。
黃民烈認(rèn)為,未來(lái)AIGC領(lǐng)域的商業(yè)化可能會(huì)朝著三個(gè)層次方向去發(fā)展。
第一層次在于感知層面,即直接簡(jiǎn)單的、能夠帶來(lái)感官刺激的東西。前期更多還是聚焦在聽(tīng)視覺(jué)層面的感知智能上,包括AI作圖作曲、AI視頻、3D等;第二層次會(huì)來(lái)到認(rèn)知層面,跟對(duì)話(huà)、寫(xiě)作、糾錯(cuò)、語(yǔ)言生成相關(guān),會(huì)逐漸成為趨勢(shì);第三層次則是發(fā)展出面向特定行業(yè)的新生態(tài)鏈,為整個(gè)行業(yè)提供高質(zhì)量的完整解決方案。
基于當(dāng)前的現(xiàn)狀,黃民烈表示,未來(lái)AIGC可以考慮跟特定的場(chǎng)景和具體的應(yīng)用的方向去關(guān)聯(lián),即朝著場(chǎng)景和行業(yè)結(jié)合的方式去發(fā)展,這能讓AIGC成為一個(gè)很好的輔助工具與賦能手段。
從現(xiàn)在最火的AI作畫(huà)來(lái)看,正在不斷壓低作畫(huà)創(chuàng)作門(mén)檻,只需點(diǎn)擊進(jìn)入生成AI作畫(huà)官網(wǎng)的服務(wù)器,然后在聊天框里輸入或者調(diào)用“ / imagine”選項(xiàng),輸入一句你腦海中想要描繪的場(chǎng)景文字即可。
高寧認(rèn)為,圖畫(huà)本身就是一個(gè)偏殺手級(jí)的應(yīng)用,雖然聲音或者文字的類(lèi)型商業(yè)化不一定做得差,但是如果從傳播效應(yīng)來(lái)講,圖像所帶來(lái)的視覺(jué)沖擊力,也是真正把這個(gè)應(yīng)用普及起來(lái)的原因之一。
同樣,晨山資本吳文超也認(rèn)為,互聯(lián)網(wǎng)時(shí)代開(kāi)啟后,營(yíng)銷(xiāo)是流量企業(yè)最主要的變現(xiàn)方式之一,而承載營(yíng)銷(xiāo)一個(gè)重要方式便是更加具有視覺(jué)沖擊力的圖文、視頻等富媒體內(nèi)容。
從AI生成圖像再到AI生成視頻,因?yàn)橐玫酱罅繑?shù)據(jù)訓(xùn)練模型,對(duì)算力要求呈指數(shù)級(jí)的提升,這讓能夠提供GPU算力的芯片制造商嘗到甜頭,所生產(chǎn)的先進(jìn)圖形處理器能夠成為訓(xùn)練和部署人工智能模型的理想選擇。
就在不久前,英偉達(dá)首席執(zhí)行官黃仁勛公開(kāi)表示,生成性人工智能是該公司最新芯片的一個(gè)關(guān)鍵用途,這些程序可能很快就會(huì)“徹底改變通信”。
同時(shí),人工智能生成公司產(chǎn)生的大量?jī)?nèi)容,也將推動(dòng)云計(jì)算產(chǎn)業(yè)的發(fā)展。
云廠商希望企業(yè)在它搭建的平臺(tái)和框架上面做應(yīng)用。據(jù)悉,Meta和谷歌已經(jīng)聘請(qǐng)了該領(lǐng)域諸多專(zhuān)業(yè)人才,希望將這種先進(jìn)技術(shù)整合到公司的產(chǎn)品中;而微軟將在其Office套件和Azure AI中添加DALL-E ,Adobe則計(jì)劃將生成AI工具添加到Photoshop中。對(duì)于中小型公司來(lái)說(shuō),在使用云服務(wù)的同時(shí),也能夠利用這些平臺(tái)提供的AI系統(tǒng)完成自己所需要的功能架構(gòu)。
隨著人工智能技術(shù)的發(fā)展,資本玩家加速落地各類(lèi)AI應(yīng)用,虛擬數(shù)字人、自動(dòng)化應(yīng)用等產(chǎn)品層出不窮,在“AIGC+藝術(shù)”領(lǐng)域,AI生成圖片、文字、音頻、視頻等內(nèi)容也漸漸滲透進(jìn)文學(xué)、繪畫(huà)、短視頻、教育等多個(gè)場(chǎng)景,進(jìn)一步拓寬其商業(yè)化空間。
但從產(chǎn)品角度,AIGC的早期階段出現(xiàn)的眾多內(nèi)容生成利器,由于使用門(mén)檻低,更多還是面向C端的產(chǎn)品,但大部分玩家僅僅是為了娛樂(lè),難以轉(zhuǎn)化成真正的付費(fèi)用戶(hù)。而如果將AIGC用在B端讓其輔助工作流程或?qū)嶋H提高工作效率,不管是用來(lái)寫(xiě)營(yíng)銷(xiāo)文案還是圖片生成,能夠產(chǎn)生價(jià)值,才能成為一個(gè)可持續(xù)的商業(yè)模式。
另一個(gè)難點(diǎn)在于,即便各家AI作畫(huà)公司制定了面向to B或to C的計(jì)算標(biāo)準(zhǔn),短期內(nèi)也很難靠作畫(huà)工作賺錢(qián),原因在于模型的訓(xùn)練成本太高。而國(guó)內(nèi)很多作畫(huà)平臺(tái)采用的是自研模型,這就給AI作畫(huà)工具增加了訓(xùn)練成本,對(duì)很多初創(chuàng)企業(yè)來(lái)說(shuō),這是一筆不小的成本。
而對(duì)于企業(yè)來(lái)說(shuō),本質(zhì)永遠(yuǎn)是盈利。階段性的人工智能成果,只有具備大規(guī)模商業(yè)應(yīng)用,才能給企業(yè)帶來(lái)價(jià)值,否則也只能是停留在圈地自嗨的模式。
吳文超表示,現(xiàn)在無(wú)論國(guó)內(nèi)外的獨(dú)角獸還是創(chuàng)業(yè)公司,AIGC在商業(yè)變現(xiàn)上還沒(méi)有一個(gè)成熟的商業(yè)模式,這跟原來(lái)工業(yè)領(lǐng)域驅(qū)動(dòng)的技術(shù)有很大差別。
“比如原來(lái)CV有特別明確的場(chǎng)景就是要做人臉識(shí)別,即使AI沒(méi)出現(xiàn),它也有人臉識(shí)別的場(chǎng)景,只不過(guò)有AI之后,能夠讓人臉識(shí)別變得更加精準(zhǔn)?!?/span>
但是從內(nèi)容生成的角度來(lái)講,本質(zhì)上還是一個(gè)富有創(chuàng)造力的行業(yè),以前工業(yè)領(lǐng)域并沒(méi)有這樣一個(gè)訴求,大家普遍認(rèn)為無(wú)論是做設(shè)計(jì)還是3D模型都需要人工,而不是工業(yè)界內(nèi)生的需求。
吳文超形容稱(chēng),現(xiàn)在倒過(guò)來(lái)拿著技術(shù)去找需求,有點(diǎn)類(lèi)似拿著錘子去找釘子。這就意味著AIGC的發(fā)展比起原來(lái)CV領(lǐng)域的工業(yè)需求倒逼推動(dòng),更在于是人為的推動(dòng),所以商業(yè)模式就會(huì)顯得不夠清晰。
近年來(lái),在大數(shù)據(jù)、大算力的支持下,人工智能的研究也被推向了一個(gè)新的高度,Jasper的首席執(zhí)行官Rogenmoser認(rèn)為,“世界上的每一個(gè)工具都將以某種能力內(nèi)置生成人工智能?!?/span>
目前,關(guān)于AIGC的倫理問(wèn)題主要體現(xiàn)在無(wú)法確權(quán)以及版權(quán)爭(zhēng)議上。雖然技術(shù)的發(fā)展與革命一定程度能帶來(lái)內(nèi)容的繁榮,但市場(chǎng)收益來(lái)源于市場(chǎng)交易,市場(chǎng)交易的基礎(chǔ)在于確權(quán)。如果AIGC無(wú)法確權(quán),一方面會(huì)導(dǎo)致侵權(quán)行為得不到有效解決,另外也會(huì)相應(yīng)減少資本對(duì)AIGC領(lǐng)域的投入熱情。
在版權(quán)爭(zhēng)議上,已經(jīng)能夠看到一些抄襲者的出現(xiàn),試圖利用Stable Diffusion的開(kāi)源技術(shù)去做一樣的產(chǎn)品化。此外,對(duì)于AI作畫(huà)所生成的圖片是否在模仿畫(huà)師風(fēng)格上,也難以界定。
而隨著AI技術(shù)的發(fā)展進(jìn)步,未來(lái)還會(huì)不斷提升自動(dòng)化水平,也將會(huì)和現(xiàn)實(shí)結(jié)合的更加緊密,AIGC領(lǐng)域爆炸式的增長(zhǎng),會(huì)加劇數(shù)據(jù)隱私以及所有權(quán)的歸屬問(wèn)題。
從目前探討最多的AI作畫(huà)、AI生成視頻來(lái)看,隨著生成工具逐步走向大眾和商業(yè)市場(chǎng),內(nèi)容造假的風(fēng)險(xiǎn)越來(lái)越高。在國(guó)外的諸多NFT平臺(tái)上,直接掛AI生成作品已經(jīng)賣(mài)的泛濫無(wú)邊。而國(guó)內(nèi),在淘寶、閑魚(yú)等平臺(tái),搜索AI作畫(huà),會(huì)發(fā)現(xiàn)有很多人在利用AI作畫(huà)來(lái)謀利。但由于目前AI作品在版權(quán)法律層面還未有明確界定,所以讓其依舊游走在灰色地帶。
為此,文心一格的相關(guān)負(fù)責(zé)人告訴「甲子光年」,由于目前AI已經(jīng)能生成和人類(lèi)作畫(huà)質(zhì)量不相上下的圖像,這就需要支持具有獨(dú)創(chuàng)性的繪畫(huà)作品依法享有版權(quán)。建議針對(duì)AI作畫(huà)在內(nèi)的創(chuàng)新業(yè)務(wù)應(yīng)用的治理,基于不同的細(xì)分應(yīng)用場(chǎng)景和產(chǎn)品模式特點(diǎn),來(lái)分類(lèi)分級(jí)制定落地規(guī)則。
但由于行業(yè)還很新,以及各國(guó)的政策不同,每家AIGC公司在面對(duì)AI創(chuàng)作的版權(quán)問(wèn)題上,各自處理方法也千差萬(wàn)別,因此,全世界當(dāng)前還都處在一個(gè)博弈過(guò)程之中。
比如在安全性上,Open AI直接過(guò)濾掉很多安全詞,禁止出現(xiàn)一些特定人物以及政治相關(guān);Getty Images禁止用戶(hù)將生成式AI圖像上傳到其庫(kù)存圖像數(shù)據(jù)庫(kù)中;TIAMAT和Midjourney則一致選擇了在素材庫(kù)中使用無(wú)版權(quán)的圖片,規(guī)避版權(quán)糾紛。
對(duì)于AIGC面臨的倫理問(wèn)題,黃民烈表示這是技術(shù)發(fā)展路徑上不可避免的一個(gè)問(wèn)題,這是因?yàn)楝F(xiàn)在的大模型AI能力它很容易做到記住和模仿,但無(wú)法進(jìn)行創(chuàng)造,因此就會(huì)不可避免地會(huì)面臨一些版權(quán),甚至是反人類(lèi)的倫理問(wèn)題。
但是從整個(gè)技術(shù)發(fā)展的角度,還是要去樂(lè)觀看待,他表示可以讓技術(shù)發(fā)展一段時(shí)間,讓技術(shù)暴露問(wèn)題,再想辦法從政策法律法規(guī)的角度去約束和規(guī)范它,形成一個(gè)更好的發(fā)展??傮w目標(biāo)還是秉持著讓技術(shù)和AI為人類(lèi)服務(wù)這一前提下,倫理問(wèn)題未來(lái)是可以解決的。
OpenAI現(xiàn)任CEO Sam Altman也曾在推特上表示過(guò),“AI將對(duì)世界帶來(lái)巨大變革,而我們應(yīng)該改變經(jīng)濟(jì)系統(tǒng)以適應(yīng)它”。AI仍在加速發(fā)展,未來(lái)還會(huì)碰到更多邊界,法規(guī)也會(huì)不斷進(jìn)行完善,AI發(fā)展與法規(guī)會(huì)始終磨合。