<input id="7sbva"><strike id="7sbva"></strike></input>

<tr id="7sbva"><code id="7sbva"></code></tr>

首頁合作企業(yè)服務(wù)

開發(fā)者出海圈專欄專題數(shù)據(jù)報告問答活動

跨境電商出海排行榜

搜索

發(fā)布合作

Google推出圖片生成模型VideoPoet，五大功能產(chǎn)生直式短影音

來源：十輪網(wǎng)

作者：十輪網(wǎng)

時間：2023-12-27

近來一波波圖片生成模型出現(xiàn)，無論是貼近提示要求或在圖片處理細節(jié)上，許多情況下展現(xiàn)出令人驚艷的高品質(zhì)。Google也不甘示弱，日前發(fā)布自主開發(fā)的大型語言模型VideoPoet。

近來一波波圖片生成模型出現(xiàn)，無論是貼近提示要求或在圖片處理細節(jié)上，許多情況下展現(xiàn)出令人驚艷的高品質(zhì)。Google也不甘示弱，日前發(fā)布自主開發(fā)的大型語言模型VideoPoet。

為了探索語言模型在圖片生成中的應(yīng)用，Google引進全新大型語言模型VideoPoet，能夠執(zhí)行包括文本轉(zhuǎn)成視頻、圖片轉(zhuǎn)成視頻、視頻風格轉(zhuǎn)換、視頻修復、視頻生成音頻等五大功能，而且默認產(chǎn)生直式短影音。

比方說，文本提示輸入“兩只熊貓打撲克牌”，VideoPoet產(chǎn)生兩只熊貓坐在桌邊打撲克牌的短片。圖片轉(zhuǎn)成視頻方面，像是上傳一張油畫圖片，畫中一艘駛向大海的船遭遇雷電交加、波濤洶涌，借由VideoPoet可以轉(zhuǎn)變成動圖形態(tài)。VideoPoet也能為視頻產(chǎn)生音頻，例如先以模型產(chǎn)生2秒短片，并嘗試在沒有任何文本提示下配上音頻，于是從單一模型就能產(chǎn)生視頻和音頻。

VideoPoet五大功能概述

VideoPoet是訓練一個自回歸語言模型，通過使用多個標記器（用于視頻和圖片的MAGVIT V2，以及用于音頻的SoundStream）學習視頻、圖片、音頻、文本形式，像是通過文本和圖片輸入分解、標記，進而產(chǎn)生復雜的圖片。

Google目標希望VideoPoet能夠“any-to-any”，根據(jù)任何提示任意轉(zhuǎn)換，同時也要擴展至文本轉(zhuǎn)成音頻、音頻轉(zhuǎn)成視頻、產(chǎn)生視頻字幕等功能。

VideoPoet將許多圖片生成功能無縫集成至單一模型，而不是針對不同任務(wù)單獨訓練模型，特別在產(chǎn)生有趣視頻和高品質(zhì)動作上，展現(xiàn)出大型語言模型具高度競爭力的圖片生成品質(zhì)。

開發(fā)團隊制作一部由VideoPoet產(chǎn)生不同短影音組合而成的介紹視頻。

（圖片來源：Google Research Blog）

Google 谷歌

上一篇：外媒：Shein和Temu每天向美國客戶發(fā)運約100萬個包裹

原文鏈接：點擊前往 >

版權(quán)說明：本文內(nèi)容來自于十輪網(wǎng)，本站不擁有所有權(quán)，不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章

為什么機械行業(yè)特別適合做谷歌獨立站推廣？

為什么機械行業(yè)特別適合做谷歌獨立站推廣？

中國在中低端機械制造領(lǐng)域已經(jīng)做得非常出色，但隨著市場的變化，傳統(tǒng)銷售模式逐漸顯得力不從心。

跨境電商Google廣告投放指南：常見誤區(qū)及優(yōu)化建議

跨境電商Google廣告投放指南：常見誤區(qū)及優(yōu)化建議

谷歌是全球最受歡迎的搜索引擎，在搜索引擎市場占據(jù)主導地位，它是迄今為止全球使用最廣泛的搜索引擎，全球的用戶每天都會產(chǎn)生大量的搜索。

廣告行業(yè)

【谷歌廣告】在廣告賬號界面每個廣告系列哪里顯示架構(gòu)結(jié)賬數(shù)據(jù)？

【谷歌廣告】在廣告賬號界面每個廣告系列哪里顯示架構(gòu)結(jié)賬數(shù)據(jù)？

在數(shù)據(jù)列-轉(zhuǎn)化次數(shù)里，勾選所有轉(zhuǎn)化次數(shù)。然后回到廣告系列界面，點擊數(shù)據(jù)列左側(cè)的細分-轉(zhuǎn)化-轉(zhuǎn)化操作，就能在所有轉(zhuǎn)化次數(shù)列下看到各種轉(zhuǎn)化操作的次數(shù)。

廣告行業(yè)

投谷歌搜索廣告，你的“兵器庫”里需要一份關(guān)鍵詞表

投谷歌搜索廣告，你的“兵器庫”里需要一份關(guān)鍵詞表

最重要的話說在最前面，預算有限的情況下，谷歌搜索廣告的目的是抓取有明確需求的客戶。

廣告行業(yè)

Google

Google廣告投放平臺，是一個基于互聯(lián)網(wǎng)的產(chǎn)品與服務(wù)，幫助中國游戲出海、應(yīng)用出海開發(fā)者及跨境電商實現(xiàn)品牌出海。

1892

文章數(shù)

2.1KW+

瀏覽量

1417

粉絲

+ 關(guān)注

熱門活動

更多

2025 AlgoriX Chat & Chill Cafe

中國游戲的全球密碼 2025 X游戲出海白皮書發(fā)布會

熱門文章

TRX 質(zhì)押和能量租賃？一文讀懂 TRON 網(wǎng)絡(luò)的資源機制

TRX 質(zhì)押和能量租賃？一文讀懂 TRON 網(wǎng)絡(luò)的資源機制

2025巴西電商與支付市場全景：出海企業(yè)布局全攻略

2025巴西電商與支付市場全景：出海企業(yè)布局全攻略

2025-07-17

PhotonPay光子易推出實體萬事達卡商務(wù)信用卡

PhotonPay光子易推出實體萬事達卡商務(wù)信用卡

2025-07-17

PhotonPay光子易波蘭辦公室入住！解鎖萬億歐洲市場

PhotonPay光子易波蘭辦公室入??！解鎖萬億歐洲市場

2025-07-17

海外收入穩(wěn)居第二，從《Gossip Harbor》看合成游戲休閑玩法背后的商業(yè)化思考

海外收入穩(wěn)居第二，從《Gossip Harbor》看合成游戲休閑玩法背后的商業(yè)化思考

2025-07-15

優(yōu)質(zhì)服務(wù)商推薦

更多

DLOCAL LLP

dLocal 在新興市場提供本地支付服務(wù)，連接全球企業(yè)商家與亞太地區(qū)、中東、拉丁美洲和非洲數(shù)十億新興市場消費者。通過“一站式 dLocal”理念（一個直接 API、一個平臺和一個合同），全球公司無需管理多個本地實體和集成，即可接受支付、發(fā)送付款并在全球范圍內(nèi)結(jié)算資金。

CCPayment

CCPayment 創(chuàng)立于2015年，是一家全球領(lǐng)先的加密支付服務(wù)商，支持900多種代幣，服務(wù)覆蓋加密代收、加密代付、多幣種結(jié)算與匯兌管理等，致力于為企業(yè)提供高效、安全、低成本的加密支付解決方案，平臺支持多種支付模式，集成便捷，并通過加密與風控技術(shù)全面保障資金安全，助力企業(yè)快速出海。

廣州標品軟件有限公司

AdsPower 指紋瀏覽器

AdsPower 是一款專為跨境人打造的指紋瀏覽器，致力于解決出海賬號矩陣安全管理問題，目前已通過所有網(wǎng)站檢測。平臺提供獨特的指紋配置、專業(yè)的瀏覽器自動化、高效的團隊協(xié)作功能，為您的賬號環(huán)境保駕護航！

公司簡介

快出海是國內(nèi)領(lǐng)先的互聯(lián)網(wǎng)出海合作平臺，通過整合行業(yè)優(yōu)質(zhì)資源，為出海企業(yè)提供產(chǎn)品展示和資源對接平臺，助力中國互聯(lián)網(wǎng)企業(yè)走向全球。查看更多>

公司簡介

聯(lián)系我們免責申明合作伙伴

關(guān)注我們

微信訂閱號>

微信服務(wù)號>

快出海小程序>

聯(lián)系我們

商務(wù)合作>

快出海小程序

快出海公眾號

商務(wù)合作

商務(wù)合作