400-8083-012
新聞動态

谷歌(gē)用(yòng)新AI超越自己

 隻需上傳3-5張指定物(wù)體的(de)照(zhào)片,再用(yòng)文字描述想要生成的(de)背景、動作或表情,就能讓指定物(wù)體“閃現”到你想要的(de)場(chǎng)景中,動作表情也(yě)都栩栩如生。

給Imagen加上“指哪打哪”的(de)能力,會變得(de)有多(duō)強?


不止是動物(wù),其他(tā)物(wù)體像墨鏡、書(shū)包、花瓶,也(yě)都能做(zuò)出幾乎以假亂真的(de)成品。

屬于是發朋友圈也(yě)不會被别人(rén)看出破綻的(de)那種(手動狗頭)。

這(zhè)個(gè)神奇的(de)文字-圖像生成模型名叫DreamBooth,是谷歌(gē)的(de)最新研究成果,基于Imagen的(de)基礎上進行了(le)調整,一經發布就在推特上引發熱(rè)議(yì)。

目前相關研究論文已上傳至arXiv。

有網友調侃:這(zhè)簡直是最先進的(de)梗圖生成器。

在介紹原理(lǐ)前,讓我們先來(lái)看看DreamBooth的(de)各種能力,包括換景、指定動作表情服飾、更叠風格等。

如果你是個(gè)“鏟屎官”,有了(le)這(zhè)個(gè)模型的(de)“換景能力”,就能足不出戶送自家狗子走出家門,凡爾賽宮裏、富士山腳下(xià)……通(tōng)通(tōng)不在話(huà)下(xià)。

甚至還(hái)能更換各種照(zhào)片風格,也(yě)就是所謂的(de)“加濾鏡”。例如,各種“世界名畫(huà)”畫(huà)風,簡直不要太藝術:

不僅如此,寵物(wù)的(de)動作和(hé)表情也(yě)都能随意指定,屬實是把“一句話(huà)P圖”的(de)細節拿捏到位了(le)。

除此之外,無論是更換顔色,還(hái)是更魔幻一點,更換物(wù)種,這(zhè)隻AI也(yě)都能做(zuò)到。