隻需上傳3-5張指定物(wù)體的(de)照(zhào)片,再用(yòng)文字描述想要生成的(de)背景、動作或表情,就能讓指定物(wù)體“閃現”到你想要的(de)場(chǎng)景中,動作表情也(yě)都栩栩如生。
給Imagen加上“指哪打哪”的(de)能力,會變得(de)有多(duō)強?
不止是動物(wù),其他(tā)物(wù)體像墨鏡、書(shū)包、花瓶,也(yě)都能做(zuò)出幾乎以假亂真的(de)成品。
屬于是發朋友圈也(yě)不會被别人(rén)看出破綻的(de)那種(手動狗頭)。
這(zhè)個(gè)神奇的(de)文字-圖像生成模型名叫DreamBooth,是谷歌(gē)的(de)最新研究成果,基于Imagen的(de)基礎上進行了(le)調整,一經發布就在推特上引發熱(rè)議(yì)。
目前相關研究論文已上傳至arXiv。
有網友調侃:這(zhè)簡直是最先進的(de)梗圖生成器。
在介紹原理(lǐ)前,讓我們先來(lái)看看DreamBooth的(de)各種能力,包括換景、指定動作表情服飾、更叠風格等。
如果你是個(gè)“鏟屎官”,有了(le)這(zhè)個(gè)模型的(de)“換景能力”,就能足不出戶送自家狗子走出家門,凡爾賽宮裏、富士山腳下(xià)……通(tōng)通(tōng)不在話(huà)下(xià)。
甚至還(hái)能更換各種照(zhào)片風格,也(yě)就是所謂的(de)“加濾鏡”。例如,各種“世界名畫(huà)”畫(huà)風,簡直不要太藝術:
不僅如此,寵物(wù)的(de)動作和(hé)表情也(yě)都能随意指定,屬實是把“一句話(huà)P圖”的(de)細節拿捏到位了(le)。
除此之外,無論是更換顔色,還(hái)是更魔幻一點,更換物(wù)種,這(zhè)隻AI也(yě)都能做(zuò)到。