什么是 GauGAN? AI 如何将文字和图片转换成令人惊艳的艺术作品

作者 Isha Salian

GauGAN 是一款 AI 演示程序,用于生成逼真的图像,可让任何人利用生成式对抗网络来创作令人惊艳的景观。它以后印象派画家 Paul Gauguin(保罗•高更)的名字命名,由 NVIDIA 研究院开发,可以通过 NVIDIA AI Demos 免费体验。

如何使用 GauGAN 进行创作

该演示程序的最新版本 GauGAN2 可将文字和图画的任意组合转变成栩栩如生的图像。用户只需输入“山前的湖泊”这样的短语并按下按钮,就可以实时生成场景。如果将文字改成“山前的湖泊”或者“山前的森”,该 AI 模型会立即对图像作出相应修改。

喜欢自己绘制场景的艺术家可以使用该演示程序的智能画笔来修改这些根据文字生成的场景,或者从头开始绘制巨石、树木或蓬松的云朵。通过点击滤镜(或上传自定义图像),用户可以尝试不同的光线效果,或为其作品应用特定的绘画风格。

GauGAN2 演示程序背后的 AI 技术

GauGAN2 的核心是生成式对抗网络,简称 GAN,这是一种深度学习模型,涉及到两个神经网络:一个生成器和一个鉴别器。生成器创造合成图像,而鉴别器经过数百万张真实景观图像的训练后,能够为生成器提供像素级反馈,使合成图像更加逼真。

随着时间的推移,GAN 模型可以逼真地模拟真实世界,在 AI 生成的湖泊中倒映出山脉,当场景被修改为“冬天”时,树木会失去叶子。

Landscape generated by GauGAN2

用户在 GauGAN2 演示程序中绘制自己的涂鸦或修改现有场景时,他们使用的是分割图——记录场景中物体位置的高级轮廓图。每个区域都标注有沙子、河流、草地或花朵等特征,为 AI 模型提供场景填充说明。

自 2019 年在 NVIDIA GTC 大会上首次亮相以来,GauGAN 一直广受欢迎,无论是学校的美术教师、博物馆的互动艺术展览还是数百万在线用户都在使用它。

顶级电影工作室和电子游戏公司的艺术总监和概念艺术家等创意人士对 GauGAN 非常感兴趣,想要用它来为自己的创意制作原型。有鉴于此,NVIDIA Studio 作为帮助开发者的平台,推出了桌面应用程序 NVIDIA Canvas

NVIDIA Canvas 为创意人士带来了与 Adobe Photoshop 等现有工具兼容的 GauGAN 技术,让艺术家在使用 NVIDIA RTX GPU 时获得更流畅的交互式体验。

如欲进一步了解 GauGAN 背后的 AI 技术,请免费注册 NVIDIA GTC 大会,在太平洋时间 3 月 24 日星期四上午 10 点参加“Expressing Your Imagination with GauGAN2”会议。

NVIDIA GTC 大会将于 3 月 21 日至 24 日在线上举行。想要了解 AI 研究的最新进展,请观看 NVIDIA 首席执行官黄仁勋在太平洋时间 3 月 22 日上午 8 点的主题演讲。