解码 GAN 如何掀起生成式 AI 革命浪潮

NVIDIA 研究团队开发的 GauGAN 演示为构建新一轮生成式 AI 应用创造了条件,而这些应用又将进一步为创意工作流带来强效助力。
作者 Gerardo Delgado

编者注:本文属于《解码 AI》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI,同时向 NVIDIA RTX PC 和工作站用户展示全新硬件、软件、工具和加速特性。

随着以 ChatGPT 和 Stable Diffusion 为代表的热门应用不断涌现,生成式模型已彻底改变 AI 格局。

NVIDIA 的 GauGAN 是一种能够利用 AI 将手绘草图转换为写实风艺术作品的模型,可为 NVIDIA Canvas 应用提供支持。

GAN 如何为这一切拉开帷幕

GAN 是一种深度学习模型,它包含两个互补的神经网络:一个生成器和一个判别器。

这两个神经网络会相互竞争。生成器试图创建栩栩如生的写实图像,而判别器则试图区分真实图像和生成图像。随着这两个神经网络不断相互挑战,GAN 在绘制写实的图像方面的能力愈发纯熟。

GAN 擅长理解复杂的数据模式并创建高质量结果。它们被用于多种应用,包括图像合成、风格迁移、数据增强和图像到图像转换应用。

NVIDIA 的 GauGAN 以后印象派画家保罗·高更的名字命名,是一个用于生成写实风格图像的 AI Demo 演示。它由 NVIDIA 研究团队构建,直接促成了 NVIDIA Canvas 应用的开发。您可通过 NVIDIA AI 游乐园免费体验此 AI Demo。

自 GauGAN 于 2019 年在 NVIDIA GTC 大会上首次亮相以来,它一直广受欢迎,被艺术教师、创意机构、博物馆以及数百万网络用户所使用。

试着让抽象草图秒变逼真风景

在 GauGAN 和本地 NVIDIA RTX GPU 的支持下,NVIDIA Canvas 可利用 AI 将简单的笔画转变成逼真的风景画,并实时显示结果。

用户可以先运用具有草或云等现实元素 (应用中称为“材质”) 的调色板绘制简单的线条和形状。

然后,AI 模型会在另一半屏幕上实时生成增强的图像。例如,使用“山”材质勾勒出几个三角形形状,它们随即就会转变为令人惊艳的逼真山脉。用户也可以选择“云”材质,之后只需点击几下鼠标即可将环境从晴天变为阴天。

创意拥有无限可能。如果用户绘制了池塘的草图,图像中的树木和岩石等其他元素在水中的倒影便会随即生成;用户若将材质从雪变成草地,场景就会从惬意冬日转变为热带天堂。

Canvas 提供九种不同的风格,每种风格有 10 种变体和 20 种材质可供选择。

Canvas 设有全景模式,艺术家能够借此创建 360 度全景图像并将其用于 3D 应用。YouTube 博主 Greenskull AI 通过以下视频展示了全景模式。在视频中,他绘制了一个海湾并将其导入了 UE 5。

欢迎下载 NVIDIA Canvas 应用并开始使用。

不妨考虑探索一下 NVIDIA Broadcast,这是另一款 AI 赋能的内容创作应用,可将任何房间转变为家庭工作室。RTX GPU 用户可以免费获取 NVIDIA Broadcast。

请订阅《解码 AI》时事通讯,我们每周都会将新鲜资讯直接投递到您的收件箱。