NVIDIA 助力 KIRI Innovations, 用 AI 赋能 3D 内容生成

by 英伟达中国

KIRI Innovations 是一家面向全球市场的 AI 公司,致力于通过前沿技术赋能 3D 内容制作,降低 3D 内容生产的门槛。公司拥有 3D 重建引擎 KIRI Engine,通过手机拍照即可实现对物体的超写实 3D 建模。 

上线短短几个月的时间内,KIRI Engine 全球用户已突破 30 万人,且还在快速增长中,其中包括 Google、Roblox、EA、Epic Games、Meta 等元宇宙企业用户。用户通过 KIRI Engine App 或 KIRI Engine 网页端将围绕物体拍摄的照片上传至云端进行处理,就可以获得和现实物体一模一样的 3D 模型素材,再将这些逼真的 3D 模型素材应用在各种包括 VR 场景、3D 游戏、影视特效在内的 3D 内容制作中。 

KIRI Engine 生成的 3D 模型素材. 拥有逼真的纹理材质信息
用户使用 KIRI Engine 生成的 3D 模型 , 出现在各种 3D 游戏、VR 场景,甚至影视作品中

KIRI Engine 的背后,是一套部署在云端的神经网络重建算法,能够通过多角度照片集或视频,对现实物体生成具有纹理材质信息和几何信息的超写实 3D 模型。这种重建算法的计算量非常巨大,使用传统解决方案意味着消耗大量的算力资源和成本。KIRI Engine 使用 NVIDIA V100 和 NVIDIA T4 GPU 在云端进行计算,V100 负责进行复杂的神经网络训练,而 T4 则负责模型推理,将训练好的模型移至 T4 GPU 的主机上,通过输入新的数据来获得想要的结果;T4 也会进行相对简单的图像处理和点云匹配计算任务,同时依靠 NVIDIA CUDA 进行加速,使得计算成本得以减少数百倍至每个模型几角钱。 

KIRI Engine 的核心价值不仅在于用更低的成本为 3D 开发者提供 3D 重建工具,更在于通过快速增长的用户在云端积累海量 3D 数据集。随着 AI 带来的创作变革,AI 生成 3D 模型将会是下一个生成式 AI 的主战场,而高度标准化的 3D 数据集是 AI 生成 3D 模型的必要条件。在生成式 AI 全面到来的时代,KIRI 正在面对一个更大的市场和全新的挑战。 

如何兼顾降低计算成本与提升 3D 重建水平 

传统的照片 3D 建模技术对 CPU 非常依赖,但 CPU 的硬件限制使得这种方法的成本过高,所以其应用领域主要是资金充裕的大型企业和政府项目。人们与信息的交互方式正在因 VR/XR 的技术突破而经历从 2D 向 3D,和从信息互联到空间互联的范式转移。这种范式转移将极大带动市场对 3D 内容的需求,显然过去高成本的 3D 建模技术无法适应市场的变化。因此,需要探索一种新的计算方式,在满足不断增加的 3D 重建需求的同时,还要颠覆性地降低计算成本。 

three.js 脚本在 Github 的周下载量 

three.js 脚本作为制作 3D 内容必不可少的工具之一,其下载量趋势能侧面反映出全球 3D 内容的增长趋势;而从表中可以看出 three.js 脚本在 Github 的周下载量在一年的时间内翻了一倍,以此足以看出 3D 化的范式转移在以惊人的速度渗透人们的交互方式。 

在算法层面,KIRI 开创性地使用了神经网络和视觉算法混合计算的方法。这样的优势在于神经网络重建能够更好地还原一些无法被视觉算法重建的物体,例如高度反光或透明的物体,但对于特征点足够多的物体,视觉算法能够捕捉到更多的表面细节。 

因为神经网络的加入,使用 GPU 是必然的选择,因此使用 CPU+GPU 异构计算,尽管拥有 CPU+GPU 的服务器价格大概会是同级别的 CPU 价格的 2 倍,但计算时间可以大概节约 11 倍。(用机器学习进行 3D 模型的纹理贴图计算,CPU 需耗时 1600 秒,但 GPU 只需 130 秒。) 

同时对 3D 重建任务进行 CUDA 加速并加入扩/缩容机制 。在计算任务少的时候只使用单台 GPU 确保运行稳定,计算任务一旦开始变多,云架构能够自动扩容,最多使用数十台服务器并行运算。这样一来,通过 CUDA 加速的神经网络算法能够在大幅度降低单次运行的时间成本,而扩/缩容机制在确保用户体验的同时避免资源浪费。 

NVIDIA KIRI 提供高效稳定算力支持 

基于以上考量,KIRI 选择 NVIDIA 的产品生态来提供支持。因为 NVIDIA 产品生态的多样性能够满足全部技术需求,且提供高效稳定的算力支持。 

NVIDIA CUDA: 通过 CUDA 进行计算加速是 KIRI Engine 得以高效且低成本运行的重要原因之一。在传统纯 CPU 运行环境里,哪怕是运行最简单的 3D 重建算法也需要花费 20-60 分钟的时间。而通过 CUDA 加速后,KIRI 目前的重建算法只需要 5 分钟。(甚至 KIRI 正在努力尝试达到 25 秒内生成 3D 模型的加速。) 

NVIDIA T4 GPU: T4 是 KIRI 进行运算的中坚力量,T4 拥有低延时高吞吐量,进而可以实时满足更多的请求。 

NVIDIA V100: KIRI 使用 V100 来进行神经网络模型的训练。神经辐射场重建模型往往需要数个小时才能完成训练,但通过 V100 与 CUDA 的配合,再加上 KIRI 对算法的优化,目前在 KIRI Engine 上完成神经辐射场模型训练只需要 25 分钟。( KIRI 也在努力对架构和算法进行优化,力争两个月内能够将神经网络模型的训练缩减到 5 分钟以内。) 

NVIDIA 助力 KIRI 平台用户增长 

“目前 KIRI Engine 是全球增长速度较快的超写实 3D 模型生成平台之一,面对每天数以千计的 3D 模型生成任务,稳定高效的算力是我们得以快速成长的核心要素。” KIRI Innovations 联合创始人兼 CEO 王正男表示,“NVIDIA 的产品生态非常出色地帮我们解决了算力问题。一方面 NVIDIA 有很丰富的显卡选择,我们能够针对不同的处理任务使用不同的显卡,避免不必要的算力浪费;另一方面 CUDA 的加速机制配合我们为其量身打造的 3D 建模算法,让我们真正在速度和成本上超越了竞争对手,得以承载每天不断增长的用户需求。” 

NVIDIA初创加速计划 

KIRI Innovations 是NVIDIA初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA初创加速计划为免费会员制、旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。 

想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。