美国拉斯维加斯 — CES — 2024 年 1 月 8 日 — NVIDIA 发布具有高性能生成式AI功能的GeForce RTX™ SUPER 桌面端 GPU,来自 OEM 合作伙伴的全新 AI 笔记本电脑,及面向开发者和消费者的全新 NVIDIA RTX™ 加速的AI应用和工具。
数十年来,NVIDIA 在 PC 领域一直处于领军地位,现已有超 1 亿 RTX GPU 在推动着 AI PC 时代的发展,NVIDIA 正通过提供工具以提升 PC 上的生成式 AI 体验:NVIDIA TensorRT™ 加速用于文本生成图像工作流的热门 Stable Diffusion XL 模型、NVIDIA RTX Remix 与生成式 AI 纹理工具、NVIDIA ACE 微服务以及更多使用 DLSS 3 帧生成技术 (Frame Generation) 的游戏。
此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一个开源库,可加速和优化最新大语言模型 (LLMs) 的推理性能,现已支持更多面向PC的预优化模型。本月,NVIDIA 发布由 TRT-LLM 加速的 Chat with RTX 技术 Demo,让 AI 爱好者能与他们的笔记、文档和其他内容进行交互。
NVIDIA 创始人兼首席执行官黄仁勋表示:”生成式 AI 是计算史上最重要的平台转变,它将改变包括游戏在内的所有行业。NVIDIA 拥有超过 1 亿台 RTX AI PC 和工作站的用户基础,为开发者和玩家提供保证,让他们尽享生成式 AI 的魔力。”
在 PC 上本地运行生成式 AI 对于隐私、延迟和成本敏感型应用至关重要。但这需要大量 AI 系统安装基础,以及合适的开发者工具来调优 PC 平台的 AI 模型。
为满足这些需求,NVIDIA 正通过其整个技术栈提供创新,推动新体验,并在现已支持超过 500 款 NVIDIA RTX 游戏和应用的 AI PC 基础上更进一步。
RTX AI PC 和工作站
NVIDIA RTX GPU 能以最高性能运行各种应用,充分释放 PC 上生成式 AI 的潜力。RTX GPU 中的 Tensor Core 可显著加速工作和娱乐应用中要求最严苛的 AI 功能。
今天在 CES 发布的全新 GeForce RTX 40 SUPER 系列 GPU 包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。在 AI 工作负载方面,GeForce RTX 4080 SUPER 生成视频的速度比 RTX 3080 Ti 快 1.5 倍,生成图像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的 Tensor Core 可提供最高可达 836 AI TOPS,在游戏、创作和日常工作等方面提供革命性的 AI 性能。
包括宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 笔记本电脑,为用户带来开箱即用的生成式 AI 体验。与使用 NPU 相比,RTX AI 笔记本电脑的性能可提升 20-60 倍。
配备RTX GPU的移动工作站可运行 NVIDIA AI Enterprise 软件,包括 TensorRT 和 NVIDIA RAPIDS™,用于简化、安全的生成式 AI 和数据科学开发。每台 NVIDIA A800 40GB Active GPU 都包含为期三年的NVIDIA AI Enterprise 许可证,为 AI 和数据科学提供理想的工作站开发平台。
用于构建 AI 模型的全新 PC 开发者工具
为帮助开发者使用 PC 级的性能和显存快速创建、测试和定制预训练生成式 AI 模型和 LLM,NVIDIA 于近期发布统一、易用的工具包 NVIDIA AI Workbench。
AI Workbench 将于本月底推出测试版,提供对 Hugging Face、GitHub 和 NVIDIA NGC™ 等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协作和迁移项目。
项目可扩展到数据中心、公有云或 NVIDIA DGX™ Cloud 等任何地方,然后再回到 PC 或工作站上的本地 RTX 系统进行推理和轻量定制。
NVIDIA 通过与惠普的合作,将 NVIDIA AI Foundation Models and Endpoints (包括RTX加速的AI模型和软件开发工具包)集成到惠普 AI Studio 中,这是一个集成化的数据科学平台,从而简化 AI 模型的开发。这将使用户能跨 PC 和云轻松搜索、导入和部署优化后的模型。
为 PC 使用场景构建 AI 模型之后,开发者可使用 NVIDIA TensorRT 对其进行优化,以充分利用 RTX GPU 的Tensor Core。
最近,NVIDIA通过 TensorRT-LLM for Windows 将 TensorRT 扩展到基于文本的应用,TensorRT-LLM for Windows 是一个用于加速 LLM 的开源库。TensorRT-LLM 最新更新现已发布,将 Phi-2 加入不断增长的 PC 预优化模型列表,与其他 backend 相比,推理速度提升5倍。
RTX 加速生成式AI为全新 PC 体验提供动力
在 CES 2024 上,NVIDIA 及其开发者合作伙伴发布全新生成式 AI 驱动的 PC 应用和服务,包括:
- NVIDIA RTX Remix,用于创建令人惊叹的经典游戏 RTX 重制版的平台。测试版将于本月底发布,提供生成式 AI 工具,可将经典游戏中的基本纹理转化物理精准的4K高精度材质。
- NVIDIA ACE 微服务,包括生成式 AI 驱动的语音和动画模型,使开发者能为游戏添加智能、动态的虚拟数字人物。
- TensorRT 加速 Stable Diffusion XL (SDXL) Turbo 和 LCM,这是两种最热门的 Stable Diffusion 加速方法。与之前最快的实现相比,TensorRT 将这两种方法的性能提升 60%。Stable Diffusion WebUI TensorRT 扩展的更新版现在也已发布,包括 SDXL、SDXL Turbo、LCM-LoRA 加速以及优化的 LoRA 支持。
- NVIDIA DLSS 3 支持帧生成技术 (Frame Generation),可利用 AI 将帧率提高到原生渲染的 4 倍,将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中,包括《地平线:西之绝境》(Horizon Forbidden West)、Pax Dei 和《龙之信条 2》(Dragon’s Dogma 2)。
- NVIDIA 技术 Demo “Chat with RTX”将于本月晚些时候发布,让AI爱好者使用名为“检索增强生成Retrieval Augmented Generation (RAG)”的热门技术,轻松地将 PC LLM 连接到自己的数据。该 Demo 由 TensorRT-LLM 加速,使用户快速与自己的笔记、文档和其他内容进行交互。作为开源参考项目,开发者可轻松地在自己的应用中实现相同的功能。
欢迎参加 NVIDIA 在美国拉斯维加斯举行的 CES 2024,进一步了解生成式 AI 的最新突破。