NVIDIA 加快企业自定义生成式 AI 模型开发

开发者可以直接在浏览器中试用全新的 NVIDIA AI Foundation Models，使用 NVIDIA AI Foundation Endpoints 在应用程序中进行测试，然后使用专有的业务数据进行自定义。

如今，免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说，这顿“大餐”可能会让他们应接不暇，因为他们需要满足各种不同的项目和业务需求，比如兼容性、安全性和用来训练模型的数据。

NVIDIA AI Foundation Models 集企业级预训练模型之大成，为开发人员提供了针对企业应用定制生成式 AI 的良好开端。

NVIDIA 优化的基础模型加速创新

NVIDIA AI Foundation Models 可通过简单的用户界面或 API 直接在浏览器体验。此外，这些模型还可通过 NVIDIA AI Foundation Endpoints 进行访问，以便在企业应用中测试模型性能。

Llama 2、Stable Diffusion XL 和 Mistral 等现有的领先社区模型在格式化后，可帮助开发者利用其专有数据精简自定义过程。此外，这些模型还通过 NVIDIA TensorRT-LLM 进行了优化，以提供最高的吞吐量和最低的时延，同时支持在任一 NVIDIA GPU 加速堆栈上的大规模运行。例如，经过 TensorRT-LLM 优化的 Llama 2 模型在 NVIDIA H100 上的运行速度提高了近 2 倍。

新的 NVIDIA Nemotron-3 8B 基础模型系列可支持创建当今领先的企业聊天与问答应用，并适用于医疗、电信和金融服务等众多行业。

这一系列模型是客户构建安全且生产就绪的生成式 AI 应用的起点。这些模型在可靠的数据集上训练而成，其性能可媲美规模更大的模型，因此成为企业部署的理想之选。

多语言功能是 Nemotron-3 8B 系列模型的关键优势之一。这些开箱即用的模型精通 50 多种语言，包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。

加快从自定义到部署的全过程

在跨业务功能中使用生成式 AI 的企业需要一个 AI foundry，以便为其独特的应用自定义模型。NVIDIA 的 AI foundry 具备三个要素：NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具，以及 NVIDIA DGX 云 AI 超级计算服务。它们共同提供了端到端的企业级服务，以创建自定义生成式 AI 模型。

重要的是，企业拥有其定制化模型，也就可以通过 NVIDIA AI Enterprise 软件将其部署到几乎任何地点，并获得企业级的安全性、稳定性和支持。

NVIDIA AI Foundation Models 现已在 NVIDIA NGC 目录和 Hugging Face 上免费提供，并且也托管于 Microsoft Azure AI 模型目录中。