开发者可以直接在浏览器中试用全新的 NVIDIA AI Foundation Models,使用 NVIDIA AI Foundation Endpoints 在应用程序中进行测试,然后使用专有的业务数据进行自定义。
如今,免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说,这顿“大餐”可能会让他们应接不暇,因为他们需要满足各种不同的项目和业务需求,比如兼容性、安全性和用来训练模型的数据。
NVIDIA AI Foundation Models 集企业级预训练模型之大成,为开发人员提供了针对企业应用定制生成式 AI 的良好开端。
NVIDIA 优化的基础模型加速创新
NVIDIA AI Foundation Models 可通过简单的用户界面或 API 直接在浏览器体验。此外,这些模型还可通过 NVIDIA AI Foundation Endpoints 进行访问,以便在企业应用中测试模型性能。
Llama 2、Stable Diffusion XL 和 Mistral 等现有的领先社区模型在格式化后,可帮助开发者利用其专有数据精简自定义过程。此外,这些模型还通过 NVIDIA TensorRT-LLM 进行了优化,以提供最高的吞吐量和最低的时延,同时支持在任一 NVIDIA GPU 加速堆栈上的大规模运行。例如,经过 TensorRT-LLM 优化的 Llama 2 模型在 NVIDIA H100 上的运行速度提高了近 2 倍。
新的 NVIDIA Nemotron-3 8B 基础模型系列可支持创建当今领先的企业聊天与问答应用,并适用于医疗、电信和金融服务等众多行业。
这一系列模型是客户构建安全且生产就绪的生成式 AI 应用的起点。这些模型在可靠的数据集上训练而成,其性能可媲美规模更大的模型,因此成为企业部署的理想之选。
多语言功能是 Nemotron-3 8B 系列模型的关键优势之一。这些开箱即用的模型精通 50 多种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。
加快从自定义到部署的全过程
在跨业务功能中使用生成式 AI 的企业需要一个 AI foundry,以便为其独特的应用自定义模型。NVIDIA 的 AI foundry 具备三个要素:NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX 云 AI 超级计算服务。它们共同提供了端到端的企业级服务,以创建自定义生成式 AI 模型。
重要的是,企业拥有其定制化模型,也就可以通过 NVIDIA AI Enterprise 软件将其部署到几乎任何地点,并获得企业级的安全性、稳定性和支持。
NVIDIA AI Foundation Models 现已在 NVIDIA NGC 目录和 Hugging Face 上免费提供,并且也托管于 Microsoft Azure AI 模型目录中。