从生成式到代理式 AI —— 年度 AI 进展概览

作者 Jesse Clayton

编者注:本文属于《AI 解密》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI,同时向 GeForce RTX PC 和 NVIDIA RTX 工作站用户展示全新硬件、软件、工具和加速特性。

过去的一年,《解码 AI》系列栏目详细解析了 AI 的各个方面——从简化大语言模型 (LLM) 的复杂性到彰显 RTX AI PC 和工作站的强大功能。

本综述文章梳理了最新的 AI 进展,着重介绍该技术如何改变人们的书写、游戏、学习以及线上沟通的方式。

NVIDIA GeForce RTX GPU 的强大性能确保了用户在笔记本电脑、台式机和工作站上的 AI 体验。其配备专门的 AI Tensor Core,可提供超过 1,177 万亿次运算/秒 (TOPS) 的处理能力,在游戏、创作、日常办公等方面提供强大性能。对于工作站而言,NVIDIA RTX GPU 提供超过 1,108 TOPS 的运算能力,助力实现更高层次的 AI 加速和效率。

AI 赋能的聊天机器人可增强生产力和创造力

《解码 AI》栏目在年初的时候,探讨过什么是大语言模型 (LLM),以及其重要性和如何使用。

对于很多人来说,ChatGPT 这类工具是他们初次接触到的 AI。LLM 赋能的聊天机器人已经将计算从基本的、基于规则的交互转变为动态对话。它们能够给出度假建议,撰写客户服务邮件,创作诗歌,甚至为用户编写代码。

今年三月推出的 ChatRTX 是一款演示应用,允许用户通过自己的内容 (如文档、笔记和图像) 定制自己的 GPT LLM。

借助检索增强生成 (RAG)、NVIDIA TensorRT-LLM 和 RTX 加速等功能,ChatRTX 能让用户快速搜索自己的数据并提出相关问题。由于 ChatRTX 在 RTX PC 或工作站上本地运行,搜索结果既快速又保障了隐私。

NVIDIA 为爱好者和开发者提供极为丰富的基础模型选项,包括 Gemma 2、Mistral 和 Llama-3。这些模型可在 NVIDIA GeForce 和 RTX GPU 上本地运行,无需依赖云服务即可实现快速、安全的性能。

立即下载 ChatRTX

支持 RTX 加速的合作伙伴应用

AI 正在融入越来越多的应用程序和使用场景,包括游戏、内容创作应用、软件开发和生产力工具。

超多支持 RTX 加速的开发者和社区工具、SDK、模型及框架推动了这种 AI 发展,在热门应用程序中运行本地模型变得前所未有的简单。

10 月发布的《解码 AI》栏目重点介绍了 Brave 浏览器的 Leo AI 如何借助 NVIDIA RTX GPU 和开源 Ollama 平台,使用户能够直接在 RTX PC 或工作站上本地运行 Llama 3 等 LLM。

这种本地设置既能提供快速、具有交互性的 AI 性能,又能保证用户数据的私密性,而无需依赖云服务。NVIDIA 对 Ollama 等工具的优化,可加速文章摘要、回答问题和解读要点等场景,并全部在 Brave 浏览器中完成。用户可在本地模型和云端模型之间切换,灵活掌控其 AI 体验。

请阅读 Brave 博客以了解如何通过 Ollama 本地运行 LLM 的简单说明。配置好 Ollama 之后,Leo AI 将使用本地部署的 LLM 来处理用户请求。

代理式 AI —— 解决复杂问题

代理式 AI 是 AI 的下一个前沿领域,能够运用复杂的推理和迭代规划来自主解决复杂的多步骤问题。

《解码 AI》探讨了 AI 社区如何探索应用代理式 AI 打造更智能、更强大的 AI 系统。

类似于 AnythingLLM 的合作伙伴应用展示了 AI 如何提升简单的问答,提高工作效率和创造力。 用户可以利用该应用部署内置智能体,处理搜索网页或安排会议等任务。

例如,用户在 AnythingLLM 中调用 AI 智能体来完成网页搜索。

AnythingLLM 允许用户通过直观的界面与文档进行交互,使用 AI 智能体自动执行复杂任务,并在本地运行高级 LLM。借助 RTX GPU 的强大功能,它可提供更快、更智能、更灵敏的 AI 工作流 —— 而且完全在单个桌面应用中本地运行。该应用还可以离线工作,快速且私密,能够利用云解决方案通常无法获取的本地数据和工具。

AnythingLLM 社区中心让任何人都能够轻松获取系统提示词,帮助他们引导 LLM 行为,发现提高工作效率的斜杠指令,并为独特的工作流和自定义工具构建专门的 AI 智能体技能。

通过让用户在自己的系统上以完全私密的方式运行代理式 AI 工作流,AnythingLLM 正推动创新,简化对最新技术的尝试。

《解码 AI》 概览

目前,超过 600 款 Windows 应用和游戏已在全球 1 亿多台 GeForce RTX AI PC 和工作站上本地运行 AI,提供快速、可靠的低延迟性能。了解 NVIDIA GeForce RTX AI PCNVIDIA RTX AI 工作站的更多详情。

敬请观看 NVIDIA 创始人兼首席执行官黄仁勋将于北京时间 1 月 7 日发表的 CES 主题演讲,了解 AI 如何为游戏、内容创作和开发助力的最新内容。

生成式 AI 正在改变游戏、视频会议和各类互动体验。请订阅《解码 AI》时事通讯,我们每周都会将新鲜资讯直接投递到您的收件箱。