在 IBC 上探索如何充分利用生成式 AI 提升观众的媒体和娱乐体验

作者 Rick Champagne

NVIDIA 为媒体和娱乐行业提供的生成式 AI 支持和工具。

生成式 AI 正在通过为观众带来动态的沉浸式超个人化体验,促进媒体和娱乐行业的发展。

IBC 是一个以媒体、娱乐和技术的交叉领域为主题的展会。NVIDIA 及其合作伙伴将在该展会上展示最新的生成式 AI 创新技术,帮助媒体公司通过日益先进的数字体验吸引观众。

AI 软件定义媒体直播平台 NVIDIA Holoscan for Media 将成为本次展会的焦点。该平台使视频直播流能够与 AI 在同一个基础设施上运行,实现了对 AI 训练和推理集群的访问,并通过合作伙伴提供的产品将生成式 AI 功能部署到专用系统中。开发者可以利用该平台轻松集成 NVIDIA 软件开发套件 (SDK),使终端用户能够使用最新的 AI 技术。 

NVIDIA 还将展示开发者如何使用 NVIDIA AI Workbench 创建在所提供的文档上训练而成的个人生成式 AI 支持助手。借助该套件,不仅能够轻松设置 GPU 工作站,而且所有技术水平的开发者都能在任何异构平台上工作、管理和协作。

此外,参加者还可以利用引导式生成式 AI 的强大功能,化身自己定制体育运动交易卡上的明星,成为万众瞩目的焦点。NVIDIA 将在 7 号展厅 7.A45 戴尔展台展示这项技术。

合作伙伴带来变革创新

NVIDIA 合作伙伴,包括各 NVIDIA 初创加速计划成员,将在 IBC 上展示他们最新、最先进的生成式 AI 技术。

全球营销和技术服务公司 Monks 将展示 NVIDIA Holoscan for Media 平台上的 AI 计算机视觉演示,该演示可识别直播中的物体、品牌标识和其他特征,实时创建可搜索的媒体数据库。Monks 是 Holoscan for Media 的领先系统集成商,并利用其以 AI 为中心的解决方案 Monks.Flow 设计了基于云的工作流,帮助广播、媒体和娱乐公司开发超个性化内容,以便在新媒体渠道中快速、大规模地发布。Monks 位于 AI 技术区 14.AIB4 号展台。

Speechmatics 将展示其实时自动语音识别技术,该技术具有目前市场上最高的准确率和最低的延时。该公司的语音转文本模型能够协助转录工作并提高离线广播和直播服务的质量和效率。Speechmatics 位于 8 号展厅 8.B77b 展台。

Qvest 将展示 NVIDIA 提供加速的视频元数据采集和故事推荐引擎。媒体公司管理着海量视频内容,因此定位、编目并将这些内容编译成成品资产既困难又耗时。Qvest 的 AI 视频发现引擎基于 NVIDIA NIM 微服务构建而成,可通过自动采集视频文件中的数据加速这些流程,简化了用户将所发现的视频融入其预期故事的过程。Qvest 位于 10 号展厅 10.C24 展台。

Moments Lab 将展示由其屡获殊荣的多模态 AI 索引模型 MXT-1.5 驱动的最新功能。参加者可以看到 MXT-1.5 的全新自动原声摘要功能如何突出视频中的最佳引语,及其基于时刻和时间轴的搜索功能如何使编辑和制作人员在几秒钟内准确找到所需的片段。Moments Lab 还将演示其适用于媒体、体育和娱乐企业机构的可扩展产品套件,包括带有 MXT-1.5 的 Just Index、Cloud Media Hub、Live Asset Manager 和 Media Marketplace 等。Moments Lab 位于 5 号展厅 5.H60 展台。

Deepdub 将在 5.C90 AWS 展台展示其 AI 驱动的本地化技术,参加者将看到实现真正连贯多语言内容本地化的新功能和技术。Deepdub 将于 9 月 15 日下午 3 点在 IBC AI 技术区与 Kartoon Channel 总裁 Paul Robinson 共同展示一个案例研究。Deepdub 位于 14 号展厅 AI 技术区 14.AI10 展台。

Alugha 将展示 NVIDIA GPU 驱动的 AI 多语言内容处理技术,使创作者能够制作和发布多语种视频,通过打破语言障碍,覆盖全球观众。借助 NVIDIA 技术的性能和多功能性,该公司可以高效地训练复杂的模型,打造出可扩展的优质语言解决方案。Alugha 位于 3 号展厅 3.B54-4 展台。

Mobius Labs 的 Aana SDK 开源套件专门用于创建和部署跨文本、图像和音视频的多模态 AI 应用。该套件提供在消费类硬件上运行的高效模型,这些模型的尺寸最小只有普通模型的十分之一,速度却最多加快了 10 倍,使先进 AI 变得更容易获得且成本更低。Aana 的模块化设计支持快速、大规模的媒体和娱乐解决方案,促进了 AI 领域的创新。Mobius Labs 位于 14 号展厅 14.AIP2 展台。

Bria 将重点展示其开放、负责任的生成式 AI 平台。该平台将为媒体和娱乐行业的开发者提供各种工具和功能,包括可获取源代码的基础模型、API 和 SDK 等,以便他们使用获得版权和隐私许可的商业解决方案简化创作流程。其中的一个获得专利的归属引擎可令数据所有者和艺术家受益。参加者可以探索现实世界中的各种用例,包括 AI 驱动的大规模品牌内容生成、动态媒体个人化、使用用户生成内容的受众参与活动等。Bria 位于 14 号展厅 AI 技术区 14.AI13 展台。

Beamr 将展示 Holoscan for Media 平台驱动的实时 4Kp60 优化内容自适应应用。Beamr 技术可以在不影响质量的前提下提供最高的效率,在帮助节省最多一半云存储和带宽的同时,为生成式 AI 应用带来更快的新视频创建和交付流程。Beamr 位于 7.A53 展台。

Twelve Labs 将展示使计算机能够以类似人类认知的方式理解视频内容的功能。该公司的视频基础模型通过分析音频、语音、视觉元素等各种模态,支持语义视频搜索、分类等任务。Twelve Labs 将重点展示其模型如何动态提取元数据,通过提升海量视频库中的内容可发现性和管理水平帮助实现未来的超个人化内容。Twelve Labs 位于 6 号展厅 C22 展台。

实际应用

生成式 AI 将推动媒体和娱乐行业的进一步发展,提高该行业的效率、个人化和吸引力。

与 NVIDIA 一起在 IBC 7 号展厅 7 A45 戴尔展台了解该领域的新兴技术以及如何使用这些技术推动创新。