Shriya Rishab 在成长过程中一直梦想成为一名医生或宇航员。在这两个领域中,她可以凭借自己强烈的好奇心以及对数学和科学的热情来解决世界上最严峻的挑战。
如今,身为 NVIDIA 高级深度学习工程师的她已梦想成真。
来自新泽西州的 Rishab 在哥伦比亚大学获得计算机科学硕士学位后,于 2020 年加入 NVIDIA,专注于基于计算机视觉的模型和算法。几年后,Rishab 开始对文本中所蕴含的大量信息着迷,并将研究重点转向大语言模型。
Rishab 表示:“每当学习新知识时,我的好奇心就会变得越来越旺盛。我一直在学习新的知识并试图用创新的方式解决挑战。”她在工作之余还会通过绘画和素描发挥自己的创造力。
Rishab 在 NVIDIA 的 MLPerf Training 结果提交团队工作了约两年时间。MLPerf Training 需要一系列基准测试,旨在对各种系统训练模型达到目标质量指标的速度进行无偏评估。Rishab 每年需要训练并提交两次深度学习模型,以展示 NVIDIA AI 平台的性能。
Rishab 所使用的大语言模型是当今一些应用最广泛的 AI 服务的基础。当 NVIDIA 首次向 MLPerf Training 提交由 NVIDIA H100 Tensor Core GPU 驱动的基于 GPT-3 的模型时,Rishab 感到尤为自豪。经过 NVIDIA 和业界其他合作者数月的辛勤努力,该团队打破了 MLPerf 的记录。
Rishab 的工作成果为她加入 MLCommons(负责运行 MLPerf 基准测试的 AI 领导者联盟)创造了机会。作为联合主席,Rishab 与来自学术界、研究界和产业界的代表合作,帮助确定新的相关模型,以便添加到未来基准测试
Rishab 表示:“以社区形式开展合作可以使我们更快、更好地完成任务。MLCommons 是一个开放的公共基准测试,这一点在我看来十分重要。任何人都可以查看或提交结果,这有助于整个行业共同学习并决定我们的未来。”
Rishab 目前负责开源公开可用的大语言模型和相关开源平台,例如任何人都可以在 NVIDIA 硬件上运行的 NVIDIA NeMo。她致力于加速业内最重要的模型,同时也要确保训练过程的弹性和效率。
Rishab 表示:“我在 NVIDIA 所做的大部分工作都是开源的,并且我为能够让 AI 变得更加开放和透明而感到自豪。我们所做的一切都是为整个社区着想,这也证明了我的人生工作价值所在。”
进一步了解 NVIDIA 的生活、文化和职业。