NVIDIA 助力海帆数据应对防疫 OCR 识别高并发场景

by 英伟达中国

南京海帆数据科技有限公司成立于 2018 年,是领先的人工智能算法和服务提供商,致力于 AI 能力和业务场景深度融合,提供软硬件一体化解决方案,让每个企业能真正感受到 AI 带来的产业价值。海帆数据于 2019 年自主研发的识别算法,在斯坦福大学 DAWNBENCH 深度学习推理榜当中获得全球第五名,并获得消费级 GPU 团队第一名。

Graphical user interface, application

Description automatically generated

公司聚焦智慧政务服务和智能制造产业,拥有自主研发、训练的 OCR 定制识别算法、戴口罩识别算法、抽烟行为识别算法等多种基于机器视觉和深度学习神经网络的人工智能算法。

Graphical user interface, website

Description automatically generated

多地健康码负载过高崩溃, 人工智能 OCR 识别技术面临挑战

自新冠疫情爆发以来,“健康码”已成为民众出行,查验个人健康状况的必要条件。大量社区、园区、交通枢纽通过健康码、核酸检测报告等手段进行疫情防控和管理。然而,通常都采用人工的方式进行确认,不仅占用大量人力,而且存在各种问题。采用人工智能 OCR 识别技术进行智能检测,成为有效的替代手段。

然而因各地的运维方式与水准不同,两年来,多个省市的本土“健康码”都先后出现负载过高导致崩溃的情况。OCR 识别健康码、核酸报告,对算力、并发、检测速度,有着更高的要求。想满足一二线城市大量识别请求并发和负载,同时能帮助各地尽量节省投入开支,成为困扰和技术团队的首要难题和挑战。

最新版 NVIDIA TensorRT CUDA 助力海帆瑞捷” OCR 识别性能提升

海帆科技研发的 “瑞捷”(RuiJie)是一款用于快速识别、提取和校验图片内容的 OCR 识别算法系统。借助最新版 NVIDIA TensorRT CUDA,“瑞捷”将 OCR 识别的性能、效率和负载能力,都提高到了一个新的高度,为疫情期间市级、省级体量的应用提供高并发 AI 文字识别和校准能力,充分发挥了人工智能的先进优势,用技术能力服务社会。


1.海帆团队使用 Real-time Scene Text Detection with Differentiable Binarization 作为文字检测算法。该深度学习算法基于图像分割算法,侧重于后处理,相较于传统文字检测算法可以大大提升训练中网络的性能,使得算法可以用于任意形状场景的文字识别的同时,保持目前最高的文字定位精度。

2.海帆 OCR 识别算法中,文字识别采用 CRNN+CTC 作为文字识别框架。首先 CNN 提取图像卷积特征,然后 LSTM 进一步提取图像卷积特征中的序列特征,最后引入 CTC 解决识别结果矫正的问题,即一种 end2end 的文字识别算法,对不定长的文本序列识别获得了出众的识别率。

3.团队使用基于 CUDA 和 cudnn 的 TensorRT,进行神经网络推理加速。相较于其他的深度学习框架,NVIDIA TensorRT 在 GPU 模式下提供了 100X 的加速,极大地提高了推理速度

4.由于需要面对百万人口地市以上的并发访问需求,服务要求至少达到单服务器 100qps 以上的并发响应能力,海帆团队通过 TensorRT 对模型进行了量化加速和网络优化,在仅用两张 NVIDIA Tesla T4 卡的环境下,将速度从 40qps 提升至 120qps 以上,完美的应对了高并发场景和需求,为客户节约了硬件成本的同时,保障了平台稳定运行。

借助 NVIDIA Tesla T4 强大性能 瑞捷” OCR 防疫识别高速准确

“瑞捷” OCR 防疫识别软件已经悄然落地江苏多地市,借助 NVIDIA Tesla T4 的强大性能,成为疫情防控期间,默默支撑的坚实力量和重要技术保障。识别范围覆盖健康码、同行码、行程码、核酸报告、场所码等近 10 种不同类型防疫凭证场景,同时支撑超百万级用户同时访问仍识别高速准确。

A screenshot of a phone

Description automatically generated with medium confidence

产品成功通过 AI 识别技术,让防疫管控从最初的人工核验,升级为 AI 智能识别,大大减轻了企业的防疫管理压力和人力物力投入,创造了巨大的经济价值和社会效益,为疫情管理和防疫工作做出了突出贡献。产品已经形成良好的口碑和社会影响力,正在全国范围内的公共交通、大型企业、高校中拓展应用领域和应用场景,获得了客户和领导的一致认可。

海帆数据创始人及 CEO 王涛表示:作为英伟达初创加速计划的孵化企业,海帆数据不断致力于将 AI 技术服务于社会民生,不断实践新想法,开发新产品,将机器视觉的能力带向新的领域。英伟达的产品为我们提供了这个可能和实现的平台,强大的性能和稳定的品质,成为用户满意的保障,给了我们信心和勇气,同英伟达一起挑战 AI 落地的新场景和新挑战,扬帆破浪,成为 AI 应用落地企业的领航者。

NVIDIA 初创加速计划

南京海帆数据科技有限公司是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制、旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。