魔数智擎:GPU助力,打造金融行业AI机器学习平台,解决传统“黑盒”模型困境

by charank

案例简介

魔数智擎(Magic Engine)专注于可溯源、可解释性AI算法研发,结合国内外银行信贷、营销等经验,致力于智能风控、精准营销、信用风险定价、数据运营等多方面的人工智能技术落地应用,助力企业合规运营,创造更高的商业价值。

本案例中通过 NVIDIA CUDA 9.0 和NVIDIA Tesla V100,Magic Engine实现了从数据处理、特征工程、模型训练、特征衍生、业务规则抽取的全流程GPU加速,让建模到落地整个周期提升 3-20倍。

本案例主要应用到 NVIDIA CUDA 9.0 和NVIDIA Tesla V100 。

Case Introduction:

Magic Engine focuses on the research and development of traceable and interpretable AI algorithms. Combined with the experience of bank credit and marketing at home and abroad, Magic Engine is committed to the landing application of AI technologies in intelligent risk control, precision marketing, credit risk pricing, data operation and other aspects, so as to help enterprises operate in compliance and create higher commercial value.

In this Case, through the NVIDIA CUDA 9.0 and NVIDIA Tesla V100, Magic Engine achieves full-pipeline GPU acceleration from data processing, feature engineering, model training, feature derivation and business rule extraction, which improves the entire cycle from modeling to implementation by 3-20 times.

The major products utilized in the case is NVIDIA CUDA 9.0 and NVIDIA Tesla V100.

背景

深圳市魔数智擎人工智能有限公司是国内新一代 “端到端可溯源可解释的AI机器学习引擎”研发商。

魔数智擎自主研发的端到端可溯源可解释的AI机器学习平台,融合资深数据专家经验,深度优化AI算法底层代码,打开传统黑盒模型,让普通业务人员能读懂模型构建原理,无需数据科学专家即可进行从数据到建模全流程的操作,输出贴合业务场景的可解释模型报告与解决方案,让决策更智能高效。

魔数智擎主要面向银行、消费金融、证券等金融机构,现已成功服务招商局、腾讯、建行、银联智惠、360金融、京东数科等知名企业,帮助持牌金融机构搭建行业领先的金融AI机器学习平台,落地了风险控制、精准营销、CRM客户管理、个人信用风险评分等业务场景的 AI 赋能,助力金融机构提升自主风控能力和企业数据变现能力。

挑战

目前绝大部分金融行业数据建模中高度关注“模型高精度”,模型仅输出一个高精度结果,没有解释性作为支撑,意味着模型将赌博式落地,在这过程中企业需要承担未知的风险。但基于金融行业的业务具有严肃性和严格的政策规定的性质,需要预测风险模型具有良好的解释性,而传统黑盒模型一直难以满足行业的需求。另外行业存在AI 技术使用门槛高问题,金融机构中大部分业务分析人员对AI机器学习的了解有限,难以有效的利用AI来为他们服务,除此之外要确保拥有贴合业务的高质量模型,需要具备集技术、数据、业务多维度经验知识的团队一同协作完成,而具备这样条件的人才又十分稀缺难得。

与此同时,国内金融行业的新监管政策再次强调了持牌金融机构要严格落实自主风控原则,不得将核心的风控环节外包,并要求要对信贷资金的流向进行跟踪检查和监控分析。在此之前,持牌金融机构线上贷款的业务模式是采购第三方数据公司的征信分进行放贷,不参与核心的风控环节,由此催生了一系列数据公司。而在去年公安局的扫黑除恶行动对暴力催收、现金贷乱象、信息泄露等现象进行大整顿后,业内一系列知名的数据公司均停止了相关数据服务。意味着在当前强监管时代下,金融机构要想合规运营,必须拥有自主建模和数据追溯的能力。

因此,在金融行业搭建AI机器学习平台主要有以下几大挑战:

一是算法。过去金融行业的黑箱算法模型带来太多的不确定性和风险,模型可解释、数据可溯源是当下金融行业对算法提出的新要求。算法只有构建能被理解的白箱模型,企业才能够控制风险让模型平稳落地。同时支持高度透明的数据溯源,甚至直接追溯到原始数据源表,让操作人员能够随时在任意节点进行复盘、查疑、监控等,也是金融行业对算法提出的重要需求。

二是算力。从精准营销到数字运营,从风控管理到数据安全,当前金融行业几乎每一个业务环节都和大数据密不可分。与此同时,AI技术正在加速渗入,颠覆传统的业务模式。AI相关的算法模型的复杂度与数据维度紧密相关,面对动辄百万级的业务数据,用户需要大量算力进行模型训练。因此,对于AI机器学习平台而言,算力已经成为制约效率的一个无法忽视的因素。

方案

1、端到端可溯源可解释的AI机器学习平台基于NVIDIA CUDA的cupy包,有效加速numpy、pandas计算:当数据量级1000w以上时,numpy矩阵计算速度较CPU极限提升314倍;在实际项目整体数据科学计算流中,根据算子不同,速度普遍提升3-27倍。基于NVIDIA CUDA的C++底层加速,有效提升算法底层矩阵运算速度:实际项目中,在数据量大于1000w时,底层算法提升3.2倍。高倍的效率和速度可以在风险控制中做出更快的反应,从而带来巨大的收益。

2、极大缩短了数据处理和模型的开发时间,以往的数据处理流程需耗时2个月甚至更长时间,尤其当数据维度较高时,数据预处理流程会严重影响整个建模流程的效率,增大时间成本。魔数智擎的AI机器学习平台利用NVIDIA CUDA 9.0 和NVIDIA Tesla V100极大地提升了数据预处理功能的算力和平台的并行计算能力,现已将数据处理流程缩短至1周,以及建模周期缩短至3~5天,能让业务人员将更多时间专注于业务本身。

3、极大的加快了智能风控策略规则的生成时间,当训练数据维度很大时,模型的训练以及规则搜索速度会很慢,从数据预处理、模型训练、规则提取、模型部署应用到实际业务场景中的整个流程需耗时一个月以上。在 NVIDIA CUDA 9.0 和NVIDIA Tesla V100 的助力下,Magic Engine机器学习平台的数据预处理流程较原来提升了近十倍,模型训练速度提升了20倍以上,将整个风控策略规则的生成时间从一个月缩短至一周以内,极大的方便策略研究人员从海量的数据中快速提取规则策略,快速部署上线。

目前,魔数智擎MagicEngine机器学习平台以其可解释、可溯源、自动化能力受到金融行业客户的高度评价和认可。魔数智擎将晦涩难懂的AI技术结合金融资深专家经验固化封装成可视化的、贴合业务的AI系统,赋能业务人员,机构无需苦于业务人员不懂AI的困境,大幅降低使用门槛,进而瞬间提升团队整体AI能力。同时,MagicEngine机器学习平台也在不断升级其系统架构,提升其对大数据的扩展和支持能力,在算法和算力层面持续进行优化和扩展,提高整体建模效率。

影响

利用NVIDIA CUDA 9.0 和NVIDIA Tesla V100 加速魔数智擎AI全流程速度。

在魔数智擎AI机器学习平台上,用户能以极低门槛从数据到建模全流程进行操作,无需算法专家、不用IT编程能力,仅通过图形化操作界面点击5步鼠标就能完成数据建模,输出贴合业务场景的可解释模型报告与解决方案,将传统需耗时2个月缩短至1周以内甚至可以更短。极大幅度的降低时间成本,让用户从复杂繁琐的重复性工作中解放,将精力专注于行业业务本身以及业务创新当中。

魔数智擎 CEO 柴磊表示:“金融行业是最受关注的人工智能应用领域,一方面由于日趋严格的监管政策,对持牌金融机构的合规运营提出了要求,需要持牌金融机构自主把控核心风控环节,具备自主建模与数据溯源能力。另一方面人工智能技术逐渐回归业务本身,推动传统金融企业向普惠金融、智能金融等方向转型发展。

结合NVIDIA 提供的 GPU 解决方案,魔数智擎研发的端到端可溯源可解释的AI机器学习平台,解决了建模技术耗时长、门槛高与AI难以融合业务的难题,帮助持牌金融机构合规运营,提升企业数据变现能力。我们将继续深入行业,进一步助力企业在业务流程、业务开拓等方面得到全面的智慧提升,实现金融风控、营销、服务等方面的智慧化,让人与AI共同成长。”

 

www.nvidia.com

© 2020 NVIDIA Corporation. All rights reserved.

h2{ color: #76B900; }