数据科学团队使用RAPIDS提供更智能、更快速的模型。
Paul Edwards致力于推动传统贷款业务迈向现代化AI时代。
Edwards在攻读数字生态学博士学位时期,开始进行动物行为建模,这也是他职业生涯的起点。随后,他走出实验室,带领着丰业银行在多伦多的一组数据科学家,探索机器学习如何完善信用风险预测。
该团队认为,机器学习既能够帮助银行盈利,也能够帮助更多需要贷款的人们获得贷款。他们计划在今年晚些时候分享自身技术,以期推动整个行业的发展。
计分卡演进史——从铅笔时代走向AI时代
早在1950年代,计分卡还是使用纸和铅笔来计算分数。贷款人员会对申请人就标准问题的回答进行评分,如果结果超出计分卡的设定阈值,则银行可发放贷款。
随着计算机的兴起,银行用数字计分卡代替了物理计分卡。几十年前,他们决定采用一种称为“证据权重逻辑回归”的统计模型。如今,该模型已得到广泛应用。
计分卡的一大优点是清晰明了。银行能够轻松地向客户和监管机构解释其贷款标准。这就是为什么在信用风险领域,计分卡成为了可解释模型的黄金标准。
Edwards表示:“我们可以打造比计分卡更大型、更复杂、更准确的机器学习模型,但当这些模型的规模达到一定程度之后,就很难向老板或监管机构解释。”
机器学习模型可节省数百万美元
因此,该团队开始寻求新的方法,即通过机器学习来构建计分卡,并研究出一种被称为boosting的技术。
他们从一张很小的计分卡上的一个问题开始,依次添加问题。当添加的新问题会使计分卡过于复杂以致无法解释或无法提高性能时,便会停止继续添加。
由此方法产生的结果,并不比传统证据权重模型更难解释,反而通常还更准确。
“我们通过boosting构建了几个决策模型,发现证据权重提高了几个百分点。对银行所有申请者来说,几个百分点就意味着数百万美元。” Edwards说道。
XGBoost升级以加速计分卡
由于Edwards的团队一直基于NVIDIA DGX系统,使用一种名为XGBoost的常用库,因此他们了解加速boosting模型的潜力。GPU加速的代码非常快,但缺少生成计分卡所需的功能,而记分卡是确保模型简单的关键工具。
NVIDIA高级数据科学家Griffin Lacey及其同事一同明确并添加了这项功能,该功能现在是RAPIDS中XGBoost的一部分。RAPIDS是一套用于在GPU上运行数据科学的开源软件库。
从结果上来看,丰业银行现在使用单一GPU生成记分卡的速度比过去需要24个CPU的速度快了6倍,从而为该银行设定了新的基准。“结果上看起来是轻松简单的解决方案,但我们凭一己之力是永远无法完成的。” Edwards表示。
GPU加快了数字计分卡的计算速度,在助力银行提高准确性的同时,提高了模型的可解释性。“当我们的模型更加准确时,值得信任的贷款者就会得到他们所需的信任。” Edwards如是说。
借力RAPIDS迈入AI时代
展望未来,Edwards希望基于过去几十年来机器学习领域的进步,为计分卡更新换代。例如,他的团队正在与NVIDIA合作,构建一套用于计分卡的Python工具,这些工具具备当今数据科学家所熟悉的特性。
“NVIDIA团队正在帮助我们将RAPIDS工具用于工作流程中,以开发计分卡,同时引入了诸多现代化功能,如Python支持、超参数调整和GPU加速等。”Edwards说道。“我们相信,在六个月内,我们就可以共享示例代码和方法。” 他补充道。
借助此类工具,银行就能使构建计分卡的工作流程变得更加现代化并实现加速,从而告别当前手动调整和测试参数的做法。例如,通过GPU加速的超参数调整,开发者就能在午餐时间让计算机测试100,000个模型参数。
有了更广的选择范围,银行就能从准确性、简单性、稳定性、或所有这些因素的平衡等角度出发,选择所需的计分卡。这就有助于银行做出清晰、可靠的贷款发放决策,并确保优质客户能够获得所需的贷款。
深入研究深度学习
丰业银行的数据科学家使用其DGX系统,同时处理多个实验。他们调整计分卡,运行XGBoost,并完善深度学习模型。“这确实改善了我们的工作流程。” Edwards说道。
“从某种意义上说,购买该系统的最大收益就是后续可获得的所有支持。”他补充说。其中,包括全新的、即将推出的RAPIDS功能。
从长远来看,该团队正在探索利用深度学习来更快速地明确客户需求。借助深度学习,用于计算信用风险的实验模型性能比最佳的计分卡还高出20%。
此外,新兴的生成式模型可以创建具备模拟真实银行数据功能、但不包含特定客户信息的综合数据集。这些新兴模型有望推进合作,加快创新步伐。
通过Edwards团队的工作,反映出银行业对AI关注度和采用度与日俱增。
“去年,对信用风险部门的年度调查显示,每家参与调查的银行至少都在尝试接触机器学习,而许多银行已将机器学习融入工作日常。” Edwards如是说。
IT解决方案
产品品类:
云与数据中心、深度学习和人工智能、设计和专业视觉化、NVIDIA CLARA、高性能计算、NVIDIA DRIVE 平台、GEFORCE、GPU 服务器
产品品型:
JETSON NANO、JETSON XAVIER NX、JETSON AGX XAVIER、JETSON TX2、数据中心 GPU、DGX 系统、HGX、EGX、NGC、虚拟 GPU、DGX 系统、NGC、NVIDIA TITAN RTX、TESLA 、T4 企业服务器、QUADRO、QUADRO VDWS、GRID VPC/VAPPS、NVIDIA TITAN RTX、IRAY、MENTAL RAY、QUADRO EXPERIENCE、TESLA、T4 企业服务器、DGX、DGX-2、NGC、GPU 云计算、NVIDIA A100、NVIDIA V100、NVIDIA T4、NVIDIA T4 企业服务、NVIDIA Tesla P100、NVIDIA Tesla P4/P40、NVIDIA HGX A100、NVIDIA DGX A100、NVIDIA DGX-2、NVIDIA DGX-1、NVIDIA DGX、NVIDIA EGX 平台、NVIDIA EGX A100、NGC、RTX 服务器、GRID vPC/vAPPs、Quadro 虚拟工作站、TESLA T4显卡
产品品牌:
NVIDIA 英伟达
解决方案:
nvidia控制面板、nvidia是什么意思、nvidia geforce gtx 750 显卡怎么样、nvidia显示设置不可用、nvidia控制面板怎么设置玩游戏最好、nvidia官网、nvidia显卡、nvidia arm、英伟达公司简介、nvidia官网网址、nvidia干嘛用的、nvidia和amd显卡区别、nvidia有必要安装吗、英伟达官网、英伟达显卡、英伟达显卡排名天梯图、英伟达驱动、英伟达是哪个国家的、英伟达和amd、英伟达和英特尔的关系、英伟达收购arm最新消息、英伟达30系显卡、英伟达2070、英伟达市值、英伟达rtx30系列显卡、GPU 服务器
应用场景:
游戏开发、医疗保健和生命科学、高等教育、工业、媒体与娱乐、零售、智慧城市、超级计算、电信、运输、金融
更多品类和方案、价格 请咨询:
成都科汇科技有限公司
地址:成都市人民南路四段1号时代数码大厦18F
电话:400-028-1235
QQ: 1325383361
手机:180 8195 0517(微信同号)