赞
踩
一、项目介绍
数据来源于kaggle平台(欧洲持卡人2天内的28万笔+信用卡交易),需通过信用卡历史交易数据进行机器学习,构建“信用卡反欺诈数据模型”,从而提前发现客户信用卡被盗刷的事件。
二、构建模型
三、python代码
最优阈值:
阈值越小,recall值越大,模型能找出信用卡被盗刷的数量就更多,但是误判的数量也较大。随着阈值逐渐变大,recall rate逐渐变小,precision rate逐渐变大,误判的数量也随之减少。通过调整模型阈值,控制模型反信用卡欺诈的力度,若想找出更多的信用卡被盗刷就设置较小的阈值,反之,则设置较大的阈值。
实际业务中,阈值的选择取决于公司业务边际利润和边际成本的比较;当模型阈值设置较小的值,确实能找出更多的信用卡被盗刷的持卡人,但随着误判数量增加,不仅加大了贷后团队的工作量,也会降低误判为信用卡被盗刷客户的消费体验,从而导致客户满意度下降,如果某个模型阈值能让业务的边际利润和边际成本达到平衡时,则该模型的阈值为最优值。当然也有例外的情况,发生金融危机,往往伴随着贷款违约或信用卡被盗刷的几率会增大,而金融机构会更愿意不惜一切代价守住风险的底线。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。