IV计算公式,变量iv值计算
建模时,我们预测单个变量的预测能力,主要用IV值这个指标。IV值的预测能力如下:
IV=0.02:无预测能力;
0.02-0.1:预测能力弱;
0.1-0.3:预测能力中等;
0.3-0.5:预测能力强;
大于0.5是超强预测能力;
计算IV值的公式:
Pgood_section_total:子盒子里的好用户占整体好用户的比例;
Pbad_section_total:子盒不良用户占整体不良用户的比例;
Pgood_section:好用户占整个子盒子的比例;
Pbad_section:子盒中不良用户占整个子盒的比例;
Pgood_total:好用户占整体的比例;
Pbad_total:好用户和整体的比例;
Python实现逻辑:
d1=pd。DataFrame({X:data[type], Y :data[ seriousdlqin 2 yers ]})D2=D1 . group by([ X ],As_index=True)#单个要素的数量good=data[ seriouslqin 2 yers ]。sum()bad=data[ seriouslqin 2 yers ]。count()-good D3=PD . data frame(D2 . x . count(),columns=[ good _ count ])D3[ good _ count ]=D2 . sum()yd3[ total _ count ]=D2 . count()yd3[ rate ]=D3[ good _ count ]/D3[ total _ rate ]=D3[ good _ count ]/good D3[ jzdwdm _ rate ]=(D3[ total _ count ]-D3[ goodsum()print (d3)print (IV=,IV)
Excel实现逻辑:
Excel特定公式可从以下资源下载: