ks的计算往往有助于更好地理解该指标的深层含义。
下图了解风控模型—深入了解分区评价指标(KS )的应用
在上述计算过程中主要有两点不是特别清楚,即cum_bad_rate和cum_good_rate
cum_bad_rate是当前和先前区间中累计bad数目的和,以得到除了所有bad样本数目(例如,(88 65 )/342=44.74% )之外的good的相应计算(在计算时)
最后,观察到分箱中最大的ks值是最终的ks值,此时也可以确定最佳分割阈值(相应的不同分箱和分箱粒度影响最终结果) )。