表现期和观察期

评分卡模型是一个”预测”模型，预测的对象是未来一段时间的违约的概率。
（1）未来
（2） —段时间
（3）违约
预测需要的信息是当前及过去一段时间的信息。
两个要素：
（1）当前及过去
（2）一段时间
假设我们基于今天某批申请者的信息来建立评分卡模型预测未来一
约概率，这是不可能的，因为我们没有开”上帝之眼”，不知道这批违约行为。
所以，只能拿那些己经有了完整的表现期的历史申请数据来做模型。
假设今天是2017-4-16,那么2016-4-16的申请者（并且是成功放贷的）的一年表现期已经知道
表现期为2016-4-16~2017-4-16，那么观察期就是2016-4-16以及之前的一段时间的窗口。

– 观察期：构造特征的时间窗口。就是时间轴左侧，主要是用来生成用户特征的时间区间，不宜太长也不宜太短，一般为1年到3年左右
– 观察点：这个点并是一个具体的时间点，而是一个时间区段，表示的是客户申请贷款的时间，用来搜集那些用来建模的客户样本，在该时间段申请的客户会是我们用来建模的样本
– 表现期：定义好坏标签的时间窗口，如果在该窗口触发坏定义，就是坏样本，反之就是好样本。时间区段，一般是6月到1年左右，一般最常用的是定义为坏样本的指标有：M3+逾期、M3以内逾期中定义为失联、欺诈、身份盗用等情况，这些需要看自身业务情况而定

补充说明：
1.观察点的设计：
观察点的设计有额外的讲究，其中涉及到一个Mob的概念。而所谓Mob，全称month on book，等于观察点减去贷款发放时间。所以，观察点的设计在于贷款发放时间往后推Mob期，Mob的长短关系到模型的观察期以及观察期生成的时间切片变量。

2.观察期过长或过短的影响：
– 一个过长的观察期，可能会导致客户不在你的mob内，大批样本无法进入模型
– 一个过短的观察期，则会导致样本无法生成足够多有效的时间切片变量

3.时间切片变量：
– 时间区段的行为变量，例如过去3个月平均消费金额、过去6个月消费平均次数等

举例说明

假如，现在我们的模型表现期为1年，观察期为1年，观察点为什么时候呢？也就是说当我们有一个客户在2018-1-1号来申请贷款，贷款机构需要用现有的模型对该申请人进行一个申请评分，评估他未来表现期内触发坏样本属性的概率，那么该模型采用的客户样本是什么时候申请进件的？
答案：因为上面定义的表现期是1年，那么往前推一年，观察点大概为2017-1-1号左右某段时间区间，因为观察期也是1年，所以再往前推1年（即观察期：2016-1-1到2017-1-1），利用这1年即：2016-1-1到2017-1-1)所有观察点内申请人一些信息建立模型的观察变量，然后再往后推一年（即表现期：2017-1-11到2018-1-1），所有在观察点内的申请人在这一年时间内即2017-1-11到2018-1-1)的表现情况来定义违约。然后来训练出一个模型。对2018-1-1号的申请人进行评分。所以申请评分卡模型有着天然的滞后性，需要不断的对其模型进行监控。

举例说明

Published by

风君子

发表回复取消回复

举例说明

Published by

风君子

发表回复 取消回复

发表回复取消回复