表现期和观察期

评分卡模型是一个”预测”模型,预测的对象是未来一段时间的违约的概率。
(1) 未来
(2) —段时间
(3) 违约
预测需要的信息是当前及过去一段时间的信息。
两个要素:
(1) 当前及过去
(2) 一段时间
假设我们基于今天某批申请者的信息来建立评分卡模型预测未来一
约概率,这是不可能的,因为我们没有开”上帝之眼”,不知道这批违约行为。
所以,只能拿那些己经有了完整的表现期的历史申请数据来做模型。
假设今天是2017-4-16,那么2016-4-16的申请者(并且是成功放贷的)的一年表现期已经知道
表现期为2016-4-16~2017-4-16,那么观察期就是2016-4-16以及之前的一段时间的窗口。

– 观察期:构造特征的时间窗口。就是时间轴左侧,主要是用来生成用户特征的时间区间,不宜太长也不宜太短,一般为1年到3年左右 
– 观察点:这个点并是一个具体的时间点,而是一个时间区段,表示的是客户申请贷款的时间,用来搜集那些用来建模的客户样本,在该时间段申请的客户会是我们用来建模的样本 
– 表现期:定义好坏标签的时间窗口,如果在该窗口触发坏定义,就是坏样本,反之就是好样本。时间区段,一般是6月到1年左右,一般最常用的是定义为坏样本的指标有:M3+逾期、M3以内逾期中定义为失联、欺诈、身份盗用等情况,这些需要看自身业务情况而定

补充说明: 
1.观察点的设计: 
观察点的设计有额外的讲究,其中涉及到一个Mob的概念。而所谓Mob,全称month on book,等于观察点减去贷款发放时间。所以,观察点的设计在于贷款发放时间往后推Mob期,Mob的长短关系到模型的观察期以及观察期生成的时间切片变量。

2.观察期过长或过短的影响: 
– 一个过长的观察期,可能会导致客户不在你的mob内,大批样本无法进入模型 
– 一个过短的观察期,则会导致样本无法生成足够多有效的时间切片变量

3.时间切片变量: 
– 时间区段的行为变量,例如过去3个月平均消费金额、过去6个月消费平均次数等

举例说明

假如,现在我们的模型表现期为1年,观察期为1年,观察点为什么时候呢?也就是说当我们有一个客户在2018-1-1号来申请贷款,贷款机构需要用现有的模型对该申请人进行一个申请评分,评估他未来表现期内触发坏样本属性的概率,那么该模型采用的客户样本是什么时候申请进件的? 
答案:因为上面定义的表现期是1年,那么往前推一年,观察点大概为2017-1-1号左右某段时间区间,因为观察期也是1年,所以再往前推1年(即观察期:2016-1-1到2017-1-1),利用这1年即:2016-1-1到2017-1-1)所有观察点内申请人一些信息建立模型的观察变量,然后再往后推一年(即表现期:2017-1-11到2018-1-1),所有在观察点内的申请人在这一年时间内即2017-1-11到2018-1-1)的表现情况来定义违约。然后来训练出一个模型。对2018-1-1号的申请人进行评分。所以申请评分卡模型有着天然的滞后性,需要不断的对其模型进行监控。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注