第一部分:为什么我们需要度量风险?
公司不同的角色有不同的需求。
1.对管理层来说,通过量化的方法了解公司的资产质量以及对未来趋势的预测,避免做出盲目决策。
2.对公司风险决策层来说,了解公司风险运营质量,以及各个部门的运营指标,可以确定风险后续的操作。
3.对基层风险分析师来说,(1)根据目标变量进行风险策略分析;(2)确定目标变量后可以做评分卡;(3)可以帮助公司管理层和决策层做风险报表。
目前行业的做法,在监管要求下,巴塞尔3协议中对违约的定义是超过90天的逾期。
之所以定为90天,是因为对大多数的信贷资产来说,当到了90天的逾期后,这部分资产变成坏账的可能性已经超过70%。
对于长期评分或者征信局评分(比如小白信用分、芝麻信用分、央行征信报告数字解读)的核心需求是分数需要很稳定,这种情况选择目标变量时需要清晰定义用户行为,因此通常选择6个月的逾期,也就是180天的DPD。(DPD指:逾期了多少天)
在企业内部通常会定制评分,定制评分是为了满足风险控制的目标而做的模型和策略分析。
为什么标注m1的旁边还标注了C,主要原因是m是自然月的概念,但对于信用卡或者其他还款周期较长的贷款产品,有时也会根据预期的账单周期来定义逾期,而每个月账单日和自然月又不完全一致。
第二部分,风险报表里,逾期率如何定义?
定义逾期率有两个大类口径:分别是人数的逾期率和金额的逾期率。
金额通常和收益率挂钩,而在数据风控领域,是基于大数据做风险决策。所以看人数逾期率,从感觉上更符合逻辑。
使用金额逾期率需要注意,业务量较小的时候,金额逾期率的数字可能会被几个特别大的金额污染,所以每次计算金额逾期率的时候,需要对金额本身的分母特别了解,在某些极端情况下要剔除值很大的样本,保证得到相对准确的数据。
通过金额逾期率和人数逾期率的比较也可以得到很多额外信息。比如金额逾期率大于人数逾期率时,就说明额度策略没有做好;当人数逾期率大于金额逾期率,说明额度策略做的不错,原因是额度比较高的客户逾期率较低。
逾期率的定义有两类:第一类vintage指标,有些书上也叫递延指标。这类指标用在授信风险管理里的监控、建模以及预测资产变化趋势。这种口径下,逾期率的分母包含一个时间段内所有放款的金额或者人数,分子是在这段时间段内对应的资产在一个固定表现窗内的逾期金额或者人数。
举例:“宜人贷财报中,关于逾期90天以上借款的累计净坏账率:截至2017年12月31日,2015年促成所有借款的累计净坏账率为9.3%”,这个指标就接近vintage指标。
严格的来说,当我们定义vintage指标的时候,对于不同申请日期或者不同放款日期的资产,要有相同的performance window也就是常说的表现窗,这样定义出来的vintage指标才具有更好纵向比较的性能。因为vintage 指标主要用在不同时期内放款资产的质量。
除了vintage这一类逾期率,还有一类逾期率叫资产质量指标,有些书上也叫即期指标,这类指标主要用在财务报表和循环类授信组合风险管理上,分母主要是当前所有应收账款,分子一般是处于某个固定逾期阶段的应收金额或者人数。
举例,“2017年,宜人贷净收入55.43亿人民币,净利润13.72亿人民币,截至2017年12月31日,平台逾期15-29天、30-59天、60-89天借款的逾期率分别为0.8%,0.9%和0.7%。”,从表象看,这里的逾期率更像资产质量指标,0.8%的分母是指截至2017年12月31日宜人贷拥有的所有信贷资产,分子是处于15-29天的逾期规模。
和vintage指标不同,资产质量指标最大特点是选取一个时间截面所有的在贷资产,也就是应收账款来计算。这里不管分子、分母,每一笔资产截止计算时间点所对应的的表现窗都不一样,同时资产质量指标里有一个最大的特点是,已结清的资产是不会出现在资产质量指标的分子或者分母里,但是已经结清的资产是很有可能出现在vintage 指标的分母里。
第三部分:在进行风险策略分析和建模的时候,目标变量是如何定义的?
上面的风险报表分析是是针对一个群体。但在建模时,我们的目标变量是针对每一个个体,此时定义目标变量有3个维度需要考虑:类型、程度、样本。
1在建模过程中,因变量通常有,连续型、序数型、二元型。
2在选择样本时要保证所有的样本有相同的表现窗。
定义目标变量有3个原则:(1)永远要满足业务目标;(2)保证定义的行为是精准的;(3)保证样本质量和y的样本数量、比例。
最后,张岩老师针对生存分析在评分卡领域的应用也做了补充讲解。
本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。