大数据风控已经不是一个陌生的名词,其发源和很多行业一样,也是想通过机器决策的方式来替代人工。在我国,高速发展的经济背景,不断提高的金融渗透率,庞大的人口基础是这一行业发展的基础。大数据风控的意义是存在的,只是其应用范围和方式值得讨论。
首先,大数据风控的原理,是基于用户的基本信息,就能推断出用户的信用状况,那么决策的基础就是数据,互联网上的数据。如果要决定一个用户是否可以放贷,放贷多少,最简单的方法是考量他的收入,拿多少钱,或者资产,有多少房车等等,但是很遗憾,收入信息或者资产信息作为一个人的隐私,是没有办法直接获取的。而优质客户有多优质,恰恰更多提现在这两点上,所以这就意味着大多数的大数据风控,都是针对资质普通或者较次级的客户来做的,因为你有多少资产我不知道,也就是我不知道你有多好,但你借过几次钱我知道,我知道你有多坏。所以用互联网数据来衡量一个客户有多坏,只要不是那么怪就可以贷款,是目前很多大数据风控公司的做法。
因为数据风控本质是依赖互联网数据的,而数据可以分为公有数据和私有数据。公有数据是市面上很多第三方公司提供的,只要出钱就可以采购到的,比如一些第三方评分,黑名单等,而私有数据就是少数巨头公司,依托大量用户在自己平台上积累下来的数据,比如支付宝,腾讯,京东等等,这些私有数据往往是覆盖人群极其广泛的,而且是独有的,那么这些公司在做风控的时候就有巨大的优势,所以我们看到为什么芝麻信用分那么准,为什么腾讯的反欺诈做得那么好,为什么支付宝即使对于重金投资的公司也不透露一丝一毫的数据,因为这些数据在做风控的时候太重要太关键了。根据一个人在支付宝上每月的支付流水,大体就知道他的支付能力了,这是其他风控公司不可替代的能力。
所以如果想风控做得精准,最核心的还是数据。要想办法获取覆盖面广,实用性强的数据,如果外面获取不了,只能打入拥有这些数据的公司内部了。