zestfinance大数据征信技术

标签:
大数据征信 |
分类: 数据挖掘 |
zestfinance大数据征信技术学习总结
学习与借鉴
(1)模型起到一定的作用,重点在于能够收集到多少用户的准确数据;因此,各个企业重点在通过各种手段,收集用户的数据;
(2)在(1)的基础之上,结合现有的数据,结合业务特点,构建不同纬度的子模型,最后通过ensemble的方法,将子模型和业务规则进行集成,生成对应的分值;
(3)数据和模型是死的,无论怎么样,都能计算个分数出来,重点是对业务的理解;
(4)银行数据才是最重要的,其他都是辅助作用。
1.zestfinance介绍
1.1 大数据征信
fico信用评分模型参考的数据变量较少,
多年来,美国金融机构都在用50条左右数据变量来决定是否给一个客户授信,问题在于,许多人没有完整的信用记录,
这导致在传统信贷中他们不断吃闭门羹
1.2 zestfinance
zestfinance
2010年成立,google员工创立,意愿是将google算法带入征信领域。
zestfinance还有一个重要的组成部分,zestcash,类似于一家小贷公司,直接给那些没有银行账户
或者信用记录不好的人提供小额贷款。
传统信用评估服务无法覆盖全体人群,特别是弱势群体
传统信用评估模型信息维度比较单一,支付历史,未尝债务,信贷时长,争取新信贷和信贷组合
传统信用评估模型时间上比较滞后(08年金融危机爆发之后发现大量坏账的现实不符合)
1.3 大数据征信公司
2.zestfinance征信体系架构
2.1 体系框架
2.2 数据
zestfinance官网上有这样一句话:所有的数据都是信用数据
zestfinance数据来源较为丰富,包括结构化的数据和非结构化的数据
大数据征信数据
1 第三方数据,传统信贷数据,搬家次数,法律记录等等
2 用户提交的数据,通讯记录,水电煤账单,调查问卷等等
3 互联网数据,网络行为,社交网络等等
2.3 十大模型
zestfinance收集约3500数据来源,提取70000+数据变量,构建10个预测分析模型,通过集成学习或者多角度学习,得到最终的消费者信用评分。
模型主要包括:身份识别类模型,风险类模型,价值计算类模型。
3.参考资料
http://www.creditchina.gov.cn/newsdetail/68
http://www.creditchina.gov.cn/home
http://www.zhihu.com/question/21094114