基于标准数理统计理论的信用评分模型是对大量的个人消费贷款的历史信用数据进行科学的归纳、总结、计算而得到的量化分析公式。在美国,不同的行业有不同的信用评分模型来帮助专业人士进行信用风险管理,如表1所示: 表1美国不同行业常用信用评分模型表 从概念上讲,信用评分就是利用消费者过去的信用表现来预测其未来的信用行为,如图1所示。 信用评分模型的关键是科学合理地选出信用变量,并产生一个公式。信用评分模型的统计方法有线性概率模型、logit模型、probit模型以及线性判别(discriminant)分析方法。
(1)线性概率模型 线性概率模型假设违约概率y与信用变量x之间的关系是线性的, 用于解释过去信用行为(违约或不违约)的信用变量及其重要性(系数)被用来预测未来的信用行为。线性概率模型数学表达如下: 根据历史样本数据进行优化计算,得出系数βj的估算值。
(2)logit信用评分模型 logit信用评分模型是采用数理统计的logit回归方法建模分析。logit信用评分模型的分析方法如下: 这里,y∈{0,1}是二元响应变量,表示信贷状况;为logit概率累积分布函数。当xj属于度量变量时,xj表示为第j个可度量变量;当xj属于范畴变量时,xj表示为哑元变量向量。
(3)probit信用评分模型 probit 模型同样能够把违约概率的预测值限制在0和1之间。它与logit模型的不同在于probit模型假设违约概率服从累积正态分布(cumulative normal distribution),即
(4)线性判别模型 判别模型根据过去观察到的借贷者的信用特征,把他们划分成高违约风险和低违约风险类别。线性判别模型(linear discriminant model) 假定信用变量对这种划分的影响是线性的。 2.数据挖掘技术 数据挖掘从大量数据中提取或“挖掘”知识,其任务可以分为描述和预测两类,用于信用评估,可对客户进行分类、聚类、关联规则发现、预测、偏差检测等。其中多数用分类、关联规则发现和预测方法进行个人信用评估。
(1)分类 按分析对象的属性、特征建立不同的组类描述事物。它基于对类标记已知的数据对象的分析,导出描述并区分数据类或概念的模型(或函数),用以预测类标记未知的对象类。导出模式可以用分类规则、判定树、数学公式或神经网络等形式表示。
(2)关联规则发现 某种事物发生时其他事物会发生的一种联系,这些规则展示属性-值频繁地在给定数据集中一起出现的条件,关联规则形式:x=>y,即“a1∧...∧am=>b1∧...∧bm”。
(3)预测 把握分析对象发展的规律,对未来的趋势作出预见,其表示形式与分类同。 三、一种基于历史记录规则相似性的综合评估方法