摘 要
在银行客户信贷信用评估分析中,由于数据中的大量名义变量,决策树经常被用来进行数据分类。而寻找最优决策树是 NP-Hard 问题,因此一般都会使用贪婪算法快速求解,但贪婪法一般不能得到全局最优解。本文中采用新的方法,利用遗传算法直接演化决策树,在可接受时间内寻找最优解。并在此基础上整合 logistic 回归和多层前向感知机等两种方法构造信用评估系统,对客户信用进行分析。
关键字:遗传算法,决策树,信用评估系统
目录
引言 ...............................................................................................................................1
1 银行客户信用评估分析中的遗传算法和决策树方法...........................................2
1.1 遗传算法.............................................................................................................2
1.1.1 遗传算法的原理..........................................................................................2
1.1.2 遗传算法的结构..........................................................................................3
1.1.3 遗传算法的特点..........................................................................................5
1.2 决策树方法.........................................................................................................6
1.2.1 决策树方法的原理......................................................................................6
1.2.2 决策树方法的结构......................................................................................7
1.2.3 决策树方法的特点......................................................................................7
2 用遗传算法演化决策树 ...........................................................................................9
2.1 遗传算子的选择.................................................................................................9
2.2 反馈函数...........................................................................................................10
2.3 计算复杂度.......................................................................................................12
2.4 用遗传算法生成决策树的优势.......................................................................14
3.实证分析 .................................................................................................................15
3.1 数据预处理.......................................................................................................15
3.2 无规模控制算法设计.......................................................................................17
3.3 有规模控制算法设计.......................................................................................19
4 遗传算法演化决策树结果讨论..............................................................................22
5 信用评估系统 ..........................................................................................................23
5.1 决策树与 LOGISTIC 回归.....................................................................................23
5.1.1 Logistic 回归简介..................................................................................23
5.1.2 利用 Logistic 回归评估客户信用.........................................................23
5.2 决策树与多层前向感知机...............................................................................25
5.2.1 多层前向感知机简介...............................................................................25
5.2.2 利用多层前向感知机评估客户信用.......................................................26
5.3 利用决策树,MLP 和 LOGISTIC 回归构造信用评估系统..................................27
6 结论 ..........................................................................................................................29
参考文献 .....................................................................................................................30
附录 1 无规模控制算法设计交叉率及变异率试验结果........................................31
附录 2 无规模控制算法设计结果............................................................................32
附录 3 有规模控制算法设计规模控制常数实验....................................................40
附录 4 有规模控制算法设计结果............................................................................41
附录 5 MLP 神经网络 MATLAB 实验设置及结果.......................................................46