析来看,贝叶斯分类器基于概率的思想,在五而相对较差。模型应用分析与限制个人信用评估模型应用分析在个个人信用评估模型建立起来之后,如何成功地实施这个模型会涉及很多问题使用什么样的临界分值是否完全依赖信用评估模型给出的分数以及如何对评估模型给出的分数进行修正等等。临界分值的选择消费信贷申请客户的个人信用得分在什么区域内可以被认为是违约风险较小的客户,从而批准该申请人的贷款申请,即如何确定违约客户与履约客户的的临界分值问题,是需要解决的重要问题。在信用评估领域的基本准则之就是信用评结果的稳定性,也就是说信用评估值在定时间内要稳定地保持在同水平上,即使个人情况发生些变动,信用评估值的变动也不宜过大。也就是说,如果商业银行目前的贷款申请批准率为,那么新的个人信用评分模型的临界分值设置的贷款申请批准率下降或上升都是不妥的。因此,在实际操作中可以根据银行既有的贷款申请批准率来决定个人信用评分的临界分值。个人信用评估值的人工修正由于我国商业银行在建立个人信用评估模型方面尚处于起步阶段,模型设计仍不够合理,消费信贷申请人的个人信息缺失情况比较严重,因此在个人信用评估模型给出客户的信用评分后,专业的信贷审批人员可以根据己有的审批经验对客户的信用评分和放贷决策进行修正。当贷款审批人掌握了建立信用评估模型时所不具有的信息,如个信用分数很高的申请人被卷入到项经济诉讼中,或信用分数很低的申请人刚刚得到了份新工作,在这种情况下,贷款审批人员可以根据实际情况对该申请人的信用评分进行重新评价。另外种情况是个客户按信用得分评价时会被拒绝但商业银行仍给予放贷。例如,如果授信机构长期来看,当地大学生可能是个潜在的客户群体,即使按目前的状况他们的信用评分无法达到临界分值,但贷款审批人员仍可能批准其中的部分人以期培养些忠诚客户。第三种情况是当贷款审批人感到申请人有种不能解释的违约倾向时,他的经验告诉他批准该申请是不明智的,此时审批人会采用人工修正。般情况下,商业银行会给予信贷审批人员定的人工修正权限,将个人信用评分在个合理范围内进行调整。二〇四年十二月十九日星期五个人信用评估模型应用限制虽然信用评估模型有许多优点,但是这些模型本身也有些限制。首先是拒绝推论。所谓拒绝推论,即申请被拒绝者的数这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因二〇四年十二月十径就形成了对相应对象的类别预测。决策树可以很容易转换为分类规则。基于算法的决策树运行效果图二〇四年十二月十九日星期五基于算法的决策树支持向量机方法支持向量机表个类别。树的最高层结点就是根结点。决策树的中间点通常用矩形表示,而叶结点常用椭圆表示。为了对未知数据对象进行分类识别可以根据决策树的结构对数据集中的属性值进行测试,从决策树的根结点到叶结点的条路量。贝叶斯算法运行结果图二〇四年十二月十九日星期五基于决策树的方法所谓决策树就是个类似流程图的树型结构,其中树的每个内部结点代表对个属性的测试,其分支就代表测试的每个结果,而树的每个叶结点就代假设个指定类别中各属性的取值是相互独立的。这假设也被称为类别条件独立,它可以帮助有效减少在构造贝叶斯分类器时所需要进行的计算则描述了如何根据,和计算获得的。有关的具体公式定义描述如下基本贝叶斯分类器是建方在基础之上的成立概率,也就是说若已知是个苹果,那它是红色和圆状的概率可表示为。由于,和的概率值可以从供学习使用的数据集合中得到,贝叶斯定理为事前概率,在上述例子中,就表示任意个数据对象,它是个苹果的概率,无论它是何种颜色和形状。与相比,是建立在更多信息基础之上的,而前者则与无关。类似的,之上的概率。例如假设数据样本是水果,描述水果的属性有颜色和形状。假设为红色和圆状,为是个苹果的假设,因此就表示在已知是红色和圆状时,确定为个苹果的假设成立的概率相反能。设为个类别未知的数据样本。为个假设,若数据样本属于个特定的类别,那么分类问题就是决定,即在获得数据样本时,假设成立的概率。是事后概率,或为建立在条件而构造出来的。对分类方法进行比较的有关研究结果表明简单贝叶斯分类器称为基本贝叶斯分类器在分类性能上与决策树和神经网络都是可比的。等。根据本数据样欠记录等属性进行分析,由此来对贷款人进行信用等级的划分,目前将其分为三个等级,属于对应信用等级的贷款人具有相应的贷款金额上限。问题与挑战对目前已有的贷款人数据的婚姻状况,个人年收入,固定资产估值,教育水平,有无历史拖欠记录等属性在平台上按等级进行划分,每个人的属性都属于不同的等级,全方位综合的将其分类为不同信用等级,以此作为训练集估测出个分类模型,对于今后需要贷款的人在此模型上进行评估以确定该贷款人的信用等级,信贷公司可依据此等级来确定对其的贷款金额的大小。二〇四年十二月十九日星期五第二章数据准备与预处理数据采集个人客户信用评级从婚姻年收入工作年限固定资产估值教育水平拖欠记录次数等六个方面来分析借款人的信用状况。在实际的商业银行环境中,并非对所有的大客户的个人信息都有科学的管理,根据我国商业银行的实际情况以及国外多家金融机构的信用评级情况,评估客户的信用情况要考虑四大主要因素申请人的自然情况职业情况家庭情况与银行的业务往来关系。这四大因素实际上是对信用评级体系的种综合反映,具体包括以下因素自然情况年龄性别婚姻状况健康状况文化程度住宅类型当前住宅居住时间职业情况单位性质职业职位职称在当前单位的工作年限月收入家庭情况家庭人均月收入家庭债务收入比例与银行的业务往来关系账户存款金额业务往来其他借款情况。由于实验时间和个人能力所限,经小组讨论后我们在四大主要因素中选取了婚姻年收入工作年限固定资产估值教育水平拖欠记录次数六个属性,其中婚姻划分三个等级,年收入工作年限固定资产估值教育水平拖欠记录次数均划分为四个等级,总共收集分数据样本。数据预处理初步采集的数据很多是不完整的有噪声的,所以在获取数据源后,需要进行数据的清洗和转换,使其符合数据挖掘算法的要求,并能够产生最为可靠和准确的结果。数据清理先对数据进行整理对噪声数据进行处理,以增加数据挖掘结果的准确性。对空值的处理空值出现的可能性很多,主要是由于数据采集时缺乏样本数据产生。对空值的处理有很多方法,比如最大频数填充平均值填充人工随机填充等。根据本数据样本的具体情况我们决定采用人工随机填充的方法。对噪声数据的处理可以采用分箱聚类回归等。本实验采用分箱的方法对噪声数据进行处理。二〇四年十二月十九日星期五数据变换在所得的原始信息中绝大部分的字段值都是字符值,为了在数据处理中,占用更小的空间和取得更快的计算速度,要把字符型的数据转化为数值型的数据。二〇四年十二月十九日星期五第三章建立模型与分类实现贝叶斯分类方法贝叶斯分类器是个统计分类器。它能够预测类别所属的概率。
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 14 页
第 2 页 / 共 14 页
第 3 页 / 共 14 页
第 4 页 / 共 14 页
第 5 页 / 共 14 页
第 6 页 / 共 14 页
第 7 页 / 共 14 页
第 8 页 / 共 14 页
第 9 页 / 共 14 页
第 10 页 / 共 14 页
第 11 页 / 共 14 页
第 12 页 / 共 14 页
第 13 页 / 共 14 页
第 14 页 / 共 14 页
预览结束,喜欢就下载吧!
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。