金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111587189.5 (22)申请日 2021.12.23 (71)申请人 江南大学 地址 214122 江苏省无锡市滨湖区蠡湖大 道1800号 申请人 浪潮卓数 大数据产业发展 有限公司 (72)发明人 谢振平 翟彬 陈丽芳 刘渊  崔乐乐 宋设 杨宝华  (74)专利代理 机构 南京禹为知识产权代理事务 所(特殊普通 合伙) 32272 专利代理师 刘小莉 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 一种基于 XGboost的金融信贷企业信用预测 方法 (57)摘要 本发明公开了一种基于XGboost的金融信贷 企业信用预测方法, 包括初步筛选, 筛选出与信 用评估有关的数据; 数据处理, 处理异常值缺失 值, 并对其进行分类; 特征工程, 对特征进行处 理; 划分数据集, 将数据分成训练集和验证集; 模 型训练, 通过Xgboost算法对训练集数据进行模 型的训练; 模型评估和优化, 通过验证集数据对 模型进行评估, 并对xgboost中的各个特征进行 分析, 根据情况对模型进行优化。 本发明所述方 法能够实现对企业信用的准确高效评估, 具有良 好的鲁棒性和稳定性, 并且能结合现有的评估体 系和结论进行进一步的解释和优化, 能够满足实 用性和性能的要求。 权利要求书1页 说明书4页 附图2页 CN 114492929 A 2022.05.13 CN 114492929 A 1.一种基于XGbo ost的金融信贷企业信用预测方法, 其特 征在于: 包括, 初步筛选, 筛选出与信用评估有关的数据; 数据处理, 处理异常值 缺失值, 并对其进行分类; 特征工程, 对特 征进行处 理; 划分数据集, 将数据分成训练集和验证集; 模型训练, 通过 Xgboost算法对训练集数据进行模型的训练; 模型评估和优化, 通过验证集数据对模型进行评估, 并对xgboost中的各个特征进行分 析, 根据情况对 模型进行优化。 2.如权利要求1所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 在对 数据其进行分类时, 根据企业的过往交易行为、 信贷记录以及纳税记录对选取 的样本进行 分类。 3.如权利 要求1或2所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 对 特征进行处理包括去掉冗余特征, 再使用方差选择法, 使用主成分分析法等降维方法进一 步减少特 征。 4.如权利要求3所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 所述 冗余特征为可通过已有特 征简单计算得 出的特征。 5.如权利要求1、 2或4任一所述的基于XGboost的金融信贷企业信用预测方法, 其特征 在于: 将数据分成训练集和验证集后, 当某一类型样本数量较少时, 进行 过采样处 理。 6.如权利要求5所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 在筛 选出与信用评估有关的数据时, 结合过去使用的信用卡评 分模型和已有的结论对数据的各 个特征进行初步筛 选。 7.如权利要求6所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 在处 理缺失值时, 通过删除、 填补和替换操作进行, 在处理异常值时, 通过基于聚类的方法或者 孤立森林算法进行处 理。 8.如权利 要求6或7所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 采 用SMOTE方法进行 过采样处 理。 9.如权利要求8所述的基于XGboost的金融信贷企业信用预测方法, 其特征在于: 所述 已有的结论 为人工标记的数据标签。 10.如权利要求1、 2、 4、 6、 7或9任一所述的基于XGboost的金融信 贷企业信用预测方法, 其特征在于: 使用ROC对所述模型进行评估。权 利 要 求 书 1/1 页 2 CN 114492929 A 2一种基于XGbo ost的金融信贷企业信用预测方 法 技术领域 [0001]本发明涉及企业信用预测技术领域, 特别是一种基于XGboost的金融信贷企业信 用预测方法。 背景技术 [0002]在人工智能技术飞速发展的今天, 企业的信用评估迎来了新的机遇, 利用机器学 习方法, 企业的信用预测比起传统的统计手段有了更大 的可能性。 现有的统计手段存在一 定的局限性: ①依赖经验, 许多统计规律和计算方法依赖于专家的经验和人工处理, 在准确 性和效率上有所欠缺; ②传统手段依赖人工, 成本较高, 对不同的场景适应性较差, 效率较 低。 发明内容 [0003]本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施 例。 在本部 分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部 分、 说明书摘要和发明名称的目的模糊, 而这种简化或省略不能用于限制本发明的范围。 [0004]鉴于上述和/或现有的基于XGboost的金融信贷企业信用预测方法 中存在的问题, 提出了本发明。 [0005]因此, 本发明所要解决的问题在于如何提供一种基于XGboost的金融信贷企业信 用预测方法。 [0006]为解决上述技术问题, 本 发明提供如下技术方案: 一种基于XGboost的金融信贷企 业信用预测方法, 其包括, 初步筛选, 筛选出与信用评估有关的数据; 数据处理, 处理异常值 缺失值, 并对其进 行分类; 特征工程, 对特征进 行处理; 划分数据集, 将数据分成训练集和验 证集; 模型训练, 通过Xgboost算法对训练集数据进行模 型的训练; 模 型评估和优化, 通过验 证集数据对模型进行评估, 并对xgboost中的各个特征进行分析, 根据情况对模型进行优 化。 [0007]作为本发明所述基于XGboost的金融信贷企业信用预测 方法的一种优选方案, 其 中: 在对数据其进 行分类时, 根据企业的过往交易行为、 信贷记录以及纳 税记录对选取的样 本进行分类。 [0008]作为本发明所述基于XGboost的金融信贷企业信用预测 方法的一种优选方案, 其 中: 对特征进 行处理包括去掉冗余特征, 再使用方差选择法, 使用主成分分析法等降维方法 进一步减少特 征。 [0009]作为本发明所述基于XGboost的金融信贷企业信用预测 方法的一种优选方案, 其 中: 所述冗余特 征为可通过已有特 征简单计算得 出的特征。 [0010]作为本发明所述基于XGboost的金融信贷企业信用预测 方法的一种优选方案, 其 中: 将数据分成训练集和验证集后, 当某一类型样本数量较少时, 进行 过采样处 理。 [0011]作为本发明所述基于XGboost的金融信贷企业信用预测 方法的一种优选方案, 其说 明 书 1/4 页 3 CN 114492929 A 3

.PDF文档 专利 一种基于XGboost的金融信贷企业信用预测方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于XGboost的金融信贷企业信用预测方法 第 1 页 专利 一种基于XGboost的金融信贷企业信用预测方法 第 2 页 专利 一种基于XGboost的金融信贷企业信用预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:07:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。