金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111403175.3 (22)申请日 2021.11.24 (71)申请人 中盈优创资 讯科技有限公司 地址 200000 上海市嘉定区安亭镇杭桂 路 1112号10层10 04室-4 (72)发明人 郭兆旭  (74)专利代理 机构 上海嘉蓝专利代理事务所 (普通合伙) 31407 代理人 金波 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 10/00(2012.01) G06K 9/62(2022.01) (54)发明名称 一种基于RF-XGBOOST的业务故障预测方法 及装置 (57)摘要 本发明公开一种基于RF ‑XGBOOST的业务故 障预测方法及装置, 其中, 该方法包括: 建业务监 控指标, 对采集的指标数据进行预处理形成样 本; 将样本数据分为训练集和测试集, 基于训练 集分别构建RF模型和XGBOOST模型, 并通过权重 线性组合两种模型构建RF ‑XGBOOST模型; 基于测 试集对RF ‑XGBOOST模型进行评价; 利用RF ‑ XGBOOST模型对业务进行实时监控, 对预测 故障 的结果进行告警, 并进行告警处置; 对预测错误 的结果通过人工研判进行校正并记录; 将未来一 段时间内的真实数据纳入模型样 本中。 该方法及 装置通过构建RF ‑XGBOOST模型的不断训练, 将机 器学习与专家经验优势互补, 进行 故障预判和预 处理。 权利要求书3页 说明书10页 附图3页 CN 114202110 A 2022.03.18 CN 114202110 A 1.一种基于RF ‑XGBOOST的业务故障预测方法, 其特 征在于, 该 方法包括: 构建业务监控指标, 对 采集的指标 数据进行 预处理形成样本; 将样本数据分为训练集和测试集, 基于训练集分别构 建RF模型和XGBOOST模型, 并通过 权重线性组合两种模型构建RF ‑XGBOOST模型; 基于测试集对RF ‑XGBOOST模型进行评价; 利用RF‑XGBOOST模型对业务进行实时监控, 对预测故障的结果进行告警, 并进行告警 处置; 对预测错 误的结果 通过人工研判进行 校正并记录; 将未来一段时间内的真实数据纳入 模型样本中。 2.根据权利 要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述RF模 型构建过程如下: 选取业务监控指标作为输入变量, 利用训练集构建RF模型, 训练集的样本量为0.8n, n 为样本数量, RF模型的输出 结果为预测值和预测概 率; 假设第i个样本的RF模型预测 值为wi, RF模型预测概率为xi, 则RF模型 的预测概率向量 为X=(x1,x2,……,x0.8n); 利用公式(1)计算出RF模型的识别准确率 为α, 公式(1)如下: 其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负 的正样本分类数。 3.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述 XGBOOST模型构建过程如下: 选取业务监控指标作为输入变量, 利用训练集构建XGBOOST模型, 训练集的样本量为 0.8n, n为样本数量, XGBO OST模型的输出 结果为预测值和预测概 率; 假设第i个样本的XGBOOST模型预测值为Wi, XGBOOST模型预测概率为yi, 则XGBOOST模型 的预测概 率向量为Y=(y1,y2,……,y0.8n); 利用公式(1)计算出 XGBOOST模型的识别准确率 为β, 公式(1)如下: 其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负 的正样本分类数。 4.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述RF ‑ XGBOOST模型构建过程如下: 假设RF模型的权重为 XGBOOST模型的权重为 则将RF模型的预测概率向量X 和XGBOOST模型的预测概 率向量Y按权 重线性组合的预测概 率向量Z如下: 假设向量Z为RF ‑XGBOOST模型的预测概率向量, RF ‑XGBOOST模型的阈值为ε, 则第i个样 本的RF‑XGBOOST模型预测值为gi:权 利 要 求 书 1/3 页 2 CN 114202110 A 2若RF‑XGBOOST模型预测值gi值为1, 则代表发生故障, 否则未发生故障; 因此, RF ‑ XGBOOST模型预测值向量G如下: G=(g1,g2,。 。 。 g0.8n)     (4)。 5.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 基于测试 集对RF‑XGBOOST模型进行评价, 包括: 将训练好的RF ‑XGBOOST模型应用到测试集上, 利用公式(1)评价模型的优劣, 公式(1) 如下: 其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负 的正样本分类数; 若达标则输出最佳的RF ‑XGBOOST模型; 否则重新执行构 建预测模型, 进行参数优化; 若 一直不达标, 重新选取业 务监控指标, 重新构建模型。 6.一种基于RF ‑XGBOOST的业务故障预测装置, 其特 征在于, 该装置包括: 样本采集模块, 用于构建业 务监控指标, 对 采集的指标 数据进行 预处理形成样本; 模型构建模块, 用于将样本数据分为训练集和测试集, 基于训练集分别构建RF模型和 XGBOOST模型, 并通过权 重线性组合两种模型构建RF ‑XGBOOST模型; 模型评价模块, 用于基于测试集对RF ‑XGBOOST模型进行评价; 模型应用模块, 用于利用RF ‑XGBOOST模型对业务进行实时监控, 对预测故障的结果进 行告警, 并进行告警处置; 对预测错 误的结果 通过人工研判进行 校正并记录; 模型优化模块, 用于将未来 一段时间内的真实数据纳入 模型样本中。 7.根据权利 要求6所述的基于RF ‑XGBOOST的业务故障预测装置, 其特征在于, 所述RF模 型构建过程如下: 选取业务监控指标作为输入变量, 利用训练集构建RF模型, 训练集的样本量为0.8n, n 为样本数量, RF模型的输出 结果为预测值和预测概 率; 假设第i个样本的RF模型预测 值为wi, RF模型预测概率为xi, 则RF模型 的预测概率向量 为X=(x1,x2,……,x0.8n); 利用公式(1)计算出RF模型的识别准确率 为α, 公式(1)如下: 其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负 的正样本分类数。 8.根据权利要求6所述的基于RF ‑XGBOOST的业务故障预测装置, 其特征在于, 所述 XGBOOST模型构建过程如下: 选取业务监控指标作为输入变量, 利用训练集构建XGBOOST模型, 训练集的样本量为 0.8n, n为样本数量, XGBO OST模型的输出 结果为预测值和预测概 率;权 利 要 求 书 2/3 页 3 CN 114202110 A 3

.PDF文档 专利 一种基于RF-XGBOOST的业务故障预测方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于RF-XGBOOST的业务故障预测方法及装置 第 1 页 专利 一种基于RF-XGBOOST的业务故障预测方法及装置 第 2 页 专利 一种基于RF-XGBOOST的业务故障预测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:15:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。