(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111403175.3
(22)申请日 2021.11.24
(71)申请人 中盈优创资 讯科技有限公司
地址 200000 上海市嘉定区安亭镇杭桂 路
1112号10层10 04室-4
(72)发明人 郭兆旭
(74)专利代理 机构 上海嘉蓝专利代理事务所
(普通合伙) 31407
代理人 金波
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 10/00(2012.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于RF-XGBOOST的业务故障预测方法
及装置
(57)摘要
本发明公开一种基于RF ‑XGBOOST的业务故
障预测方法及装置, 其中, 该方法包括: 建业务监
控指标, 对采集的指标数据进行预处理形成样
本; 将样本数据分为训练集和测试集, 基于训练
集分别构建RF模型和XGBOOST模型, 并通过权重
线性组合两种模型构建RF ‑XGBOOST模型; 基于测
试集对RF ‑XGBOOST模型进行评价; 利用RF ‑
XGBOOST模型对业务进行实时监控, 对预测 故障
的结果进行告警, 并进行告警处置; 对预测错误
的结果通过人工研判进行校正并记录; 将未来一
段时间内的真实数据纳入模型样 本中。 该方法及
装置通过构建RF ‑XGBOOST模型的不断训练, 将机
器学习与专家经验优势互补, 进行 故障预判和预
处理。
权利要求书3页 说明书10页 附图3页
CN 114202110 A
2022.03.18
CN 114202110 A
1.一种基于RF ‑XGBOOST的业务故障预测方法, 其特 征在于, 该 方法包括:
构建业务监控指标, 对 采集的指标 数据进行 预处理形成样本;
将样本数据分为训练集和测试集, 基于训练集分别构 建RF模型和XGBOOST模型, 并通过
权重线性组合两种模型构建RF ‑XGBOOST模型; 基于测试集对RF ‑XGBOOST模型进行评价;
利用RF‑XGBOOST模型对业务进行实时监控, 对预测故障的结果进行告警, 并进行告警
处置; 对预测错 误的结果 通过人工研判进行 校正并记录;
将未来一段时间内的真实数据纳入 模型样本中。
2.根据权利 要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述RF模
型构建过程如下:
选取业务监控指标作为输入变量, 利用训练集构建RF模型, 训练集的样本量为0.8n, n
为样本数量, RF模型的输出 结果为预测值和预测概 率;
假设第i个样本的RF模型预测 值为wi, RF模型预测概率为xi, 则RF模型 的预测概率向量
为X=(x1,x2,……,x0.8n);
利用公式(1)计算出RF模型的识别准确率 为α, 公式(1)如下:
其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负
的正样本分类数。
3.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述
XGBOOST模型构建过程如下:
选取业务监控指标作为输入变量, 利用训练集构建XGBOOST模型, 训练集的样本量为
0.8n, n为样本数量, XGBO OST模型的输出 结果为预测值和预测概 率;
假设第i个样本的XGBOOST模型预测值为Wi, XGBOOST模型预测概率为yi, 则XGBOOST模型
的预测概 率向量为Y=(y1,y2,……,y0.8n);
利用公式(1)计算出 XGBOOST模型的识别准确率 为β, 公式(1)如下:
其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负
的正样本分类数。
4.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 所述RF ‑
XGBOOST模型构建过程如下:
假设RF模型的权重为
XGBOOST模型的权重为
则将RF模型的预测概率向量X
和XGBOOST模型的预测概 率向量Y按权 重线性组合的预测概 率向量Z如下:
假设向量Z为RF ‑XGBOOST模型的预测概率向量, RF ‑XGBOOST模型的阈值为ε, 则第i个样
本的RF‑XGBOOST模型预测值为gi:权 利 要 求 书 1/3 页
2
CN 114202110 A
2若RF‑XGBOOST模型预测值gi值为1, 则代表发生故障, 否则未发生故障; 因此, RF ‑
XGBOOST模型预测值向量G如下:
G=(g1,g2,。 。 。 g0.8n) (4)。
5.根据权利要求1所述的基于RF ‑XGBOOST的业务故障预测方法, 其特征在于, 基于测试
集对RF‑XGBOOST模型进行评价, 包括:
将训练好的RF ‑XGBOOST模型应用到测试集上, 利用公式(1)评价模型的优劣, 公式(1)
如下:
其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负
的正样本分类数;
若达标则输出最佳的RF ‑XGBOOST模型; 否则重新执行构 建预测模型, 进行参数优化; 若
一直不达标, 重新选取业 务监控指标, 重新构建模型。
6.一种基于RF ‑XGBOOST的业务故障预测装置, 其特 征在于, 该装置包括:
样本采集模块, 用于构建业 务监控指标, 对 采集的指标 数据进行 预处理形成样本;
模型构建模块, 用于将样本数据分为训练集和测试集, 基于训练集分别构建RF模型和
XGBOOST模型, 并通过权 重线性组合两种模型构建RF ‑XGBOOST模型;
模型评价模块, 用于基于测试集对RF ‑XGBOOST模型进行评价;
模型应用模块, 用于利用RF ‑XGBOOST模型对业务进行实时监控, 对预测故障的结果进
行告警, 并进行告警处置; 对预测错 误的结果 通过人工研判进行 校正并记录;
模型优化模块, 用于将未来 一段时间内的真实数据纳入 模型样本中。
7.根据权利 要求6所述的基于RF ‑XGBOOST的业务故障预测装置, 其特征在于, 所述RF模
型构建过程如下:
选取业务监控指标作为输入变量, 利用训练集构建RF模型, 训练集的样本量为0.8n, n
为样本数量, RF模型的输出 结果为预测值和预测概 率;
假设第i个样本的RF模型预测 值为wi, RF模型预测概率为xi, 则RF模型 的预测概率向量
为X=(x1,x2,……,x0.8n);
利用公式(1)计算出RF模型的识别准确率 为α, 公式(1)如下:
其中, T为被预测为正的正样本分类数, P为被预测为正的负样本分类数, Q被预测为负
的正样本分类数。
8.根据权利要求6所述的基于RF ‑XGBOOST的业务故障预测装置, 其特征在于, 所述
XGBOOST模型构建过程如下:
选取业务监控指标作为输入变量, 利用训练集构建XGBOOST模型, 训练集的样本量为
0.8n, n为样本数量, XGBO OST模型的输出 结果为预测值和预测概 率;权 利 要 求 书 2/3 页
3
CN 114202110 A
3
专利 一种基于RF-XGBOOST的业务故障预测方法及装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:15:50上传分享