金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111610807.3 (22)申请日 2021.12.27 (71)申请人 河北师范大学 地址 050024 河北省石家庄市南 二环东路 20号 (72)发明人 赵冬梅 吴亚星 孙明伟 吴亚亮  于瑞涛 梁丽娜  (74)专利代理 机构 北京方圆嘉 禾知识产权代理 有限公司 1 1385 专利代理师 王月松 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习算法的网络安全态势预 测方法及系统 (57)摘要 本发明涉及一种基于机器学习算法的网络 安全态势预测方法及系统。 所述方法包括: 基于 随机森林对网络安全态势数据集中的样本特征 进行特征选择和预处理, 生成筛选后数据集; 计 算筛选后数据集中每条网络流量样本的真实态 势值; 根据滑动窗口大小对态势值数据集进行划 分, 得到训练集和测试集样本; 采用遗传算法对 网络安全态势预测模型隐含层神经单元个数进 行优化, 生成具有最优参数的网络安全态势预测 模型; 采用训练集和测试集样 本对网络安全态势 预测模型进行训练和测试, 生 成训练好的网络安 全态势预测模 型以进行网络安全态势预测。 本发 明方法构建了收敛速度更快且模型简易的网络 安全态势预测模 型, 能够提高网络安全态势预测 的速度、 准确率和真实性。 权利要求书4页 说明书11页 附图2页 CN 114511131 A 2022.05.17 CN 114511131 A 1.一种基于 机器学习算法的网络安全态 势预测方法, 其特 征在于, 包括: 获取网络安全态势数据集; 所述网络安全态势数据集中包括多条网络流量样本, 每条 所述网络流 量样本具有 多个特征; 基于随机森林对所述网络安全态势数据集中的样本特征进行特征选择和预处理, 生成 筛选后数据集; 计算所述筛 选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集; 根据滑动窗口大小对所述态 势值数据集进行划分, 划分出训练集样本和 测试集样本; 基于长短期记 忆网络构建网络安全态 势预测模型; 采用遗传算法对所述网络安全态势预测模型的隐含层神经单元个数进行优化, 生成具 有最优参数的网络安全态 势预测模型; 采用所述训练集样本和测试集样本对所述具有最优参数的网络安全态势预测模型进 行训练和 测试, 生成训练好的网络安全态 势预测模型; 采用所述训练好的网络安全态 势预测模型进行网络安全态 势预测。 2.根据权利要求1所述的方法, 其特征在于, 所述基于随机森林对所述网络安全态势数 据集中的样本特 征进行特征选择, 生成筛 选后数据集, 具体包括: 基于基尼 指数或基于袋外数据, 计算所述网络安全态势数据集中的每个特征的重要性 评分; 根据所述每个特征的重要性评分的大小去除所述网络安全态势数据集中不重要的特 征, 生成所述特 征选择后数据集; 对所述特 征选择后数据集进行 预处理, 生成所述筛 选后数据集。 3.根据权利要求2所述的方法, 其特征在于, 所述基于基尼 指数计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 采用公式 计算决策树中节点m的基尼指数Ginim; 其中pmk表示节 点m中类别k的比例, K表示类别总数; 根据所述基尼指数Ginim, 采用公式 计算特征Xj在决 策树中节点m的重要性 其中Ginil和Ginir分别表示分枝后两个新节点的基尼指 数; 根据所述重要性 采用公式 计算特征Xj在第i颗决策 树的重要性 其中M表示第i颗决策树中的节点 集合; 根据所述重要性 采用公式 计算特征Xj的重要性权 利 要 求 书 1/4 页 2 CN 114511131 A 2采用公式 对特征Xj的重要性 进行归一化处理, 得到特征 Xj的重要性评分FISj; 其中d为特 征总数量。 4.根据权利要求2所述的方法, 其特征在于, 所述基于袋外数据计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 基于所述随机森林模型, 采用公式 计算所述 网络安 全态势数据集中的特征Xj的重要性评分FISj; 其中其中err1OOB表示随机森林的袋外数据误 差; 表示对特 征Xj加入噪声干扰后计算的袋外数据误差 。 5.根据权利要求1所述的方法, 其特征在于, 所述计算所述筛选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集, 具体包括: 采用公式 计算所述筛选后数据集中每条网络流量样本的真实态势值SA (t); 多条所述网络流量样本的真实态势值共同构成所述态势值数据集; 其中Ti表示第i条 攻击样本的攻击威胁因子; C表示时间段t内的攻击样本数量。 6.一种基于 机器学习算法的网络安全态 势预测系统, 其特 征在于, 包括: 网络安全态势数据集获取模块, 用于获取网络安全态势数据集; 所述网络安全态势数 据集中包括多条网络流 量样本, 每条 所述网络流 量样本具有 多个特征; 特征选择和预处理模块, 用于基于随机森林对所述网络安全态势数据集中的样本特征 进行特征选择和预处 理, 生成筛 选后数据集; 真实态势值计算模块, 用于计算所述筛选后数据集中每条网络流量样本的真实态势 值, 生成态 势值数据集; 数据集划分模块, 用于根据滑动 窗口大小对所述态势值数据集进行划分, 划分出训练 集样本和 测试集样本; 网络安全态势预测模型构建模块, 用于基于长短期记忆网络构建网络安全态势预测模 型; 模型参数优化模块, 用于采用遗传算法对所述网络安全态势预测模型的隐含层神经单 元个数进行优化, 生成具有最优参数的网络安全态 势预测模型; 模型训练测试模块, 用于采用所述训练集样本和测试集样本对所述具有最优参数的网 络安全态 势预测模型进行训练和 测试, 生成训练好的网络安全态 势预测模型; 网络安全态势预测模块, 用于采用所述训练好的网络安全态势预测模型进行网络安全 态势预测。 7.根据权利要求6所述的系统, 其特 征在于, 所述特 征选择和预处 理模块具体包括: 重要性评分计算子模块, 用于基于基尼指数或基于袋外数据, 计算所述网络安全态势权 利 要 求 书 2/4 页 3 CN 114511131 A 3

.PDF文档 专利 一种基于机器学习算法的网络安全态势预测方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习算法的网络安全态势预测方法及系统 第 1 页 专利 一种基于机器学习算法的网络安全态势预测方法及系统 第 2 页 专利 一种基于机器学习算法的网络安全态势预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:08:19上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。