金融行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111610807.3 (22)申请日 2021.12.27 (71)申请人 河北师范大学 地址 050024 河北省石家庄市南 二环东路 20号 (72)发明人 赵冬梅 吴亚星 孙明伟 吴亚亮 于瑞涛 梁丽娜 (74)专利代理 机构 北京方圆嘉 禾知识产权代理 有限公司 1 1385 专利代理师 王月松 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习算法的网络安全态势预 测方法及系统 (57)摘要 本发明涉及一种基于机器学习算法的网络 安全态势预测方法及系统。 所述方法包括: 基于 随机森林对网络安全态势数据集中的样本特征 进行特征选择和预处理, 生成筛选后数据集; 计 算筛选后数据集中每条网络流量样本的真实态 势值; 根据滑动窗口大小对态势值数据集进行划 分, 得到训练集和测试集样本; 采用遗传算法对 网络安全态势预测模型隐含层神经单元个数进 行优化, 生成具有最优参数的网络安全态势预测 模型; 采用训练集和测试集样 本对网络安全态势 预测模型进行训练和测试, 生 成训练好的网络安 全态势预测模 型以进行网络安全态势预测。 本发 明方法构建了收敛速度更快且模型简易的网络 安全态势预测模 型, 能够提高网络安全态势预测 的速度、 准确率和真实性。 权利要求书4页 说明书11页 附图2页 CN 114511131 A 2022.05.17 CN 114511131 A 1.一种基于 机器学习算法的网络安全态 势预测方法, 其特 征在于, 包括: 获取网络安全态势数据集; 所述网络安全态势数据集中包括多条网络流量样本, 每条 所述网络流 量样本具有 多个特征; 基于随机森林对所述网络安全态势数据集中的样本特征进行特征选择和预处理, 生成 筛选后数据集; 计算所述筛 选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集; 根据滑动窗口大小对所述态 势值数据集进行划分, 划分出训练集样本和 测试集样本; 基于长短期记 忆网络构建网络安全态 势预测模型; 采用遗传算法对所述网络安全态势预测模型的隐含层神经单元个数进行优化, 生成具 有最优参数的网络安全态 势预测模型; 采用所述训练集样本和测试集样本对所述具有最优参数的网络安全态势预测模型进 行训练和 测试, 生成训练好的网络安全态 势预测模型; 采用所述训练好的网络安全态 势预测模型进行网络安全态 势预测。 2.根据权利要求1所述的方法, 其特征在于, 所述基于随机森林对所述网络安全态势数 据集中的样本特 征进行特征选择, 生成筛 选后数据集, 具体包括: 基于基尼 指数或基于袋外数据, 计算所述网络安全态势数据集中的每个特征的重要性 评分; 根据所述每个特征的重要性评分的大小去除所述网络安全态势数据集中不重要的特 征, 生成所述特 征选择后数据集; 对所述特 征选择后数据集进行 预处理, 生成所述筛 选后数据集。 3.根据权利要求2所述的方法, 其特征在于, 所述基于基尼 指数计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 采用公式 计算决策树中节点m的基尼指数Ginim; 其中pmk表示节 点m中类别k的比例, K表示类别总数; 根据所述基尼指数Ginim, 采用公式 计算特征Xj在决 策树中节点m的重要性 其中Ginil和Ginir分别表示分枝后两个新节点的基尼指 数; 根据所述重要性 采用公式 计算特征Xj在第i颗决策 树的重要性 其中M表示第i颗决策树中的节点 集合; 根据所述重要性 采用公式 计算特征Xj的重要性权 利 要 求 书 1/4 页 2 CN 114511131 A 2采用公式 对特征Xj的重要性 进行归一化处理, 得到特征 Xj的重要性评分FISj; 其中d为特 征总数量。 4.根据权利要求2所述的方法, 其特征在于, 所述基于袋外数据计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 基于所述随机森林模型, 采用公式 计算所述 网络安 全态势数据集中的特征Xj的重要性评分FISj; 其中其中err1OOB表示随机森林的袋外数据误 差; 表示对特 征Xj加入噪声干扰后计算的袋外数据误差 。 5.根据权利要求1所述的方法, 其特征在于, 所述计算所述筛选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集, 具体包括: 采用公式 计算所述筛选后数据集中每条网络流量样本的真实态势值SA (t); 多条所述网络流量样本的真实态势值共同构成所述态势值数据集; 其中Ti表示第i条 攻击样本的攻击威胁因子; C表示时间段t内的攻击样本数量。 6.一种基于 机器学习算法的网络安全态 势预测系统, 其特 征在于, 包括: 网络安全态势数据集获取模块, 用于获取网络安全态势数据集; 所述网络安全态势数 据集中包括多条网络流 量样本, 每条 所述网络流 量样本具有 多个特征; 特征选择和预处理模块, 用于基于随机森林对所述网络安全态势数据集中的样本特征 进行特征选择和预处 理, 生成筛 选后数据集; 真实态势值计算模块, 用于计算所述筛选后数据集中每条网络流量样本的真实态势 值, 生成态 势值数据集; 数据集划分模块, 用于根据滑动 窗口大小对所述态势值数据集进行划分, 划分出训练 集样本和 测试集样本; 网络安全态势预测模型构建模块, 用于基于长短期记忆网络构建网络安全态势预测模 型; 模型参数优化模块, 用于采用遗传算法对所述网络安全态势预测模型的隐含层神经单 元个数进行优化, 生成具有最优参数的网络安全态 势预测模型; 模型训练测试模块, 用于采用所述训练集样本和测试集样本对所述具有最优参数的网 络安全态 势预测模型进行训练和 测试, 生成训练好的网络安全态 势预测模型; 网络安全态势预测模块, 用于采用所述训练好的网络安全态势预测模型进行网络安全 态势预测。 7.根据权利要求6所述的系统, 其特 征在于, 所述特 征选择和预处 理模块具体包括: 重要性评分计算子模块, 用于基于基尼指数或基于袋外数据, 计算所述网络安全态势权 利 要 求 书 2/4 页 3 CN 114511131 A 3
专利 一种基于机器学习算法的网络安全态势预测方法及系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 03:08:19
上传分享
举报
下载
原文档
(1018.7 KB)
分享
友情链接
CSA 安全数据湖的敏捷数据原则.pdf
T-ZNX 020—2021 驱鸟剂对直播稻田鸟害驱避药效试验准则.pdf
GB-T 33770.1-2017信息技术服务外包第1部分服务提供方通用要求.pdf
GB-T 34679-2017智慧矿山信息系统通用技术规范.pdf
GB-T 42589-2023 信息安全技术 电子凭据服务安全规范.pdf
GB-T 29344-2023 灵芝孢子粉采收及加工技术规范.pdf
GB-T 42706.2-2023 电子元器件 半导体器件长期贮存 第2部分:退化机理.pdf
GB-T 34532-2017 焦化废水 氨氮含量的测定 甲醛法.pdf
PA Cortex XDR终端安全解决方案白皮书.pdf
中国银保监会监管数据安全管理办法(试行).pdf
滨州市河道管理办法.pdf
数字中国发展报告 2021年 .pdf
安恒 黄承开 网络安全技术标准化和下一代网络安全架构技术介绍 2022.pdf
2021-交通银行-隐私计算金融应用蓝皮书.pdf
GB-T 13560-2017 烧结钕铁硼永磁材料.pdf
GB-T 42449-2023 系统与软件工程 功能规模测量 IFPUG方法.pdf
GB-T 40370-2021 燃气-蒸汽联合循环热电联产能耗指标计算方法.pdf
GB-T 19425-2003 防伪技术产品通用技术条件.pdf
GB-T 43026-2023 公共安全视频监控联网信息安全测试规范.pdf
GB-T 37697-2019 露天煤矿边坡变形监测技术规范.pdf
1
/
3
18
评价文档
赞助2元 点击下载(1018.7 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。