金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111557495.4 (22)申请日 2021.12.19 (71)申请人 南京理工大 学 地址 210094 江苏省南京市孝陵卫20 0号 (72)发明人 胡文斌 姚跃 李华轩 秦建楠  (74)专利代理 机构 南京理工大 学专利中心 32203 代理人 王玮 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/08(2006.01) G06K 9/62(2022.01) G06F 16/182(2019.01) (54)发明名称 基于Hadoop的并行化BP神经网络的能耗预 测方法 (57)摘要 本发明公开了一种基于Hadoop的并行化BP 神经网络的能耗预测方法, 该方法将现在主流的 集成学习相关算法与Hadoop分布式平台结合, 通 过并行计算的方式提高模型建立速度, 通过建立 多个模型甚至多种不同模型组合的方法来提高 算法的泛化能力。 本发明能够实现地铁未来能耗 的精确预测, 提高预测算法的处理能力、 计算速 度和泛化能力, 通过对未来周期的能耗进行预 测, 优化地铁的控制策略和日常运行, 对地铁能 效管理、 能源分配提供 可靠的数据支持。 权利要求书2页 说明书6页 附图3页 CN 114298387 A 2022.04.08 CN 114298387 A 1.一种基于 Hadoop的并行化BP神经网络的能耗预测方法, 其特 征在于, 包括以下步骤: 步骤1、 获取地铁列车及变电站历史统计数据, 初步清洗并存储到Hadoop分布式系统 中; 步骤2、 通过Map任务将样本数据进行随机化处理, 并按照一定比例将新样本划分为训 练样本和 测试样本, 并分别进行归一 化处理; 步骤3、 将数据划分成小型数据集, 存储在分布式文件系统数据各节点中, 作为网络训 练参数; 步骤4、 采用灰色关联分析法建立能耗影响因素评估体系, 体系中包括对影响因素重要 度排序, 确定样本数据初始化权值; 步骤5、 初始化BP神经网络训练参数, 包括误差函数与期望误差值, 学习速率, 输入层、 隐含层、 输出层神经 元节点个数, 阈值和权值; 步骤6、 节点启动 Map任务接收训练样本, 进行网络训练, 计算当前网络连接权值变化量 输出中间结果, Reduce操作计算所有权值变化量平均值作为输出, 批处理训练网络, 调整网 络中各层的权 重; 步骤7、 重复步骤(6), 直到网络预测相对误差达到初始设定的误差目标或达到初始设 定的最大迭代次数。 步骤8、 根据训练好的并行能耗预测模型对地铁列 车能耗进行预测得到预测结果, 并与 真实值对比, 计算 准确率。 2.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤1中所述的获取的地铁列车及变电站历史 统计数据, 具体如下: 从轨道交通SCADA系统中获取地铁牵引能耗原始数据, 原始数据包括待预测日期之前 若干天的地铁列车牵引能耗历史数据, 以及客流、 运行里程、 温度、 湿度、 开行列次信息的历 史数据。 3.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤2所述的将 样本数据通过Hado op中的Map任务进行随机化处 理, 具体如下: 数据样本先按照 Hadoop平台提前设置好的分片大小进行分块操作, 每一个分块由相互 独立的Map任务进行并行处理, 通过Hadoop平台的Shuffle机制将原来根据某个属性团簇在 一起、 数据一致性高于设定的阈值的数据集进行随机打散, 随机地下发到下游的Reduce任 务中进行重新组合, 进 而形成多样性高的多个数据块作为 新的训练样本 。 4.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤2中所述的对训练集数据进行归一 化处理, 具体如下: 数据归一 化方法采用Z ‑score标准化方法, 公式如下: 其中, x*为归一化后的数据, x为个体观测值, μ为训练集数据的均值, δ为训练集数据的 标准差。 5.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤4所述的根据灰色关联分析法建立能耗影响评估体系, 计算输入输出影响度初始 化 权值, 具体如下:权 利 要 求 书 1/2 页 2 CN 114298387 A 2步骤1.1: 选 取地铁日牵引能耗为参考数列, 能耗的影响因素变量为比较 数列, 记为Zi= {zi(k)|k=1,2,…,n},i=0,1,2, …m; 其中, zi(k)为选取出来的参考数列和比较数列, 将 参考数列设为z0(k), i为参考数列和 比较数列各自的编号, m为 参考数列和比较数列的总数, k 为选取数据的日期, n 为总的天数; 步骤1.2: 对地铁日牵引能耗与各影响因素进行 无量纲化: 其中, 为序列Zi的算术平均值; 步骤1.3: 计算各影响因素与地铁日牵引能耗的关联系数: 其中, Δi(k)=|z0(k)‑z′i(k)|, z′i(k)为对zi(k)进行无量纲化后的值, 为所选日期中Δi(k)的最大值, 为所选取日期中Δi(k)的最小值, ρ 称为分辨 系数; 步骤1.4: 计算各影响因素与地铁日牵引能耗的关联度r0i: 其中, ξ0i(k)为步骤1.3求得的关联系数, k 为选取数据的日期, n 为总的天数; 步骤1.5: 按求得的关联度数值大小确定初始化权值大小。 6.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤6中所述的将启动Map 任务接收训练样 本, 进行网络训练, 计算当前网络连接权值变 化量输出中间结果, 具体如下: 首先通过设置Hadoop  Map任务的split_nu m、 split_size、 default_num、 goal_nu m参数 值来决定每个Map任务处理的数据块大小, 其中参数分别表示分割数量、 分片大小、 默认分 割数量、 期望分割数量; 参数设置完成后可计算出Map任务的并行度, 训练样本按照 分块传 送到不同的Map 任务中作为输入, 在各自的Map 任务中相互独立的计算每个数据对于 当前权 值的修正值。 7.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在 于, 步骤6中所述的Reduce操作计算所有权值变化量平均值作为输出, 批处理训练网络, 调 整网络中各层的权 重, 具体如下: 每个Reduce操作接收来自Map操作产 生的键/值对序列, 将权值相同的序列分到同一个 Reduce任务上, 然后计算所有权值变化量的平均值作为输出, 之后通过批处理训练网路, 调 整网络中各层的权 重。权 利 要 求 书 2/2 页 3 CN 114298387 A 3

.PDF文档 专利 基于Hadoop的并行化BP神经网络的能耗预测方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于Hadoop的并行化BP神经网络的能耗预测方法 第 1 页 专利 基于Hadoop的并行化BP神经网络的能耗预测方法 第 2 页 专利 基于Hadoop的并行化BP神经网络的能耗预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:09:44上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。