(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111557495.4
(22)申请日 2021.12.19
(71)申请人 南京理工大 学
地址 210094 江苏省南京市孝陵卫20 0号
(72)发明人 胡文斌 姚跃 李华轩 秦建楠
(74)专利代理 机构 南京理工大 学专利中心
32203
代理人 王玮
(51)Int.Cl.
G06Q 10/04(2012.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)
G06F 16/182(2019.01)
(54)发明名称
基于Hadoop的并行化BP神经网络的能耗预
测方法
(57)摘要
本发明公开了一种基于Hadoop的并行化BP
神经网络的能耗预测方法, 该方法将现在主流的
集成学习相关算法与Hadoop分布式平台结合, 通
过并行计算的方式提高模型建立速度, 通过建立
多个模型甚至多种不同模型组合的方法来提高
算法的泛化能力。 本发明能够实现地铁未来能耗
的精确预测, 提高预测算法的处理能力、 计算速
度和泛化能力, 通过对未来周期的能耗进行预
测, 优化地铁的控制策略和日常运行, 对地铁能
效管理、 能源分配提供 可靠的数据支持。
权利要求书2页 说明书6页 附图3页
CN 114298387 A
2022.04.08
CN 114298387 A
1.一种基于 Hadoop的并行化BP神经网络的能耗预测方法, 其特 征在于, 包括以下步骤:
步骤1、 获取地铁列车及变电站历史统计数据, 初步清洗并存储到Hadoop分布式系统
中;
步骤2、 通过Map任务将样本数据进行随机化处理, 并按照一定比例将新样本划分为训
练样本和 测试样本, 并分别进行归一 化处理;
步骤3、 将数据划分成小型数据集, 存储在分布式文件系统数据各节点中, 作为网络训
练参数;
步骤4、 采用灰色关联分析法建立能耗影响因素评估体系, 体系中包括对影响因素重要
度排序, 确定样本数据初始化权值;
步骤5、 初始化BP神经网络训练参数, 包括误差函数与期望误差值, 学习速率, 输入层、
隐含层、 输出层神经 元节点个数, 阈值和权值;
步骤6、 节点启动 Map任务接收训练样本, 进行网络训练, 计算当前网络连接权值变化量
输出中间结果, Reduce操作计算所有权值变化量平均值作为输出, 批处理训练网络, 调整网
络中各层的权 重;
步骤7、 重复步骤(6), 直到网络预测相对误差达到初始设定的误差目标或达到初始设
定的最大迭代次数。
步骤8、 根据训练好的并行能耗预测模型对地铁列 车能耗进行预测得到预测结果, 并与
真实值对比, 计算 准确率。
2.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤1中所述的获取的地铁列车及变电站历史 统计数据, 具体如下:
从轨道交通SCADA系统中获取地铁牵引能耗原始数据, 原始数据包括待预测日期之前
若干天的地铁列车牵引能耗历史数据, 以及客流、 运行里程、 温度、 湿度、 开行列次信息的历
史数据。
3.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤2所述的将 样本数据通过Hado op中的Map任务进行随机化处 理, 具体如下:
数据样本先按照 Hadoop平台提前设置好的分片大小进行分块操作, 每一个分块由相互
独立的Map任务进行并行处理, 通过Hadoop平台的Shuffle机制将原来根据某个属性团簇在
一起、 数据一致性高于设定的阈值的数据集进行随机打散, 随机地下发到下游的Reduce任
务中进行重新组合, 进 而形成多样性高的多个数据块作为 新的训练样本 。
4.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤2中所述的对训练集数据进行归一 化处理, 具体如下:
数据归一 化方法采用Z ‑score标准化方法, 公式如下:
其中, x*为归一化后的数据, x为个体观测值, μ为训练集数据的均值, δ为训练集数据的
标准差。
5.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤4所述的根据灰色关联分析法建立能耗影响评估体系, 计算输入输出影响度初始 化
权值, 具体如下:权 利 要 求 书 1/2 页
2
CN 114298387 A
2步骤1.1: 选 取地铁日牵引能耗为参考数列, 能耗的影响因素变量为比较 数列, 记为Zi=
{zi(k)|k=1,2,…,n},i=0,1,2, …m;
其中, zi(k)为选取出来的参考数列和比较数列, 将 参考数列设为z0(k), i为参考数列和
比较数列各自的编号, m为 参考数列和比较数列的总数, k 为选取数据的日期, n 为总的天数;
步骤1.2: 对地铁日牵引能耗与各影响因素进行 无量纲化:
其中,
为序列Zi的算术平均值;
步骤1.3: 计算各影响因素与地铁日牵引能耗的关联系数:
其中, Δi(k)=|z0(k)‑z′i(k)|, z′i(k)为对zi(k)进行无量纲化后的值,
为所选日期中Δi(k)的最大值,
为所选取日期中Δi(k)的最小值, ρ 称为分辨
系数;
步骤1.4: 计算各影响因素与地铁日牵引能耗的关联度r0i:
其中, ξ0i(k)为步骤1.3求得的关联系数, k 为选取数据的日期, n 为总的天数;
步骤1.5: 按求得的关联度数值大小确定初始化权值大小。
6.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤6中所述的将启动Map 任务接收训练样 本, 进行网络训练, 计算当前网络连接权值变
化量输出中间结果, 具体如下:
首先通过设置Hadoop Map任务的split_nu m、 split_size、 default_num、 goal_nu m参数
值来决定每个Map任务处理的数据块大小, 其中参数分别表示分割数量、 分片大小、 默认分
割数量、 期望分割数量; 参数设置完成后可计算出Map任务的并行度, 训练样本按照 分块传
送到不同的Map 任务中作为输入, 在各自的Map 任务中相互独立的计算每个数据对于 当前权
值的修正值。
7.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法, 其特征在
于, 步骤6中所述的Reduce操作计算所有权值变化量平均值作为输出, 批处理训练网络, 调
整网络中各层的权 重, 具体如下:
每个Reduce操作接收来自Map操作产 生的键/值对序列, 将权值相同的序列分到同一个
Reduce任务上, 然后计算所有权值变化量的平均值作为输出, 之后通过批处理训练网路, 调
整网络中各层的权 重。权 利 要 求 书 2/2 页
3
CN 114298387 A
3
专利 基于Hadoop的并行化BP神经网络的能耗预测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:09:44上传分享