金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111400222.9 (22)申请日 2021.11.24 (71)申请人 新疆工程学院 地址 830023 新疆 维吾尔自治区乌鲁 木齐 市经济技术开 发区(头屯河区)艾丁湖 路1350号 (72)发明人 蒋甲丁 王凤 朱黎 王晓宇  孔德安 徐立军 高钾 薛建雄  李瑾 王营超 刘金庭 李柯豪  朱勇 周裕松 其丽格尔  (74)专利代理 机构 成都博领众成知识产权代理 事务所(普通 合伙) 51340 代理人 宋红宾 (51)Int.Cl. G06F 30/27(2020.01)G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 10/04(2012.01) G06F 113/06(2020.01) G06F 119/06(2020.01) (54)发明名称 基于时域特征与XGBoo st的超短期风电功率 预测方法 (57)摘要 本发明公开了一种基于时域特征与XGBoo st 的超短期风电功率预测方法, 根据风场环境中的 风速、 风速变化率、 风向、 气压、 温度、 湿度等影 响 因素, 通过机器学习的方法对特征进行分类、 标 记, 并进行归一化和向量化表示, 使其在风环境 空间中具有领域特征信息, 之后再利用机器学习 算法对表 示后的特征进行模型训练, 找出对风电 功率影响最大的风环境特征集合及其对风电功 率的影响系数, 之后利用集 成学习的方法将各特 征融入进模 型对风电的超短期功率进行预测, 根 据k折交叉验证方法找出使 得预测结果的均方根 误差及平均绝对误差最小的模型, 最终形成预测 模型。 将影响风电功率的因素从五个维度, 四个 方向进行分解, 对影响因素的特征 实现了精细化 和充分的拓展和挖掘。 权利要求书2页 说明书5页 附图1页 CN 114021483 A 2022.02.08 CN 114021483 A 1.一种基于时域特 征与XGBo ost的超短期风电功率预测方法, 其特 征在于, 步骤如下: 第一步: 原始数据预处 理 根据风场环境中的影响因素, 通过机器学习的方法对特征进行分类、 标记, 并进行归一 化和向量 化表示, 使其在风环境空间中具有领域特 征信息; 第二步: 数据分析和特 征挖掘 利用机器学习算法对表示后的特征进行模型训练, 找出对风电功率影响最大的风环境 特征集合及其对风电功率的影响系数; 不同类型的数据 具有不同的特征, 对于数据 特征的识别和提取需要依据 数据代表的具 体信息进 行特征识别和提取, 之后利用机器学习的算法实现特征的自动化分类; 最 终形成, 历史气象数据、 风机状态数据、 历史功 率数据、 风场环 境数据、 地理环境数据五个维度, 并从 时序性、 变化性、 内部交互性和外部交互性四个方向拓展的特征挖掘, 将原始数据进 行特征 化表示, 形成分类型的特 征表示矩阵; 第三步: 风电功率预测模型构建 利用集成学习的方法将各特征融入进模型对风电的超短期功率进行预测, 根据k折交 叉验证方法找出使得 预测结果的均方根 误差及平均绝对误差最小的模型; 影响风电功率的因素众多, 如何识别和筛选出对风电功率影响最大的因素是构建风电 功率预测模型的关键; 此步骤是对 模型中主特 征的筛选及确定, 主 要内容包括: (1)对第二步中确定的特征计算特征之间的相关系数, 从而得到各特征之间的皮尔逊 相关系数矩阵。 通过皮尔逊相关系数分析输入特征间的相关性, 确定是否存在冗余特征; 相 关系数的大小表示2个 变量C1, C2之间的线性相关程度, 计算公式为: 式中: 分别为C1, C2的标准偏差; r∈[ ‑1, 1], r越接近1, 则 2个输入特征间的相关 性越强, r越接 近0, 则2个输入特 征间的相关性越弱; (2)从五个维度计算出各特征对风电功率的影响系数, 筛选出对风电功率影响最大的 维度, 并得 出各维度下 各特征的影响系数分布; (3)通过不同风场的数据比较, 得 出最终五个维度的特 征, 构建出风电功率预测模型; 第四步: 风电功率预测模型训练 此部分是确定模型中个主要特征的权重; 采用基于集成学习方法开发的XGBoost算法 进行预测模型的参数训练, 并采用K折交叉验证的方法对训练集和测试集进行分割, 通过计 算使得RMSE和 MAE最小的参数模型来筛选出 目标参数, 从而构建出本发明的风电功率预测 算法: TS_XGB; XGBoost算法在GBDT基础上进行优化改进, 对目标函数进行正则化及二阶泰勒展开; XGBoost的数学模型可看作由K棵分类与回归树(classification  and regression  tree, CART)组成的加法模型; 式中: K为树的棵数; F为所有可能的CART; fk为一棵具体的CART; 在回归过程中, 参数θ = {f1, f2,…, fk}, 则XGBo ost的目标函数变为:权 利 要 求 书 1/2 页 2 CN 114021483 A 2式中: 第一部分为损失函数; 第二部分为正则项, 由K棵树的正则化项相加得到; 对于决 策树的正则化项, 通过向量映射对每棵决策树进行改进, 得到XGBo ost的正则化项为: 式中: γ, λ为模型的惩罚系数; T为树叶的节点个数; ω为树叶的分数; 分步骤逐步逼近 优化目标函数, 在第t步时, 在现有的t ‑1棵树基础上添加1棵最优化的CART即ft, 则目标函 数变为: 将式(6)进行泰勒二级 展开得: 式中: gi为损失函数的一阶导数; hi 为损失函数的二阶导数; 第五步: 风电功率预测模型对比测试 经过前四步的数据准备、 特征挖掘与模型构建, 得到了基于XGBoot开发的TS_XGBoost 算法, 本步骤通过使用不同风场的数据, 进一步验证算法的准确度, 并和同类型的算法, 在 同一数据集上进行对比测试, 验证本算法的有效性。 2.根据权利 要求1所述的一种基于时域特征与XGBoost的超短期风电功率预测方法, 其 特征在于: 第一步中, 风场环境中的影响因素包括但不限于: 风速、 风速变化率、 风向、 气 压、 温度、 湿度。 3.根据权利 要求1所述的一种基于时域特征与XGBoost的超短期风电功率预测方法, 其 特征在于: 第一步中, 原始数据预处理的具体的步骤包括: 将原始数据中的缺失值补全, 可 以采用平均值法和固定值法; 数据中的重复值、 冗余值识别和删除; 数据中的错误值识别和 纠错, 可以采用异常值识别方法, 然后再采用缺 失值补全的方法将纠错的新值插入; 最后是 对不同维度的数据进行归一化, 常用的方法通过计算各维度数据的最大最小值, 并对数据 进行0‑1映射, 从而得到 0‑1空间中的数据表示。 4.根据权利 要求1所述的一种基于时域特征与XGBoost的超短期风电功率预测方法, 其 特征在于: 第二步中, 数据的特征工程包括: 数据的特征识别、 特征提取、 特征表示和特征分 类; 风电场采集的数据包括气象数据、 历史功率数据、 风机的状态数据等多类型数据, 具有 多维度、 大规模和高时序性的特点。 5.根据权利 要求1所述的一种基于时域特征与XGBoost的超短期风电功率预测方法, 其 特征在于: 第四步中, 进一步验证算法的准确度, 并和同类型的算法, 包括但 不限于: 决策树 DecisionTree,SVM。权 利 要 求 书 2/2 页 3 CN 114021483 A 3

.PDF文档 专利 基于时域特征与XGBoost的超短期风电功率预测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于时域特征与XGBoost的超短期风电功率预测方法 第 1 页 专利 基于时域特征与XGBoost的超短期风电功率预测方法 第 2 页 专利 基于时域特征与XGBoost的超短期风电功率预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:21:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。