金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111583719.9 (22)申请日 2021.12.2 2 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 张健 力兴龙 刘健  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 代理人 苏培华 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/30(2012.01) G06N 3/00(2006.01) (54)发明名称 基于Flink流处理引擎的用户数据处理方法 和装置 (57)摘要 本发明实施例提供了基于Flink流处理引擎 的用户数据处理方法和装置, 所述方法包括: 获 取实时用户数据; 采用预设Flink流处理引擎中 已训练的预测模型对所述实时用户数据进行预 测, 以判断实时用户数据是否符合离网特征; 若 是, 则采用所述Flink流处理引擎针对所述目标 用户数据对应的用户发送服务信息; 其中, 所述 目标用户数据为符合所述离网特征的实时用户 数据。 本发 明实施例能够实时对用户数据进行预 测, 以识别出符合离网特征的目标用户数据, 并 针对目标用户数据对应的用户输出服务信息, 提 高识别符合离网特征的高危用户的时效性, 以及 对高危用户发送服 务信息的效率。 权利要求书2页 说明书9页 附图2页 CN 114399087 A 2022.04.26 CN 114399087 A 1.一种基于Fl ink流处理引擎的用户数据处 理方法, 其特 征在于, 包括: 获取实时用户数据; 采用预设Flink流处理引擎中已训练的预测模型对所述实时用户数据进行预测, 以判 断实时用户数据是否符合离网特 征; 若是, 则采用所述Fl ink流处理引擎针对所述目标用户数据对应的用户发送服 务信息; 其中, 所述目标用户数据为符合所述离网特 征的实时用户数据。 2.根据权利要求1所述的方法, 其特 征在于, 还 包括: 确定接收所述 服务信息的目标用户; 获取所述目标用户对应的服 务效果数据; 采用所述 服务效果数据迭代更新所述预测模型。 3.根据权利要求1所述的方法, 其特征在于, 所述已训练的预测模型通过如下方法生 成: 获取样本用户数据; 生成与所述样本用户数据匹配的样本特 征数据以及标签数据; 将至少部分的所述样本特 征数据及其对应的标签数据划分为第一训练集; 采用所述第一训练集构建并训练第一随机森林模型, 得到预测模型。 4.根据权利要求3所述的方法, 其特征在于, 所述采用至少部分的第 一训练集构建并训 练随机森林模型, 得到预测模型的步骤 包括: 采用所述第一训练集以及预设的网络搜索算法、 K折交叉验证算法, 确定第一目标参 数; 采用所述第一目标参数构建第一随机森林模型; 采用所述第一随机森林模型确定所述第一训练集中的冗余特 征; 剔除所述第一训练集中的冗余特 征, 得到第二训练集; 采用所述第二训练集构建并训练第二随机森林模型, 得到预测模型。 5.根据权利要求4所述的方法, 其特征在于, 所述特征数据对应于多个类型的特征; 所 述采用所述第一随机森林模型确定所述第一训练集中的冗余特 征的步骤 包括: 采用所述第一随机森林模型确定所述第一训练集中各个所述类型的权 重参数; 确定所述权 重参数不大于预设阈值的类型对应的特 征数据为冗余特 征。 6.根据权利要求1所述的方法, 其特征在于, 所述针对所述目标用户数据对应的用户发 送服务信息的步骤 包括: 确定与所述目标用户数据对应的用户所使用的通信对象; 所述通信对象包括应用程 序, 小程序和移动通信号码; 确定与所述目标用户数据适配的服 务信息; 基于所述 通信对象向所述目标用户输出 所述服务信息。 7.根据权利要求1所述的方法, 其特征在于, 所述实时用户数据包括行为数据和非行为 数据, 所述行为数据包括移动行为数据和负面行为数据。 8.一种基于Fl ink流处理引擎的用户数据处 理装置, 其特 征在于, 包括: 实时数据获取模块, 用于获取实时用户数据; 预测模块, 用于采用预设Flink流处理引擎中已训练的预测模型对所述实时用户数据权 利 要 求 书 1/2 页 2 CN 114399087 A 2进行预测, 以判断实时用户数据是否符合离网特 征; 服务模块, 用于若实时用户数据符合离网特征, 则 采用所述Flink流处理引擎针对所述 目标用户数据对应的用户发送服 务信息; 其中, 所述目标用户数据为符合所述离网特 征的实时用户数据。 9.一种电子设备, 其特征在于, 包括: 处理器、 存储器及存储在所述存储器上并能够在 所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求 1‑ 7中任一项所述基于Fl ink流处理引擎的用户数据处 理方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述基于Flink流处理 引擎的用户数据处 理方法的步骤。权 利 要 求 书 2/2 页 3 CN 114399087 A 3

.PDF文档 专利 基于Flink流处理引擎的用户数据处理方法和装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于Flink流处理引擎的用户数据处理方法和装置 第 1 页 专利 基于Flink流处理引擎的用户数据处理方法和装置 第 2 页 专利 基于Flink流处理引擎的用户数据处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:09:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。