金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111473771.9 (22)申请日 2021.11.30 (71)申请人 杭州网易云音乐科技有限公司 地址 310052 浙江省杭州市萧 山区钱江世 纪城奔竞大道353号杭州国际博览中 心A座1201室 (72)发明人 许鹏飞 李永刚 马雨浩 郑磊  蒋能学 郑玮  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 代理人 董晓盈 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/9535(2019.01) (54)发明名称 特征处理方法、 装置、 计算设备及 介质 (57)摘要 本公开的实施方式提供了一种特征处理方 法、 装置、 计算设备及介质, 属于机器学习技术领 域。 本公开通过获取第一离线模 型和用于训练第 一离线模型的至少一个第一离线特征, 从而在获 取到对应于至少一个第一在线特征的在线样本 数据后, 基于至少一个第一离线特征来确定是否 允许第一在线特征进入模型的训练过程, 进而在 至少一个第一离线特征中存在第一在线特征的 情况下, 将第一在线特征确定为用于训练第一离 线模型的在线训练特征。 通过上述过程, 使得无 需对在线样本数据进行累积即可实现特征准入, 从而能够保证模型训练的实时性。 权利要求书2页 说明书14页 附图4页 CN 114139727 A 2022.03.04 CN 114139727 A 1.一种特 征处理方法, 其特 征在于, 所述方法包括: 获取第一离线模型和用于训练所述第一离线模型的至少一个第一离线特 征; 获取在线样本数据, 所述在线样本数据对应于 至少一个第一在线特 征; 在所述至少一个第 一离线特征中存在所述第 一在线特征的情况下, 将所述第 一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 在所述至少一个第 一离线特征中不存在所述第 一在线特征的情况下, 获取所述第 一在 线特征的出现次数; 在所述第一在线特征的出现次数大于设定次数阈值的情况下, 将所述第 一在线特征确 定为用于训练所述第一离线模型的在线训练特 征。 3.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一在线特征确定为用于训练 所述第一离线模型的在线训练特 征之后, 所述方法还 包括: 将所述第一在线特征添加至第 一特征队列, 所述第 一特征队列用于存储训练所述第 一 离线模型的在线训练特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述第一离线模型对应有第一起始时间 戳, 所述第一 起始时间戳用于指示 开始从所述第一特 征队列中获取在线训练特 征的时间; 所述将所述第 一在线特征确定为用于训练所述第 一离线模型的在线训练特征之后, 所 述方法还 包括: 从所述第一特征队列中, 获取对应时间位于所述第一起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 一起始时间戳之后的在线训练特征, 训练所述第 一离线 模型, 得到第一在线模型。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取第二离线模型和用于训练所述第 二离线模型的至少一个第 二离线特征, 所述第 二 离线模型对应有第二截止时间戳, 所述第二截止时间戳用于指示离线训练所述第二离线模 型时所使用的离线样本数据的数据截止时间, 所述第二离线模型关联有第二特征队列, 所 述第二离线模型对应有第二起始时间戳, 所述第二起始时间戳用于指示开始从所述第二特 征队列中获取在线训练特 征的时间; 基于对应时间位于所述第 二截止时间戳与 所述第二起始时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第二在线模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于对应时间位于所述第 二截止时间 戳与所述第二起始 时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第 二在线模型之后, 所述方法还 包括: 从所述第二特征队列中, 获取对应时间位于所述第二起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 二起始时间戳之后的在线训练特征, 训练所述待训练 的 第二在线模型, 得到第二在线模型。 7.根据权利要求1至6中任一项所述的方法, 其特征在于, 不同的离线模型对应于不同 的版本信息;权 利 要 求 书 1/2 页 2 CN 114139727 A 2所述方法还 包括: 响应于接收到模型获取指令, 获取所述模型获取指令对应的版本信 息所指示的离线模 型。 8.一种特 征处理装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取第 一离线模型和用于训练所述第 一离线模型的至少一个第 一离线 特征; 所述获取模块, 还用于获取在线样本数据, 所述在线样本数据对应于至少一个第一在 线特征; 确定模块, 用于在所述至少一个第一离线特征中存在所述第一在线特征的情况下, 将 所述第一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 9.一种计算设备, 其特征在于, 所述计算设备包括存储器、 处理器及存储在存储器上并 可在处理器上运行 的计算机程序, 其中, 所述处理器执行所述程序时实现如权利要求1至7 中任一项所述的特 征处理方法所 执行的操作。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有程序, 所述程序被处 理器执行如权利要求1至7中任一项所述的特 征处理方法所 执行的操作。权 利 要 求 书 2/2 页 3 CN 114139727 A 3

.PDF文档 专利 特征处理方法、装置、计算设备及介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 特征处理方法、装置、计算设备及介质 第 1 页 专利 特征处理方法、装置、计算设备及介质 第 2 页 专利 特征处理方法、装置、计算设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:22:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。