金融行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111473771.9 (22)申请日 2021.11.30 (71)申请人 杭州网易云音乐科技有限公司 地址 310052 浙江省杭州市萧 山区钱江世 纪城奔竞大道353号杭州国际博览中 心A座1201室 (72)发明人 许鹏飞 李永刚 马雨浩 郑磊 蒋能学 郑玮 (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 代理人 董晓盈 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/9535(2019.01) (54)发明名称 特征处理方法、 装置、 计算设备及 介质 (57)摘要 本公开的实施方式提供了一种特征处理方 法、 装置、 计算设备及介质, 属于机器学习技术领 域。 本公开通过获取第一离线模 型和用于训练第 一离线模型的至少一个第一离线特征, 从而在获 取到对应于至少一个第一在线特征的在线样本 数据后, 基于至少一个第一离线特征来确定是否 允许第一在线特征进入模型的训练过程, 进而在 至少一个第一离线特征中存在第一在线特征的 情况下, 将第一在线特征确定为用于训练第一离 线模型的在线训练特征。 通过上述过程, 使得无 需对在线样本数据进行累积即可实现特征准入, 从而能够保证模型训练的实时性。 权利要求书2页 说明书14页 附图4页 CN 114139727 A 2022.03.04 CN 114139727 A 1.一种特 征处理方法, 其特 征在于, 所述方法包括: 获取第一离线模型和用于训练所述第一离线模型的至少一个第一离线特 征; 获取在线样本数据, 所述在线样本数据对应于 至少一个第一在线特 征; 在所述至少一个第 一离线特征中存在所述第 一在线特征的情况下, 将所述第 一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 在所述至少一个第 一离线特征中不存在所述第 一在线特征的情况下, 获取所述第 一在 线特征的出现次数; 在所述第一在线特征的出现次数大于设定次数阈值的情况下, 将所述第 一在线特征确 定为用于训练所述第一离线模型的在线训练特 征。 3.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一在线特征确定为用于训练 所述第一离线模型的在线训练特 征之后, 所述方法还 包括: 将所述第一在线特征添加至第 一特征队列, 所述第 一特征队列用于存储训练所述第 一 离线模型的在线训练特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述第一离线模型对应有第一起始时间 戳, 所述第一 起始时间戳用于指示 开始从所述第一特 征队列中获取在线训练特 征的时间; 所述将所述第 一在线特征确定为用于训练所述第 一离线模型的在线训练特征之后, 所 述方法还 包括: 从所述第一特征队列中, 获取对应时间位于所述第一起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 一起始时间戳之后的在线训练特征, 训练所述第 一离线 模型, 得到第一在线模型。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取第二离线模型和用于训练所述第 二离线模型的至少一个第 二离线特征, 所述第 二 离线模型对应有第二截止时间戳, 所述第二截止时间戳用于指示离线训练所述第二离线模 型时所使用的离线样本数据的数据截止时间, 所述第二离线模型关联有第二特征队列, 所 述第二离线模型对应有第二起始时间戳, 所述第二起始时间戳用于指示开始从所述第二特 征队列中获取在线训练特 征的时间; 基于对应时间位于所述第 二截止时间戳与 所述第二起始时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第二在线模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于对应时间位于所述第 二截止时间 戳与所述第二起始 时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第 二在线模型之后, 所述方法还 包括: 从所述第二特征队列中, 获取对应时间位于所述第二起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 二起始时间戳之后的在线训练特征, 训练所述待训练 的 第二在线模型, 得到第二在线模型。 7.根据权利要求1至6中任一项所述的方法, 其特征在于, 不同的离线模型对应于不同 的版本信息;权 利 要 求 书 1/2 页 2 CN 114139727 A 2所述方法还 包括: 响应于接收到模型获取指令, 获取所述模型获取指令对应的版本信 息所指示的离线模 型。 8.一种特 征处理装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取第 一离线模型和用于训练所述第 一离线模型的至少一个第 一离线 特征; 所述获取模块, 还用于获取在线样本数据, 所述在线样本数据对应于至少一个第一在 线特征; 确定模块, 用于在所述至少一个第一离线特征中存在所述第一在线特征的情况下, 将 所述第一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 9.一种计算设备, 其特征在于, 所述计算设备包括存储器、 处理器及存储在存储器上并 可在处理器上运行 的计算机程序, 其中, 所述处理器执行所述程序时实现如权利要求1至7 中任一项所述的特 征处理方法所 执行的操作。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有程序, 所述程序被处 理器执行如权利要求1至7中任一项所述的特 征处理方法所 执行的操作。权 利 要 求 书 2/2 页 3 CN 114139727 A 3
专利 特征处理方法、装置、计算设备及介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 01:22:26
上传分享
举报
下载
原文档
(551.1 KB)
分享
友情链接
CCIA 网络安全态势感知系统技术要求.pdf
GB-T 31497-2024 信息技术 安全技术 信息安全管理 监视、测量、分析和评价.pdf
GB-T 42932-2023 道路交通资产管理体系实施指南.pdf
GB-T 971-2008 滚丝轮.pdf
T-GDACM 0116—2022 中医护理门诊建设规范.pdf
GB-T 30127-2013 纺织品 远红外性能的检测和评价.pdf
DB42-T 875-2019 湖北省城镇地下管线探测技术规程 湖北省.pdf
ISO 13400-2 2019 Amd 1 2023 Road vehicles — Diagnostic communication over Internet Prot.pdf
GB-Z 42885-2023 信息安全技术 网络安全信息共享指南.pdf
GB-T 16918-2017 气瓶用爆破片安全装置.pdf
NB-T 10882—2021 梯级水库群安全风险防控导则.pdf
DB50-T 1474.3-2023 化粪池监控系统 第3部分:运行与管理 重庆市.pdf
GB-T 4303-2008 船用救生衣.pdf
T-ZGZS 0107—2023 再生资源经营性电子数据存证技术规范.pdf
T-GDAEPI 17—2023 有色金属矿区地下水污染调查技术规范.pdf
GB-T 18771.3-2015 烟草术语 第3部分:烟用材料.pdf
GB-T 6312-2022 壁厚千分尺.pdf
GB-T 40526-2021 互联网地图服务质量评价.pdf
GB-T 41009-2021 法庭科学 DNA数据库选用的基因座及其数据结构.pdf
T-CEC 664—2022 电力行业职业技能标准 电力网络安全员.pdf
1
/
3
21
评价文档
赞助2元 点击下载(551.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。