金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111447295.3 (22)申请日 2021.11.30 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 陈炫颖 刘致宁 俞力 姚柳佚  顾立宏  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈婧玥 周良玉 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 16/9535(2019.01)G06Q 30/02(2012.01) (54)发明名称 增益模型的训练方法及装置 (57)摘要 本说明书实施例提供一种增益模型的训练 方法, 包括: 先将用户集中任意目标用户的用户 特征, 分别输入基于有干预用户而训练的第一预 测模型、 基于无干预用户而训练的第二预测模型 和干预倾向预测模型, 对应得到该目标用户针对 目标行为的第一预测结果, 第二预测结果, 和该 用户是否被干预的干预倾向分数; 接着, 根据所 述第一预测结果、 第二预测结果、 干预倾向分数, 以及该目标用户的行为标签, 确定该目标用户响 应干预的增益标签, 所述增益标签与所述干预倾 向分数成线性关系; 再基于所述用户集中各个用 户的用户特 征和增益标签, 训练所述增益模型。 权利要求书2页 说明书12页 附图2页 CN 114139724 A 2022.03.04 CN 114139724 A 1.一种增益模型的训练方法, 包括: 将用户集中任意目标用户的用户特征, 分别输入基于有干预用户而训练 的第一预测模 型、 基于无干预用户而训练的第二预测模型和干预倾向预测模型, 对应得到该目标用户针 对目标行为的第一预测结果, 第二预测结果, 和该用户是否被干预的干预倾向分数; 根据所述第一预测结果、 第二预测结果、 干预倾向分数, 以及该目标用户的行为标签, 确定该目标用户响应干预的增益标签, 所述增益标签与所述干预倾向分数成线性关系; 基于所述用户集中各个用户的用户特 征和增益标签, 训练所述增益模型。 2.根据权利要求1所述的方法, 其中, 所述干预为发放与所述目标行为相关的权益, 或 者, 为推送与所述目标 行为相关的内容信息 。 3.根据权利要求1所述的方法, 其中, 所述第一预测模型的训练包括: 基于所述用户集 中多个有干预用户的用户特 征和行为标签, 训练所述第一行为预测模型。 4.根据权利要求1所述的方法, 其中, 所述第二预测模型的训练包括: 基于所述用户集 中多个无干预用户的用户特 征和行为标签, 训练所述第二行为预测模型。 5.根据权利要求1所述的方法, 其中, 所述干预倾向预测模型的训练包括: 基于所述用 户集中各个用户的用户特 征以及有无干预, 训练所述干预倾向预测模型。 6.根据权利要求1所述的方法, 其中, 根据第一预测结果、 第二预测结果、 干预倾向分 数, 以及该目标用户的行为标签, 确定该目标用户响应干预的增益标签, 包括: 根据所述行为标签和与所述目标用户的实际干预情况相反情况下的预测结果, 确定基 础值; 根据所述行为标签和所述实 际干预情况所对应的预测结果, 确定修正值, 并基于所述 干预倾向分数对所述 修正值进行加权处 理; 根据所述基础值以及所述加权处 理的结果, 确定所述增益标签。 7.根据权利要求6所述的方法, 其中, 基于所述干预倾向分数对所述修正值进行加权处 理包括: 根据所述干预倾向分数确定权重因子, 其中, 当所述实际干预情况为有干预时, 所述权 重因子随所述干预倾向分数线性单调递减; 当所述实际干预情况为无干预时, 所述权重因 子随所述干预倾向分数线性单调递增; 将所述修正值与所述权 重因子的乘积, 作为所述加权处 理的结果。 8.根据权利要求6所述的方法, 其中, 所述确定基础值包括: 当所述实 际干预情况为有干预时, 利用所述行为标签减去所述第二预测结果, 得到所 述基础值; 或, 当所述实 际干预情况为无干预时, 利用所述第一预测结果减去所述行为标签, 得到所 述基础值。 9.根据权利要求6所述的方法, 其中, 所述确定修 正值包括: 当所述实 际干预情况为有干预时, 利用所述行为标签减去所述第一预测结果, 得到所 述修正值; 或, 当所述实 际干预情况为无干预时, 利用所述第二预测结果减去所述行为标签, 得到所 述修正值。 10.根据权利要求6 ‑9中任一项所述的方法, 其中, 确定所述增益标签, 包括:权 利 要 求 书 1/2 页 2 CN 114139724 A 2确定所述基础值与所述加权处 理的结果之间的和值, 作为所述增益标签。 11.根据权利要求1所述的方法, 其中, 所述用户集中所述有干预用户的数量小于所述 无干预用户的数量。 12.一种增益模型的训练装置, 包括: 预测单元, 配置为将用户集中任意目标用户的用户特征, 分别输入基于有干预用户而 训练的第一预测模型、 基于无干预用户而训练的第二预测模型和干预倾向预测模型, 对应 得到该目标用户针对目标行为的第一预测结果, 第二预测结果, 和该用户是否被干预 的干 预倾向分数; 标签确定单元, 配置为根据所述第一预测结果、 第二预测结果、 干预倾向分数, 以及该 目标用户的行为标签, 确定该目标用户响应干预 的增益标签, 所述增益标签与所述干预倾 向分数成线性关系; 训练单元, 配置为基于所述用户集中各个用户的用户特征和增益标签, 训练所述增益 模型。 13.一种计算机可读存储介质, 其上存储有计算机程序, 其中, 当所述计算机程序在计 算机中执 行时, 令计算机执 行权利要求1 ‑11中任一项所述的方法。 14.一种计算设备, 包括存储器和处理器, 其中, 所述存储器中存储有可执行代码, 所述 处理器执行所述可执行代码时, 实现权利要求1 ‑11中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114139724 A 3

.PDF文档 专利 增益模型的训练方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 增益模型的训练方法及装置 第 1 页 专利 增益模型的训练方法及装置 第 2 页 专利 增益模型的训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:21:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。