金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111432853.9 (22)申请日 2021.11.29 (65)同一申请的已公布的文献号 申请公布号 CN 113850632 A (43)申请公布日 2021.12.28 (73)专利权人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 任杰 张茜 张莉  (74)专利代理 机构 深圳市赛恩倍吉知识产权代 理有限公司 4 4334 代理人 严林 (51)Int.Cl. G06Q 30/02(2012.01)G06K 9/62(2022.01) G06N 20/00(2019.01) 审查员 李平 (54)发明名称 用户类别确定方法、 装置、 设备及存 储介质 (57)摘要 本发明涉及人工智能, 提供一种用户类别确 定方法、 装置、 设备及存储介质。 该方法能够获取 包括第一特征信息的多个初始样本及包括第二 特征信息的多个待选样本, 根据第一特征信息分 析任意两个初始样本的相似度, 得到第一相似矩 阵, 根据任一待选样本在多个初始样本中的多个 插入位置分析第一特征信息及第二特征信息, 得 到多个第二相似矩阵, 对第一相似矩阵及多个第 二相似矩阵进行评价处理, 得到第一清晰度及多 个第二清晰度, 筛选目标位置并选取入选样本, 得到训练样本, 调整分类学习器, 基于分类模型 分析待测用户的维度信息, 得到用户类别, 能够 提高用户类别的确定准确性。 此外, 本发明还涉 及区块链技术, 所述用户类别可存储于区块链 中。 权利要求书4页 说明书19页 附图2页 CN 113850632 B 2022.03.01 CN 113850632 B 1.一种用户类别确定方法, 其特 征在于, 所述用户类别确定方法包括: 获取多个初始样本及多个待选样本, 每个初始样本包括初始用户的第一特征信息, 每 个待选样本包括待选用户的第二特征信息, 每个初始样本是指确定用于调整分类学习器的 样本, 所述第一特征信息是指所述初始用户在预设维度及预设时间上所对应的信息, 每个 待选样本是指用于调整所述分类学习器的待定样本, 所述第二特征信息是指所述待选用户 在所述预设维度及所述预设时间上 所对应的信息; 根据所述第一特征信息分析任意两个初始样本在预设维度上的相似度, 得到所述多个初 始样本的第一相似矩阵, 包括: 根据下列公式计算所述第一特征信息, 得到所述任意两个初 始样本在所述预设维度上的相似度: 其中, MSE(x,y)是指初始样 本x与初始样 本y的相似度, m是指所述预设时间的时间总量, n是 指所述预设维度的维度总 量, x(i,j)是指所述初始样本x在第i个预设维度及第j个预设时 间上所对应的第一特征信息, y(i,j)是指所述初始样本y在第i个预设维度及第j个预设时 间上所对应的第一特征信息; 根据所述多个初始样本的样本数量生成初始矩阵, 并根据所 述多个初始样本的样本顺序将所述相似度及预设相似值填充至所述初始矩阵中, 得到所述 第一相似矩阵, 所述初始矩阵是指行数及列数为所述样本数量的空矩阵, 所述样本顺序是 指每个初始样本在所述多个初始样本中的序号, 所述预设相似值是指 每个初始样本自身的 相似度; 根据任一待选样本在所述多个初始样本 中的多个插入位置、 所述第 一特征信 息及所述 第二特征信息 分析所述任一待选样本与所述多个初始样本的相似度, 得到与所述多个插入 位置对应的多个第二相似矩阵; 基于图像清晰度评价算法对所述第 一相似矩阵进行评价处理, 得到所述第 一相似矩阵 的第一清晰度, 包括: 根据下列公 式分析所述第一相似矩阵中任意相 邻元素, 得到所述第一 清晰度: 其中, D(f)是指所述第一清晰 度, q是指所述第一相似矩阵中的总行数与 t的差值, v是指所述第一相似矩阵中的总列数, t 为大于1的正整数, f(x+t,y)是指所述第一相似矩阵中第x+t行及第y行所对应的元素, f(x, y)是指所述第一相似矩阵中第x行及第y行所对应的元素, 并对所述多个第二相似矩阵进 行 评价处理, 得到多个第二清晰度, 所述第一清晰度用于指示所述第一相似矩阵中任意两个 初始样本的相似度所对应的差异度总和, 每个第二清晰度用于指示对应的第二相似矩阵中 任意两个初始样本的相似度所对应的差异度总和; 基于所述多个第二清晰度及所述第 一清晰度从所述多个插入位置 中筛选目标位置, 包 括: 计算每个第二清晰度与所述第一清晰度的差值, 得到多个清晰度变化值; 将取值最大的 清晰度变化 值所对应的插 入位置确定为所述目标位置; 根据所述多个初始样本及所述目标位置从所述多个待选样本 中选取入选样本, 并将所 述多个初始样本及所述入选样本确定为训练样本; 基于所述训练样本调整预 先构建好的分类学习器, 得到分类模型; 当接收到类别确定请求 时, 根据所述类别确定请求获取待测用户在所述预设维度 上的 维度信息;权 利 要 求 书 1/4 页 2 CN 113850632 B 2根据所述分类模型分析 所述维度信息, 得到所述待测用户所属的用户类别。 2.如权利要求1所述的用户类别确定方法, 其特征在于, 所述根据 所述多个初始样本及 所述目标位置从所述多个待选样本中选取入选样本还 包括: 根据所述目标位置依次将每个待选样本插入所述多个初始样本中, 得到多个特征序 列; 计算每个特征序列中多个特征样本的相似度, 得到每个特征序列的特征相似矩阵, 并 计算每个特征相似矩阵的特 征清晰度; 计算每个特征清晰度与所述第一清晰度的差值, 得到清晰影响值, 并将取值最小的清 晰影响值所对应的特 征序列确定为目标序列; 将所述目标序列中的待选样本确定为所述入选样本, 并将所述目标序列中的多个特征 样本确定为下一次迭代处 理的多个初始样本; 将所述入选样本从所述多个待选样本中删除, 得到处 理后的待选样本; 基于所述下一 次迭代处理的多个初始样本对所述处理后的待选样本进行迭代筛选, 直 至所述目标序列的序列增益 值小于目标增益 值, 得到所述入选样本 。 3.如权利要求2所述的用户类别确定方法, 其特 征在于, 所述方法还 包括: 根据多个所述特 征清晰度及所述第一清晰度生成关系曲线; 对所述关系曲线 进行求导分析处 理, 得到导数曲线; 根据所述导数曲线计算所述目标序列的特征清晰度及所述目标序列的序列 数量, 得到 所述序列增益 值; 基于所述 导数曲线及所述多个初始样本生成所述目标增益 值: Y= μ‑3σ; 其中, Y是指所述目标增益值, D ′(f,x)是指第x个初始样本在所述导数曲线上的导数 值, μ是指所述多个初始样本在所述导数曲线上 的导数值的平均值, σ 是指所述多个初始样 本在所述 导数曲线上的导数值的方差值, N是指所述多个初始样本的样本数量。 4.如权利要求1所述的用户类别确定方法, 其特征在于, 所述基于所述多个第 二清晰度 及所述第一清晰度从所述多个插 入位置中筛 选目标位置包括: 计算每个第二清晰度与所述第一清晰度的差值, 得到多个清晰度变化 值; 将取值最大的清晰度变化 值所对应的插 入位置确定为所述目标位置 。 5.如权利要求4所述的用户类别确定方法, 其特征在于, 所述根据 所述多个初始样本及 所述目标位置从所述多个待选样本中选取入选样本包括: 将取值最大的清晰度变化 值确定为目标变化 值; 若所述目标变化值大于或者等于预设阈值, 则将所述任一待选样本确定为所述入选样 本, 并将所述多个初始样本及所述入选样本确定为下一次迭代处 理的多个初始样本; 基于所述下一 次迭代处理的多个初始样本对所述多个待选样本进行迭代筛选, 直至所 述多个待选样本均参与筛 选, 得到所述入选样本; 或者权 利 要 求 书 2/4 页 3 CN 113850632 B 3

.PDF文档 专利 用户类别确定方法、装置、设备及存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户类别确定方法、装置、设备及存储介质 第 1 页 专利 用户类别确定方法、装置、设备及存储介质 第 2 页 专利 用户类别确定方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:22:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。