专利 用户类别确定方法、装置、设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202111432853.9 (22)申请日 2021.11.29 (65)同一申请的已公布的文献号申请公布号 CN 113850632 A (43)申请公布日 2021.12.28 (73)专利权人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人任杰　张茜　张莉　 (74)专利代理机构深圳市赛恩倍吉知识产权代理有限公司 4 4334 代理人严林 (51)Int.Cl. G06Q 30/02(2012.01)G06K 9/62(2022.01) G06N 20/00(2019.01) 审查员李平 (54)发明名称用户类别确定方法、装置、设备及存储介质 (57)摘要本发明涉及人工智能，提供一种用户类别确定方法、装置、设备及存储介质。该方法能够获取包括第一特征信息的多个初始样本及包括第二特征信息的多个待选样本，根据第一特征信息分析任意两个初始样本的相似度，得到第一相似矩阵，根据任一待选样本在多个初始样本中的多个插入位置分析第一特征信息及第二特征信息，得到多个第二相似矩阵，对第一相似矩阵及多个第二相似矩阵进行评价处理，得到第一清晰度及多个第二清晰度，筛选目标位置并选取入选样本，得到训练样本，调整分类学习器，基于分类模型分析待测用户的维度信息，得到用户类别，能够提高用户类别的确定准确性。此外，本发明还涉及区块链技术，所述用户类别可存储于区块链中。权利要求书4页说明书19页附图2页 CN 113850632 B 2022.03.01 CN 113850632 B 1.一种用户类别确定方法，其特征在于，所述用户类别确定方法包括：获取多个初始样本及多个待选样本，每个初始样本包括初始用户的第一特征信息，每个待选样本包括待选用户的第二特征信息，每个初始样本是指确定用于调整分类学习器的样本，所述第一特征信息是指所述初始用户在预设维度及预设时间上所对应的信息，每个待选样本是指用于调整所述分类学习器的待定样本，所述第二特征信息是指所述待选用户在所述预设维度及所述预设时间上所对应的信息；根据所述第一特征信息分析任意两个初始样本在预设维度上的相似度，得到所述多个初始样本的第一相似矩阵，包括：根据下列公式计算所述第一特征信息，得到所述任意两个初始样本在所述预设维度上的相似度：其中， MSE(x,y)是指初始样本x与初始样本y的相似度， m是指所述预设时间的时间总量， n是指所述预设维度的维度总量， x(i,j)是指所述初始样本x在第i个预设维度及第j个预设时间上所对应的第一特征信息， y(i,j)是指所述初始样本y在第i个预设维度及第j个预设时间上所对应的第一特征信息；根据所述多个初始样本的样本数量生成初始矩阵，并根据所述多个初始样本的样本顺序将所述相似度及预设相似值填充至所述初始矩阵中，得到所述第一相似矩阵，所述初始矩阵是指行数及列数为所述样本数量的空矩阵，所述样本顺序是指每个初始样本在所述多个初始样本中的序号，所述预设相似值是指每个初始样本自身的相似度；根据任一待选样本在所述多个初始样本中的多个插入位置、所述第一特征信息及所述第二特征信息分析所述任一待选样本与所述多个初始样本的相似度，得到与所述多个插入位置对应的多个第二相似矩阵；基于图像清晰度评价算法对所述第一相似矩阵进行评价处理，得到所述第一相似矩阵的第一清晰度，包括：根据下列公式分析所述第一相似矩阵中任意相邻元素，得到所述第一清晰度：其中， D(f)是指所述第一清晰度， q是指所述第一相似矩阵中的总行数与 t的差值， v是指所述第一相似矩阵中的总列数， t 为大于1的正整数， f(x+t,y)是指所述第一相似矩阵中第x+t行及第y行所对应的元素， f(x, y)是指所述第一相似矩阵中第x行及第y行所对应的元素，并对所述多个第二相似矩阵进行评价处理，得到多个第二清晰度，所述第一清晰度用于指示所述第一相似矩阵中任意两个初始样本的相似度所对应的差异度总和，每个第二清晰度用于指示对应的第二相似矩阵中任意两个初始样本的相似度所对应的差异度总和；基于所述多个第二清晰度及所述第一清晰度从所述多个插入位置中筛选目标位置，包括：计算每个第二清晰度与所述第一清晰度的差值，得到多个清晰度变化值；将取值最大的清晰度变化值所对应的插入位置确定为所述目标位置；根据所述多个初始样本及所述目标位置从所述多个待选样本中选取入选样本，并将所述多个初始样本及所述入选样本确定为训练样本；基于所述训练样本调整预先构建好的分类学习器，得到分类模型；当接收到类别确定请求时，根据所述类别确定请求获取待测用户在所述预设维度上的维度信息；权　利　要　求　书 1/4 页 2 CN 113850632 B 2根据所述分类模型分析所述维度信息，得到所述待测用户所属的用户类别。 2.如权利要求1所述的用户类别确定方法，其特征在于，所述根据所述多个初始样本及所述目标位置从所述多个待选样本中选取入选样本还包括：根据所述目标位置依次将每个待选样本插入所述多个初始样本中，得到多个特征序列；计算每个特征序列中多个特征样本的相似度，得到每个特征序列的特征相似矩阵，并计算每个特征相似矩阵的特征清晰度；计算每个特征清晰度与所述第一清晰度的差值，得到清晰影响值，并将取值最小的清晰影响值所对应的特征序列确定为目标序列；将所述目标序列中的待选样本确定为所述入选样本，并将所述目标序列中的多个特征样本确定为下一次迭代处理的多个初始样本；将所述入选样本从所述多个待选样本中删除，得到处理后的待选样本；基于所述下一次迭代处理的多个初始样本对所述处理后的待选样本进行迭代筛选，直至所述目标序列的序列增益值小于目标增益值，得到所述入选样本。 3.如权利要求2所述的用户类别确定方法，其特征在于，所述方法还包括：根据多个所述特征清晰度及所述第一清晰度生成关系曲线；对所述关系曲线进行求导分析处理，得到导数曲线；根据所述导数曲线计算所述目标序列的特征清晰度及所述目标序列的序列数量，得到所述序列增益值；基于所述导数曲线及所述多个初始样本生成所述目标增益值： Y＝ μ‑3σ；其中， Y是指所述目标增益值， D ′(f,x)是指第x个初始样本在所述导数曲线上的导数值， μ是指所述多个初始样本在所述导数曲线上的导数值的平均值， σ 是指所述多个初始样本在所述导数曲线上的导数值的方差值， N是指所述多个初始样本的样本数量。 4.如权利要求1所述的用户类别确定方法，其特征在于，所述基于所述多个第二清晰度及所述第一清晰度从所述多个插入位置中筛选目标位置包括：计算每个第二清晰度与所述第一清晰度的差值，得到多个清晰度变化值；将取值最大的清晰度变化值所对应的插入位置确定为所述目标位置。 5.如权利要求4所述的用户类别确定方法，其特征在于，所述根据所述多个初始样本及所述目标位置从所述多个待选样本中选取入选样本包括：将取值最大的清晰度变化值确定为目标变化值；若所述目标变化值大于或者等于预设阈值，则将所述任一待选样本确定为所述入选样本，并将所述多个初始样本及所述入选样本确定为下一次迭代处理的多个初始样本；基于所述下一次迭代处理的多个初始样本对所述多个待选样本进行迭代筛选，直至所述多个待选样本均参与筛选，得到所述入选样本；或者权　利　要　求　书 2/4 页 3 CN 113850632 B 3

专利 用户类别确定方法、装置、设备及存储介质

专利用户类别确定方法、装置、设备及存储介质