金融行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111407783.1 (22)申请日 2021.11.24 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 李一鸣 张子琪 邱伟峰 江勇 夏树涛 (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 周良玉 (51)Int.Cl. G06F 21/16(2013.01) G06N 20/00(2019.01) (54)发明名称 用于数据集的所有权验证方法和装置 (57)摘要 本说明书实施例提供了一种用 于数据集的 所有权验证方法和装置。 该方法的一具体实施方 式包括: 从初始样本集中选取部分初始样本构成 选中样本集; 对于上述选中样 本集中的各选中样 本, 使用预设的模板样本对其样 本数据进行水印 嵌入, 并调整该选中样本的标签, 得到对应的水 印样本; 各水印样本构成水印样本集; 使用上述 水印样本集和上述初始样本集中除上述选中样 本集之外的剩余样本集构成目标样 本集; 基于初 始样本和水印样本, 使用目标假 设检验方法对可 疑模型进行验证, 确定上述可疑模 型是否为基于 上述目标样本集训练得到的模型。 权利要求书2页 说明书9页 附图2页 CN 114090968 A 2022.02.25 CN 114090968 A 1.一种用于数据集的所有权验证方法, 包括: 从初始样本集中选取部分初始样本构成选中样本集; 对于所述选 中样本集中的各选 中样本, 使用预设的模板样本对其样本数据进行水印嵌 入, 并调整该选中样本的标签, 得到对应的水印样本; 各 水印样本构成水印样本集; 使用所述水印样本集和所述初始样本集中除所述选中样本集之外的剩余样本集构成 目标样本集; 基于初始样本和水印样本, 使用目标假设检验方法对可疑模型进行验证, 确定所述可 疑模型是否为基于所述目标样本集训练得到的模型。 2.根据权利要求1所述的方法, 其中, 所述可疑模型的输出结果为分别针对多个类别标 签的多个预测概 率, 所述目标假设检验方法为T检验。 3.根据权利要求2所述的方法, 其中, 所述并调整该选中样本的标签, 包括: 将该选中样本的标签调整为目标 标签。 4.根据权利要求3所述的方法, 其中, 所述基于初始样本和水印样本, 使用目标假设检 验方法对可疑模型进 行验证, 确定所述可疑模型是否为基于所述目标样本集训练得到的模 型, 包括: 构建第一概率值与第一预设值之和大于第二概率的第一原假设, 其中, 第一概率值表 示所述可疑模型针对初始样本的输出结果中所述目标标签的预测概率值, 第二概率值表示 所述可疑模型针对水印样本的输出 结果中所述目标 标签的预测概 率值; 基于所述第一原假设、 初始样本的样本数据和水印样本的样本数据, 计算P值; 响应于确定所述P值小于 显著性水平, 确定所述第一原假设被拒绝; 响应于确定所述第 一原假设被拒 绝, 确定所述可疑模型为基于所述目标样本集训练得 到的模型。 5.根据权利要求2所述的方法, 其中, 所述并调整该选中样本的标签, 包括: 将该选中样本的标签调整为与原 始标签不同的标签。 6.根据权利要求5所述的方法, 其中, 所述基于初始样本和水印样本, 使用目标假设检 验方法对可疑模型进 行验证, 确定所述可疑模型是否为基于所述目标样本集训练得到的模 型, 包括: 构建第三概率值小于第 四概率值与第二预设值之和的第二原假设, 其中, 第三概率值 表示所述可疑模型针对初始样本的输出结果中原始标签的预测概率值, 第四概率值表示所 述可疑模型针对水印样本的输出 结果中原 始标签的预测概 率值; 基于所述第二原假设、 初始样本和水印样本, 计算P值; 响应于确定所述P值小于 显著性水平, 确定所述第二原假设被拒绝; 响应于确定所述第 二原假设被拒 绝, 确定所述可疑模型为基于所述目标样本集训练得 到的模型。 7.根据权利要求1所述的方法, 其中, 所述可疑模型的输出结果为类别, 所述目标假设 检验方法为单样本W ilcoxon检验。 8.根据权利要求1所述的方法, 其中, 所述初始样本集中初始样本的样本数据为样本图 像, 所述模板样本为模板图像; 以及 所述使用预设的模板样本对其样本数据进行 水印嵌入, 包括:权 利 要 求 书 1/2 页 2 CN 114090968 A 2根据预设的权重因子, 将所述选中样本对应的图像和所述模板 图像, 进行对应像素的 像素值加权组合。 9.根据权利要求1所述的方法, 其中, 所述初始样本集中的初始样本的样本数据为文本 信息, 所述模板样本为预定文本; 以及 所述使用预设的模板样本对其样本数据进行 水印嵌入, 包括: 将所述预定文本插 入所述选中样本的文本信息中, 得到嵌入水印的样本数据。 10.一种用于数据集的所有权验证装置, 包括: 选取单元, 配置为从初始样本集中选取部分初始样本构成选中样本集; 嵌入单元, 配置为对于所述选中样本集中的各选中样本, 使用预设的模板样本对其样 本数据进 行水印嵌入, 并调整 该选中样本的标签, 得到对应的水印样本; 各水印样本构成水 印样本集; 构成单元, 配置为使用所述水印样本集和所述初始样本集中除所述选中样本集之外的 剩余样本集构成目标样本集; 验证单元, 配置为基于初始样本和水印样本, 使用目标假设检验方法对可疑模型进行 验证, 确定所述可疑模型 是否为基于所述目标样本集训练得到的模型。 11.一种计算机可读存储介质, 其上存储有计算机程序, 当所述计算机程序在计算机中 执行时, 令计算机执 行权利要求1 ‑9中任一项所述的方法。 12.一种计算设备, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有可执行代 码, 所述处 理器执行所述可执行代码时, 实现权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114090968 A 3
专利 用于数据集的所有权验证方法和装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 01:22:29
上传分享
举报
下载
原文档
(562.3 KB)
分享
友情链接
DB3212-T 1122—2022 机关单位视频会议运维管理规范 泰州市.pdf
GB 12676-2014 商用车辆和挂车制动系统技术要求及试验方法.pdf
GB-T 6297-2002 陶瓷原料差热分析方法.pdf
GM-T 0125.1-2022 JSON Web 密码应用语法规范 第1部分:算法标识.pdf
DB35-T 1344-2013 橄榄丰产栽培技术规范 福建省.pdf
GB-T 33746.2-2017 近场通信(NFC)安全技术要求 第2部分:安全机制要求.pdf
T-HNCAA 052—2023 公路桥梁结构健康监测系统实施和验收标准.pdf
GB-T 38569-2020 工业微生物菌株质量评价 拉曼光谱法.pdf
GB-T 29321-2012 光伏发电站无功补偿技术规范.pdf
T-CFA 0201031—2018 金属切削机床球墨铸铁件 技术条件.pdf
POS终端 银行卡受理终端安全规范 第1部分销售点.pdf
GB-T 42107-2022 国家科技重大专项文件归档与档案管理规范.pdf
GB 17625.1-2022 电磁兼容 限值 第1部分:谐波电流发射限值 设备每相输入电流≤16A.pdf
GB-T 27513-2011 载人低压舱.pdf
GB-T 35580-2017 建设项目水资源论证导则.pdf
GA-T 913-2019 信息安全技术 数据库安全审计产品安全技术要求.pdf
BPMN2.0标准规范(中文版).pdf
GB-T 35749-2017 锦纶66弹力丝.pdf
GB-T 22264.3-2022 安装式数字显示电测量仪表 第3部分:功率表和无功功率表的特殊要求.pdf
信通院 量子信息技术发展与应用研究报告 2022年.pdf
1
/
3
14
评价文档
赞助2元 点击下载(562.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。