金融行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111474349.5 (22)申请日 2021.12.0 3 (71)申请人 阿里巴巴达摩院 (杭州) 科技有限公 司 地址 310023 浙江省杭州市余杭区五常街 道文一西路969号3幢5层516室 (72)发明人 翁荣祥 于恒 骆卫华 (74)专利代理 机构 北京合智同创知识产权代理 有限公司 1 1545 代理人 李杰 杨雷 (51)Int.Cl. G06F 40/166(2020.01) G06N 20/00(2019.01) (54)发明名称 模型训练和文本生成方法、 装置、 电子设备 和存储介质 (57)摘要 本发明实施例提供了一种模型训练和文本 生成方法、 装置、 电子设备和存储介质。 所述模型 训练方法包括: 获取第一训练样本, 所述第一训 练样本包括第一文本和所述第一文本的上下文 掩码文本; 基于所述第一文本作为输入, 基于所 述上下文掩码文本作为监督条件, 对基于时序文 本序列的文本生成模型进行训练。 在本发明实施 例的方案中, 由于文本生 成模型采用第一文本的 上下文掩码文本作为监督条件进行训练, 使文本 生成模型能够学习到第一文本中的上下文信息, 因此使训练后的模型能够生成更准确的文本 。 权利要求书2页 说明书9页 附图3页 CN 114169295 A 2022.03.11 CN 114169295 A 1.一种模型训练方法, 包括: 获取第一训练样本, 所述第 一训练样本包括第 一文本和所述第 一文本的上下文掩码文 本; 基于所述第一文本作为输入, 基于所述上下文掩码文本作为监督条件, 对基于时序文 本序列的文本生成模型进行训练。 2.根据权利要求1所述的方法, 其中, 所述方法还 包括: 获取第二训练样本, 所述第二训练样本包括第二文本和所述第二文本的标签文本, 所 述方法还 包括: 基于所述第二文本作为输入, 基于所述标签文本作为监督条件, 对所述文本生成模型 进行训练。 3.根据权利要求2所述的方法, 其中, 所述第一训练样本用于上下文学习任务, 所述第 二训练样本用于文本生成任务, 所述对基于时序文本序列的文本生成模型进行训练, 包括: 采用所述第 一训练样本和所述第 二训练样本, 对所述文本生成模型进行基于所述上下 文学习任务和文本生成任务的联合训练。 4.根据权利要求3所述的方法, 其中, 所述采用所述第一训练样本和所述第二训练样 本, 对所述文本生成模型进行基于所述上 下文学习任务和文本生成任务的联合训练, 包括: 根据目标函数, 对所述文本生成膜进行基于所述上下文学习任务和文本生成任务的联 合训练, 其中, 所述 目标函数包括第一函数和第二函数, 在所述联合训练过程中, 所述第一 函数通过所述第一文本和所述上下文掩码样本确定, 所述第二函数通过所述第二文本和所 述标签文本确定 。 5.根据权利要求4所述的方法, 其中, 所述目标函数为所述第 一函数和所述第 二函数的 和。 6.根据权利要求4所述的方法, 其中, 所述第 一函数根据 所述上下文掩码样本基于所述 第一文本的条件概率确定, 所述第二函数根据所述标签文本基于所述第二文本的条件概率 确定。 7.根据权利要求3所述的方法, 其中, 对所述文本生成模型进行基于所述上下文学习 任 务和文本生成任务的联合训练, 包括: 基于所述上 下文学习任务和文本生成任务, 对所述文本生成模型进行交替训练。 8.根据权利要求1所述的方法, 其中, 所述获取第一训练样本, 包括: 获取第一文本; 对所述第一文本进行掩码处 理, 得到所述第一文本的上 下文掩码文本 。 9.根据权利要求8所述的方法, 其中, 所述对所述第一文本进行掩码处理, 得到所述第 一文本的上 下文掩码文本, 包括: 基于所述第一文本中的语义依存信息, 对所述第一文本进行上下文掩码处理, 得到所 述上下文掩码文本 。 10.一种文本生成方法, 包括: 获取目标文本; 将所述目标文本输入到基于时序文本序列的文本生成模型中, 得到生成文本, 其中, 所权 利 要 求 书 1/2 页 2 CN 114169295 A 2述文本生成模型根据权利要求1 ‑9中任一项所述的模型训练方法训练得到 。 11.一种电子设备, 包括: 处理器、 存储器、 通信 接口和通信总线, 所述处理器、 所述存储 器和所述通信接口通过所述通信总线完成相互间的通信; 所述存储器用于存放至少一可执 行指令, 所述可执行指 令使所述处理器执行如权利要求 1‑10中任一项 所述的方法对应的操 作。 12.一种计算机存储介质, 其上存储有计算机程序, 该程序被处理器执行时实现如权利 要求1‑10中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114169295 A 3
专利 模型训练和文本生成方法、装置、电子设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 01:22:19
上传分享
举报
下载
原文档
(485.0 KB)
分享
友情链接
NB-T 10691-2021 数据中心机房用不间断电源系统.pdf
GB-T 14055.1-2008 中子参考辐射 第1部分:辐射特性和产生方法.pdf
WS-T 640-2018 临床微生物学检验样本的采集和转运.pdf
信通院 数据治理研究报告-2020年——培育数据要素市场路线图.pdf
T-CSTM 00046.12—2018 低合金结构钢腐蚀试验 第12部分:电偶腐蚀试验方法.pdf
GB/T 40127-2021 全断面隧道掘进机 顶管机安全要求.pdf
GB-T 42569-2023 工业互联网平台 开放应用编程接口功能要求.pdf
YD-T 4251-2023 电信运营商大数据安全管控分类分级技术要求.pdf
GB-T 7826-2012 系统可靠性分析技术 失效模式和影响分析 FMEA 程序.pdf
GB-T 42327-2023 船用固定式化学干粉灭火系统.pdf
SL 285-2020 水利水电工程进水口设计规范.pdf
YD-T 4044-2022 基于人工智能的知识图谱构建技术要求.pdf
GB-T 33134-2023 信息安全技术 公共域名服务系统安全要求.pdf
LY-T 3159-2019 细木工板生产节能技术规范.pdf
OWASP go语言 安全编码实践指南 中文版.pdf
GB-T 42461-2023 信息安全技术 网络安全服务成本度量指南.pdf
GB-T 33131-2016 信息安全技术 基于IPSec的IP存储网络安全技术要求.pdf
GB-T 36896.2-2018 轻型有缆遥控水下机器人 第2部分:机械手与液压系统.pdf
GB-T 3730.1-2022 汽车、挂车及汽车列车的术语和定义 第1部分:类型.pdf
信息技术 大数据 数据治理实施指南.pdf
1
/
3
15
评价文档
赞助2元 点击下载(485.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。