金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111427501.4 (22)申请日 2021.11.29 (65)同一申请的已公布的文献号 申请公布号 CN 113837162 A (43)申请公布日 2021.12.24 (73)专利权人 腾讯科技 (深圳) 有限公司 地址 518044 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 韦伟  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 代理人 朱佳 (51)Int.Cl. G06V 20/58(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (56)对比文件 CN 110345950 A,2019.10.18 CN 111783889 A,2020.10.16 CN 113239249 A,2021.08.10 审查员 张露 (54)发明名称 数据处理方法及相关装置 (57)摘要 本申请涉及计算机技术领域, 提供一种模 型 训练方法及相关装置, 可应用于地图、 交通、 车 载、 自动驾驶、 云技术、 人工智能、 辅助驾驶等各 种场景, 用以提高道路类型的识别准确率, 其中, 方法包括: 基于获取的目标道路样本集合, 获得 多组训练数据, 其中, 每组训练数据中包含至少 三个目标道路样本, 至少三个目标道路样本中的 一个目标道路样本的道路类型与其他目标道路 样本的道路类型不同, 然后, 将多组训练数据分 别输入待训练的道路特征转换模型进行迭代训 练, 并输出目标道路特征转换模型。 这样, 通过学 习道路特征转换方式, 提高机器学习模型的准确 率, 进而在模型应用过程中, 提高道路类型的识 别准确率。 权利要求书3页 说明书16页 附图8页 CN 113837162 B 2022.04.08 CN 113837162 B 1.一种数据处 理方法, 其特 征在于, 该 方法包括: 获取各个应用场景各自对应的候选道路样本集合, 并基于指定的样本抽取比例, 分别 从所述各个应用场景各自对应的候选道路样本集合中, 抽取出目标道路样本集合, 其中, 每 个目标道路样本中包 含相应的道路特 征信息, 每 个应用场景 是基于地理位置区域划分的; 基于所述目标道路样本集合, 获得多组训练数据, 其中, 每组训练数据中包含至少三个 目标道路样本, 所述至少三个目标道路样本中的一个目标道路样本的道路类型, 与其他 目 标道路样本的道路类型不同; 将所述多组训练数据, 分别输入待训练的道路特征转换模型进行迭代训练, 并输出目 标道路特征转换模型; 其中, 在每次训练中, 基于所述道路特征转换模型, 获得一组训练数 据中, 至少三个目标道路样本各自对应的道路特征编码, 并基于得到的各个道路特征编码 对应的模型损失值, 进行模型参数调整; 获取目标应用场景中待识别道路的道路特征信 息, 以及获取所述目标应用场景中包含 的各种候选道路类型各自对应的道路特征编码集合; 其中, 所述各个应用场景中包含所述 目标应用场景, 每种候选道路类型对应的道路特征编 码集合是基于所述目标道路特征转换 模型得到的; 将所述待识别道路的道路特征信息, 输入至所述目标道路特征转换模型中, 并输出所 述待识别道路对应的待识别道路特 征编码; 基于所述待识别道路特征编码和获取的各个道路特征编码集合, 确定所述待识别道路 的目标道路类型; 其中, 每个道路特征信息中至少包含道路静态属性信息, 所述道路静态属性信息中包 括以下信息中的至少一项: 道路等级、 道路宽度、 车道数、 道路长度、 道路铺设情况。 2.如权利要求1所述的方法, 其特征在于, 所述至少三个目标道路样本包括第一样本、 第二样本和第三样本, 所述第一样本和所述第二样本的道路类型相同, 所述第一样本和所 述第三样本的道路类型不同; 所述模型损失值是通过以下 方式确定的: 基于得到的各个道路特征编码, 确定所述一组训练数据中, 所述第一样本和所述第二 样本的道路特 征编码之间的第一距离; 基于得到的各个道路特征编码, 确定所述一组训练数据中, 所述第一样本和所述第三 样本的道路特 征编码之间的第二距离; 基于确定的第一距离和第二距离, 确定所述各个道路特 征编码对应的模型损失值。 3.如权利要求2所述的方法, 其特征在于, 所述基于确定的第一距离和第二距离, 确定 所述各个道路特 征编码对应的模型损失值, 包括: 确定所述第一距离与所述第二距离之间的差值; 基于所述差值和预设的差值范围, 得到所述各个道路特 征编码对应的模型损失值。 4.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述基于所述待识别道路特征编 码和获取的各个道路特 征编码集 合, 确定所述待识别道路的目标道路类型, 包括: 分别确定所述待识别道路特 征编码与所述各个道路特 征编码集 合之间的距离; 将所述各个道路特征编码集合中, 与所述待识别道路特征编码之间的距离不大于距离 门限值的道路特 征编码集 合对应的候选道路类型, 作为所述待识别道路的目标道路类型。权 利 要 求 书 1/3 页 2 CN 113837162 B 25.如权利要求4所述的方法, 其特征在于, 所述分别确定所述待识别道路特征编码与 所 述各个道路特 征编码集 合之间的距离, 包括: 分别确定所述待识别道路特征编码, 与 所述各个道路特征编码集合各自包含的各个道 路特征编码之间的第三距离, 并基于确定的各个第三距离, 得到所述待识别道路特征编码 与所述各个道路特 征编码集 合之间的距离; 或者, 将所述识别道路特征编码, 与所述各个道路特征编码集合各自对应的平均 特征编码之 间的距离, 分别作为所述待识别道路特 征编码与所述各个道路特 征编码集 合之间的距离 。 6.如权利要求5所述的方法, 其特征在于, 所述基于确定的各个第三距离, 得到所述待 识别道路特 征编码与所述各个道路特 征编码集 合之间的距离, 包括: 基于所述各个道路特征编码集合各自对应的各个第 三距离, 以及所述各个道路特征编 码集合各自对应的特征编码总数目, 确定所述各个道路特征编码集合各自对应的平均距 离; 将所述各个道路特征编码集合各自对应的平均距离, 分别作为所述待识别道路特征编 码与所述各个道路特 征编码集 合之间的距离 。 7.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述各种候选道路类型各自对应 的道路特 征编码集 合是通过以下 方式确定的: 获取目标应用场景对应的候选道路样本集合, 每个候选道路样本 中包含相应的道路特 征信息; 将所述候选道路样本集合中包含的各个候选道路样本, 分别输入至所述目标道路特征 转换模型中, 输出 所述各个候选道路样本各自对应的道路特 征编码; 基于各种候选道路类型, 得到所述各种候选道路类型 各自对应的道路特 征编码集 合。 8.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述道路特征信息 中还包含以下 信息中的至少一项: 道路流量特征信息、 道路车速特征信息、 道路车流密度特征信息、 道路 偏航特征信息、 道路邻域特 征信息、 道路多媒体信息 。 9.一种数据处 理装置, 其特 征在于, 包括: 获取单元, 用于获取各个应用场景各自对应的候选道路样本集合, 并基于指定的样本 抽取比例, 分别从所述各个应用场景各自对应的候选道路样本集合中, 抽取出目标道路样 本集合, 其中, 每个目标道路样本中包含相应的道路特征信息, 每个应用场景是基于地理位 置区域划分的; 组合单元, 用于基于所述目标道路样本集合, 获得多组训练数据, 其中, 每组训练数据 中包含至少三个目标道路样本, 所述至少三个目标道路样本中的一个目标道路样本的道路 类型, 与其 他目标道路样本的道路类型不同; 训练单元, 用于将所述多组训练数据, 分别输入待训练的道路特征转换模型进行迭代 训练, 并输出目标道路特征转换模型; 其中, 在每次训练中, 基于所述道路特征转换模型, 获 得一组训练数据中, 至少三个目标道路样本各自对应的道路特征编码, 并基于得到的各个 道路特征编码对应的模型损失值, 进行模型参数调整; 应用单元, 用于获取目标应用场景中待识别道路的道路特征信息, 以及获取所述目标 应用场景中包含的各种候选道路类型各自对应的道路特征编码集合, 其中, 每种候选道路 类型对应的道路特征编 码集合是基于所述目标道路特征转换模型得到的, 所述各个应用场权 利 要 求 书 2/3 页 3 CN 113837162 B 3

.PDF文档 专利 数据处理方法及相关装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法及相关装置 第 1 页 专利 数据处理方法及相关装置 第 2 页 专利 数据处理方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:22:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。