(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111427501.4
(22)申请日 2021.11.29
(65)同一申请的已公布的文献号
申请公布号 CN 113837162 A
(43)申请公布日 2021.12.24
(73)专利权人 腾讯科技 (深圳) 有限公司
地址 518044 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 韦伟
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
代理人 朱佳
(51)Int.Cl.
G06V 20/58(2022.01)
G06V 10/774(2022.01)G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 20/00(2019.01)
(56)对比文件
CN 110345950 A,2019.10.18
CN 111783889 A,2020.10.16
CN 113239249 A,2021.08.10
审查员 张露
(54)发明名称
数据处理方法及相关装置
(57)摘要
本申请涉及计算机技术领域, 提供一种模 型
训练方法及相关装置, 可应用于地图、 交通、 车
载、 自动驾驶、 云技术、 人工智能、 辅助驾驶等各
种场景, 用以提高道路类型的识别准确率, 其中,
方法包括: 基于获取的目标道路样本集合, 获得
多组训练数据, 其中, 每组训练数据中包含至少
三个目标道路样本, 至少三个目标道路样本中的
一个目标道路样本的道路类型与其他目标道路
样本的道路类型不同, 然后, 将多组训练数据分
别输入待训练的道路特征转换模型进行迭代训
练, 并输出目标道路特征转换模型。 这样, 通过学
习道路特征转换方式, 提高机器学习模型的准确
率, 进而在模型应用过程中, 提高道路类型的识
别准确率。
权利要求书3页 说明书16页 附图8页
CN 113837162 B
2022.04.08
CN 113837162 B
1.一种数据处 理方法, 其特 征在于, 该 方法包括:
获取各个应用场景各自对应的候选道路样本集合, 并基于指定的样本抽取比例, 分别
从所述各个应用场景各自对应的候选道路样本集合中, 抽取出目标道路样本集合, 其中, 每
个目标道路样本中包 含相应的道路特 征信息, 每 个应用场景 是基于地理位置区域划分的;
基于所述目标道路样本集合, 获得多组训练数据, 其中, 每组训练数据中包含至少三个
目标道路样本, 所述至少三个目标道路样本中的一个目标道路样本的道路类型, 与其他 目
标道路样本的道路类型不同;
将所述多组训练数据, 分别输入待训练的道路特征转换模型进行迭代训练, 并输出目
标道路特征转换模型; 其中, 在每次训练中, 基于所述道路特征转换模型, 获得一组训练数
据中, 至少三个目标道路样本各自对应的道路特征编码, 并基于得到的各个道路特征编码
对应的模型损失值, 进行模型参数调整;
获取目标应用场景中待识别道路的道路特征信 息, 以及获取所述目标应用场景中包含
的各种候选道路类型各自对应的道路特征编码集合; 其中, 所述各个应用场景中包含所述
目标应用场景, 每种候选道路类型对应的道路特征编 码集合是基于所述目标道路特征转换
模型得到的;
将所述待识别道路的道路特征信息, 输入至所述目标道路特征转换模型中, 并输出所
述待识别道路对应的待识别道路特 征编码;
基于所述待识别道路特征编码和获取的各个道路特征编码集合, 确定所述待识别道路
的目标道路类型;
其中, 每个道路特征信息中至少包含道路静态属性信息, 所述道路静态属性信息中包
括以下信息中的至少一项: 道路等级、 道路宽度、 车道数、 道路长度、 道路铺设情况。
2.如权利要求1所述的方法, 其特征在于, 所述至少三个目标道路样本包括第一样本、
第二样本和第三样本, 所述第一样本和所述第二样本的道路类型相同, 所述第一样本和所
述第三样本的道路类型不同;
所述模型损失值是通过以下 方式确定的:
基于得到的各个道路特征编码, 确定所述一组训练数据中, 所述第一样本和所述第二
样本的道路特 征编码之间的第一距离;
基于得到的各个道路特征编码, 确定所述一组训练数据中, 所述第一样本和所述第三
样本的道路特 征编码之间的第二距离;
基于确定的第一距离和第二距离, 确定所述各个道路特 征编码对应的模型损失值。
3.如权利要求2所述的方法, 其特征在于, 所述基于确定的第一距离和第二距离, 确定
所述各个道路特 征编码对应的模型损失值, 包括:
确定所述第一距离与所述第二距离之间的差值;
基于所述差值和预设的差值范围, 得到所述各个道路特 征编码对应的模型损失值。
4.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述基于所述待识别道路特征编
码和获取的各个道路特 征编码集 合, 确定所述待识别道路的目标道路类型, 包括:
分别确定所述待识别道路特 征编码与所述各个道路特 征编码集 合之间的距离;
将所述各个道路特征编码集合中, 与所述待识别道路特征编码之间的距离不大于距离
门限值的道路特 征编码集 合对应的候选道路类型, 作为所述待识别道路的目标道路类型。权 利 要 求 书 1/3 页
2
CN 113837162 B
25.如权利要求4所述的方法, 其特征在于, 所述分别确定所述待识别道路特征编码与 所
述各个道路特 征编码集 合之间的距离, 包括:
分别确定所述待识别道路特征编码, 与 所述各个道路特征编码集合各自包含的各个道
路特征编码之间的第三距离, 并基于确定的各个第三距离, 得到所述待识别道路特征编码
与所述各个道路特 征编码集 合之间的距离; 或者,
将所述识别道路特征编码, 与所述各个道路特征编码集合各自对应的平均 特征编码之
间的距离, 分别作为所述待识别道路特 征编码与所述各个道路特 征编码集 合之间的距离 。
6.如权利要求5所述的方法, 其特征在于, 所述基于确定的各个第三距离, 得到所述待
识别道路特 征编码与所述各个道路特 征编码集 合之间的距离, 包括:
基于所述各个道路特征编码集合各自对应的各个第 三距离, 以及所述各个道路特征编
码集合各自对应的特征编码总数目, 确定所述各个道路特征编码集合各自对应的平均距
离;
将所述各个道路特征编码集合各自对应的平均距离, 分别作为所述待识别道路特征编
码与所述各个道路特 征编码集 合之间的距离 。
7.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述各种候选道路类型各自对应
的道路特 征编码集 合是通过以下 方式确定的:
获取目标应用场景对应的候选道路样本集合, 每个候选道路样本 中包含相应的道路特
征信息;
将所述候选道路样本集合中包含的各个候选道路样本, 分别输入至所述目标道路特征
转换模型中, 输出 所述各个候选道路样本各自对应的道路特 征编码;
基于各种候选道路类型, 得到所述各种候选道路类型 各自对应的道路特 征编码集 合。
8.如权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述道路特征信息 中还包含以下
信息中的至少一项: 道路流量特征信息、 道路车速特征信息、 道路车流密度特征信息、 道路
偏航特征信息、 道路邻域特 征信息、 道路多媒体信息 。
9.一种数据处 理装置, 其特 征在于, 包括:
获取单元, 用于获取各个应用场景各自对应的候选道路样本集合, 并基于指定的样本
抽取比例, 分别从所述各个应用场景各自对应的候选道路样本集合中, 抽取出目标道路样
本集合, 其中, 每个目标道路样本中包含相应的道路特征信息, 每个应用场景是基于地理位
置区域划分的;
组合单元, 用于基于所述目标道路样本集合, 获得多组训练数据, 其中, 每组训练数据
中包含至少三个目标道路样本, 所述至少三个目标道路样本中的一个目标道路样本的道路
类型, 与其 他目标道路样本的道路类型不同;
训练单元, 用于将所述多组训练数据, 分别输入待训练的道路特征转换模型进行迭代
训练, 并输出目标道路特征转换模型; 其中, 在每次训练中, 基于所述道路特征转换模型, 获
得一组训练数据中, 至少三个目标道路样本各自对应的道路特征编码, 并基于得到的各个
道路特征编码对应的模型损失值, 进行模型参数调整;
应用单元, 用于获取目标应用场景中待识别道路的道路特征信息, 以及获取所述目标
应用场景中包含的各种候选道路类型各自对应的道路特征编码集合, 其中, 每种候选道路
类型对应的道路特征编 码集合是基于所述目标道路特征转换模型得到的, 所述各个应用场权 利 要 求 书 2/3 页
3
CN 113837162 B
3
专利 数据处理方法及相关装置
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:22:10上传分享