比思論壇

標題: 基于姿态信息的行人重识别方法研究 [打印本頁]

作者: 雷克儿 時間: 前天 22:29
標題: 基于姿态信息的行人重识别方法研究
随着人工智能技术的迅速发展，智能化视频监控技术成为城市安全防范体系的重要一环。近年来，人脸识别技术愈发成熟，被广泛用于各类监控系统中进行行人身份核对。然而现实场景的视频监控系统无法保证在各类复杂环境下拍摄到清晰的人脸图像。因此，利用全身信息进行行人身份核对与识别变得尤为重要。行人重识别，是一种利用计算机视觉方法搜寻不同摄像头下特定行人的技术，在智慧城市等视频监控场景中具有重要的意义。作为智能视频分析的研究热点，许多科研人员在行人重识别领域辛苦耕耘，取得了丰硕的研究成果。但在实际应用场景中，受摄像机参数、行人遮挡、光照以及姿态差异等因素的影响，同一目标在不同摄像头下视觉差异大，识别准确率较低。因此，本文重点研究跨视角场景下如何获取身份相关、姿态无关的鲁棒性行人特征。本文采用姿态引导行人对齐的方法进行行人重识别，引入压缩-激励模块和聚合转换神经网络，提升行人重识别网络特征抽取能力，有效地降低了姿态差异对识别精度的影响。本文的具体内容与创新点如下：*** （1）提出了一种基于压缩-激励注意力模块的行人重识别方法。为了提取身份相关、姿态无关的行人特征，本文使用基于姿态引导的重识别基准网络，实现行人身份的自动高精度识别。考虑到基准模型的骨干网络 ResNet50 针对特定信息抽取能力较弱，我们引入压缩-激励注意力模块，重点学习与行人身份相关的信息，抑制无关信息。压缩-激励注意力模块可以建立特征通道间的联系，从而自适应的从全局信息出发，学习和身份识别相关性更高的特征表示。我们在三个公开数据集 Market-1501、DukeMTMC-reID 和 CUHK03 上进行了对比实验，实验结果表明 top-1 准确率至少提升 0.7 个百分点，mAP 准确度至少提升 1.0 个百分点，证明了该模型的有效性。*** （2）提出一种基于聚合转换和卷积块注意力模块的行人重识别方法。本文使用姿态归一化网络作为基准网络，通过生成 8 个标准姿态图来扩充原始数据集，进一步提升行人重识别模型的鲁棒性与识别精度。我们首先将原始模型的ResNet50 结构全部替换为聚合转换深度神经网络，然后引入轻量化的卷积块注意力模块。聚合转换深度神经网络结合了 VGG 网络的堆叠思想和 Inception 网络的分离-转换-聚合策略，在不增加网络深度和宽度的前提下提升了行人重识别准确率。为了验证模型的有效性，我们在 Market-1501 数据集上进行了对比实验，结果表明改进后的 ResNeXt50 注意力网络，有助于提升模型的鲁棒性，表现出了

歡迎光臨比思論壇 (http://108.170.5.76/)