论文Cascade Transformers for End-to-End Person Search 代码仓库
Go to file
詹力 fb9b5037d3 更新COAT的C++实现 2024-10-03 01:06:28 +08:00
Code 更新COAT的C++实现 2024-10-03 01:06:28 +08:00
Docs 提交初始代码 2024-10-03 01:04:42 +08:00
Notes 提交初始代码 2024-10-03 01:04:42 +08:00
README.md 提交初始代码 2024-10-03 01:04:42 +08:00

README.md

一、代码说明

这个仓库是论文Cascade Transformers for End-to-End Person Search [CVPR 2022]的源码仓库。在这项工作中我们开发了一种新颖的级联遮挡感知Transformer (COAT) 模型,用于端到端行人搜索。该模型在PRW基准数据集上大幅超越了当前最先进的方法,并在CUHK-SYSU数据集上达到了最先进的性能。

二、环境配置 & 运行

2.1 开发环境的配置

本下项目可以采用anaconda或者docker进行环境配置。

anaconda的配置方式:

# 以下是安装anaconda环境安装的指令
conda create -n COAT python=3.8.1
conda activate COAT

2.2 数据集的下载

2.2.1 PRW 行人重识别视频数据集
2.2.1 ...

三、框架说明

这篇论文采用基于Transformer的级联神经网络优化...,其核心框架如下说明:

image-20241003004438891