DPT: Deformable Patch-based Transformer for Visual Recognition

Chen, Z., Zhu, Y., Zhao, C., Hu, G., Zeng, W., Wang, J., & Tang, M. (2021, October). Dpt: Deformable patch-based transformer for visual recognition. In Proceedings of the 29th ACM International Conference on Multimedia (pp. 2899-2907).

Link


DPT 모델은 고정 크기의 패치 대신 변형 가능한 패치를 사용하여 이미지에서 특징을 추출한다. 변형 가능한 패치를 통해 객체의 모양 및 크기에 적응적으로 학습하므로 높은 성능을 달성할 수 있다.

Pagination