[Object Detection] CenterNet
*이 포스트는 강의 요약 포스트입니다.
기존 Object Detection 모델의 문제점
1. 많은 수의 Anchor Prediction 과정이 필요하다. (ReitnaNet의 경우 1장의 이미지에 대한 약 100K정도의 Anchor Prediction)
2. 이로인해 Post-Processing 과정에서 NMS 처리로 인해 속도가 느려진다.
3. 또한 Multi-Anchor Prediction 의 결과로 NMS를 적용하더라도 하나의 Object에 대해 여러개의 Prediction을 만드는 중복 Prediction 문제가 생길 수 있다.
CenterNet
Objects as Points (https://arxiv.org/abs/1904.07850)에서 처음 CenterNet 개념이 나타났다.
Objects as Points
Detection identifies objects as axis-aligned boxes in an image. Most successful object detectors enumerate a nearly exhaustive list of potential object locations and classify each. This is wasteful, inefficient, and requires additional post-processing. In
arxiv.org
CenterNet의 핵심 아이디어:
Object Detection 문제를 하나의 Object의 중심점을 하나의 KeyPoint로 바라보는 KeyPoint Estimation 문제로 치환한 CenterNet 구조를 제안하였다.
- 기존 모델 대비 빠른 속도를 가지면서도 높은 성능을 보여준다.
- Keypoint Estimation에서 확장할 수 있는 다양한 문제영역에 centerNet을 사용할 수 있다.
CenterNer의 의의
1. NMS(Non-Maximum Supression) 과정이 필요 없는 빠른 속도의 창의적인 Object Detection 모델을 제안한다.
2. 여러 개의 Anchor Prediction으로 발생할 수 있는 중복 Prediction 문제를 해결한다.
REFERENCE
https://gaussian37.github.io/vision-detection-centernet/