DOTA : Dataset for Object Detection in Aerial images
항공 사진 데이터셋의 부재로 인한 전세계 공통 연구 주제
이 논문에서는 그동안 항공 사진에서의 Computer Vision 적용 문제와 그 이유를 서술하고,
자체 개발한 ODAI (Object Detection in Aerial Images) 테스트 Development Kit를 제공한다.
paperswithcode.com/paper/dota-a-large-scale-dataset-for-object
Abstract
대규모 벤치마크 (Large-Scale Benchmark) 부족으로 인해 ODAI 발전이 더딤
→ 대규모 데이터셋 (DOTA)와 포괄적인 기준 (Comprehensive Baselines) 제시
→ 단일 ODAI 라이브러리, 알고리즘 테스트용 빌드 알고리즘 제공
Introduction
항공 사진 (Aerial Image)에서 물체 감지 (Object Detection)의 대표적인 문제
- 자유로운 방향성 (Arbitrary Orientation)→ 자연 이미지 (Natural Image)와의 주요한 차이점
- Rotation-Invariant Feature → 현재 대부분의 DNN 성능으로 해결 불가
- 수평 경계 상자 (HBB)는 정확한 위치를 표현할 수 없다.
- → Overhead View로 인해 발생
- 스케일 변동 (Sacle Variations)
- 극도로 불균일한 물체 밀도 (Extremely Nonuniform Object Densities)
- 큰 종횡비 (Large ARs, Aspect Ratios)
최근 출시된 xView 데이터셋
→ 다양한 카테고리, 복잡한 장면에서 대량 인스턴스 포함 (xView: Objects in Context in Overhead Imagery)
자연 이미지에서 학습한 기존 모델은 항공 이미지에 적합하지 않음 (hyperparameter setting → domain differences)
→ 알고리즘 개발 과정에서 포괄적인 기준 (Comprehensive Baselines)이 필요하다.
→ 통합된 라이브러리 알고리즘을 구현 (알고리즘 향상 목적)
captain-whu.github.io/DOTA/dataset.html
이 논문 연구에서 제공하는 DOTA v2.0 : 11,268 항공 이미지 (1.8m 인스턴스, 18 공통 카테고리) → 현존 가장 큰 ODAI 데이터셋
+테스트용 코드 라이브러리 제공 (10개의 알고리즘과 70개의 모델)
- DOTA의 OBB 주석은 Large-Scale Benchmark 제공
- Aerial Image에서 물체 인식 코드 라이브러리 구축
- 알고리즘 설계를 안내하는 포괄적인 분석을 제공
Related Work
Datasets for Object Detection in Aerial Images
→ ODAI에 적합한 이미지 데이터셋 조건
- 주석이 존재하는 실질적인 데이터
- 큰 크기의 이미지 (더 많은 contextual information 포함)
- OBB annotation (개체의 정밀한 방향과 위치를 설명)
→ DOTA는 모든 조건을 만족하는 유일한 데이터셋
Deep Models for Object Detection in Aerial Images
Natural Images에 비해 Scale Variation (스케일 변화) 매우 크다. Rotation Variation을 처리하기 위해 간단한 Rotation-Invariant Layer를 R-CNN에 추가한다.
ORN (Oriented Response Network)는 ARF (Active Rotating Filters)를 도입한다.
Code Library for Object Detection
- Tensorflow Object Detection API (Github)
github.com/facebookresearch/maskrcnn-benchmark
- Detectron (Github)
github.com/facebookresearch/detectron
- Mask RCNN Benchmark (Github)
github.com/facebookresearch/maskrcnn-benchmark
- Detectron2 (Github)
github.com/facebookresearch/detectron2
- MMDetection (Paper)
- SimpleDet (Paper)