DOTA : Dataset for Object Detection in Aerial images
항공 사진 데이터셋의 부재로 인한 전세계 공통 연구 주제
이 논문에서는 그동안 항공 사진에서의 Computer Vision 적용 문제와 그 이유를 서술하고,
자체 개발한 ODAI (Object Detection in Aerial Images) 테스트 Development Kit를 제공한다.
paperswithcode.com/paper/dota-a-large-scale-dataset-for-object
Papers with Code - DOTA: A Large-scale Dataset for Object Detection in Aerial Images
Implemented in 3 code libraries.
paperswithcode.com
Abstract
대규모 벤치마크 (Large-Scale Benchmark) 부족으로 인해 ODAI 발전이 더딤
→ 대규모 데이터셋 (DOTA)와 포괄적인 기준 (Comprehensive Baselines) 제시
→ 단일 ODAI 라이브러리, 알고리즘 테스트용 빌드 알고리즘 제공
Introduction
항공 사진 (Aerial Image)에서 물체 감지 (Object Detection)의 대표적인 문제
- 자유로운 방향성 (Arbitrary Orientation)→ 자연 이미지 (Natural Image)와의 주요한 차이점
- Rotation-Invariant Feature → 현재 대부분의 DNN 성능으로 해결 불가
- 수평 경계 상자 (HBB)는 정확한 위치를 표현할 수 없다.
- → Overhead View로 인해 발생
- 스케일 변동 (Sacle Variations)
- 극도로 불균일한 물체 밀도 (Extremely Nonuniform Object Densities)
- 큰 종횡비 (Large ARs, Aspect Ratios)
최근 출시된 xView 데이터셋
→ 다양한 카테고리, 복잡한 장면에서 대량 인스턴스 포함 (xView: Objects in Context in Overhead Imagery)
xView: Objects in Context in Overhead Imagery
We introduce a new large-scale dataset for the advancement of object detection techniques and overhead object detection research. This satellite imagery dataset enables research progress pertaining to four key computer vision frontiers. We utilize a novel
arxiv.org
자연 이미지에서 학습한 기존 모델은 항공 이미지에 적합하지 않음 (hyperparameter setting → domain differences)
→ 알고리즘 개발 과정에서 포괄적인 기준 (Comprehensive Baselines)이 필요하다.
→ 통합된 라이브러리 알고리즘을 구현 (알고리즘 향상 목적)
captain-whu.github.io/DOTA/dataset.html
DOTA
DOTA 2 --> DOTA A Large-Scale Benchmark and Challenges for Object Detection in Aerial Images
captain-whu.github.io
이 논문 연구에서 제공하는 DOTA v2.0 : 11,268 항공 이미지 (1.8m 인스턴스, 18 공통 카테고리) → 현존 가장 큰 ODAI 데이터셋
+테스트용 코드 라이브러리 제공 (10개의 알고리즘과 70개의 모델)
- DOTA의 OBB 주석은 Large-Scale Benchmark 제공
- Aerial Image에서 물체 인식 코드 라이브러리 구축
- 알고리즘 설계를 안내하는 포괄적인 분석을 제공
Related Work
Datasets for Object Detection in Aerial Images
→ ODAI에 적합한 이미지 데이터셋 조건
- 주석이 존재하는 실질적인 데이터
- 큰 크기의 이미지 (더 많은 contextual information 포함)
- OBB annotation (개체의 정밀한 방향과 위치를 설명)
→ DOTA는 모든 조건을 만족하는 유일한 데이터셋
Deep Models for Object Detection in Aerial Images
Natural Images에 비해 Scale Variation (스케일 변화) 매우 크다. Rotation Variation을 처리하기 위해 간단한 Rotation-Invariant Layer를 R-CNN에 추가한다.
ORN (Oriented Response Network)는 ARF (Active Rotating Filters)를 도입한다.
Code Library for Object Detection
- Tensorflow Object Detection API (Github)
github.com/facebookresearch/maskrcnn-benchmark
facebookresearch/maskrcnn-benchmark
Fast, modular reference implementation of Instance Segmentation and Object Detection algorithms in PyTorch. - facebookresearch/maskrcnn-benchmark
github.com
- Detectron (Github)
github.com/facebookresearch/detectron
facebookresearch/Detectron
FAIR's research platform for object detection research, implementing popular algorithms like Mask R-CNN and RetinaNet. - facebookresearch/Detectron
github.com
- Mask RCNN Benchmark (Github)
github.com/facebookresearch/maskrcnn-benchmark
facebookresearch/maskrcnn-benchmark
Fast, modular reference implementation of Instance Segmentation and Object Detection algorithms in PyTorch. - facebookresearch/maskrcnn-benchmark
github.com
- Detectron2 (Github)
github.com/facebookresearch/detectron2
facebookresearch/detectron2
Detectron2 is FAIR's next-generation platform for object detection and segmentation. - facebookresearch/detectron2
github.com
- MMDetection (Paper)
MMDetection: Open MMLab Detection Toolbox and Benchmark
We present MMDetection, an object detection toolbox that contains a rich set of object detection and instance segmentation methods as well as related components and modules. The toolbox started from a codebase of MMDet team who won the detection track of C
arxiv.org
- SimpleDet (Paper)
SimpleDet: A Simple and Versatile Distributed Framework for Object Detection and Instance Recognition
Object detection and instance recognition play a central role in many AI applications like autonomous driving, video surveillance and medical image analysis. However, training object detection models on large scale datasets remains computationally expensiv
arxiv.org