본문 바로가기
컴퓨터비전

Object Detection 주요 데이터 세트 소개 및 Pascal VOC 데이터 세트의 이해

by 차분한 공돌이 2024. 2. 20.

주요 Dataset 소개


class, bbox 등의 정보가 xml 형식으로 저장되어 있음 이미지 정보가 딱 하나의 json파일로 저장되어 있 이미지 정보가 csv 형태로 저장되어 있음
초기 데이터셋, 너무 평이한 문제가 있음 이미지 하나당 더 다양한 object들이 들어가있음.
많은 모델들이 pretrain하는데 사용함
너무 용량이 커서 공부할 때 사용 많이 안함

 

 

 

PASCAL VOC 2012

링크

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

 

The PASCAL Visual Object Classes Challenge 2012 (VOC2012)

2006 10 classes: bicycle, bus, car, cat, cow, dog, horse, motorbike, person, sheep. Train/validation/test: 2618 images containing 4754 annotated objects. Images from flickr and from Microsoft Research Cambridge (MSRC) dataset The MSRC images were easier th

host.robots.ox.ac.uk

할 수 있는 활동

 

1. Classification / Detection

2. Segmentation

3. Action Classification : 사람이 뛰고 있는지, 놀고 있는지 등을 분류

4. Person Layout : 사람 이미지에서 머리, 팔, 손 등을 찾아내기

 

Dataset 구조

 

 

Dataset 구조Annotation 파일 예시

 

Reference

https://www.inflearn.com/course/딥러닝-컴퓨터비전-완벽가이드/dashboard