본문 바로가기

전체 글18

Object Localization with Classification 원본 이미지에 Object이 한개 밖에 없을 때 object의 class와 boundary box의 좌표를 구하는 것을 Object Localization with Classification이라고 한다. 과정 Image Classification Bounding Box Regression 원본 이미지(ex. 224 x 224)(높이, 너비) Feature Extractor(VGG/Resnet 등) Feature Map(ex. 7 x 7 x 512)(높이, 너비, 채널 수) FC Layer(image classification 용) FC Layer(bounding box regression 용) Soft max Class Confidence score car : 0.8 cat : 0.1 학습 데이터 라벨 .. 2024. 2. 12.
object detection 주요 구성 요소 및 어려운 이유 object detection 주요 구성 요소 1. 영역 추정 Region Proposal : object이 있을만한 위치 추정 2. Detection을 위한 Deep Learning 네트웍 구성 Feature Extraction + Classification (Backbone) : 다양한 스케일로 feature map 생성 & FPN(neck) : 다양한 스케일의 feature map 을 잘 융합하여 이후 Network Prediction 단계에서 각각의 feature map이 서로 상호보완하며 종합적으로 고려되어 성능을 높이는 역할을 한다 & Network Prediction(head) : classification(분류) 및 boundary box regression(박스 좌표 찾기) 수 3.Det.. 2024. 2. 11.
Object Detection 개요 2001년 VJ Det 2004년 2006년 HOG Det 2008년 DPM----------------------------------여기까지 Traditional Detection Methods 2012년 AlexNet의 등장--------------------여기부터 Deep Learning based Detection Methods One-stage detector(바로 탐지) Two-stage detector(object이 있을만한 곳을 미리 찾아놓고, 그후 탐지) 장점 : 정확도 높음 단점 : 시간이 오래걸려 실시간 적용이 어려 2014년 RCNN SPPNet 2015년 YOLO(수행시간 짧지만 정확도 심하게 낮음) Fast RCNN Faster RCNN 2016년 SSD(single shot.. 2024. 2. 11.
bifpn,regnet,cnn 층을 활용하여 이미지 분류하기 프로그램 시작 이유 테슬라 AI Day 자료를 보던 중 테슬라는 Backbone으로 regnet을, Neck으로 BiFPN을 사용하여 객체인지를 하고 있음을 알게 되었다. 현재 자율주행 자동차 회사에서 실제 사용하는 모델이라는 사실이 흥미로웠고, 자세한 구조나 구현방식에 대한 정보는 없어서 직접 regnet과 BiFPN을 이용한 이미지 분류 모델을 만드는 프로젝트를 시작하게 되었다. (원래는 데이콘 데이터를 활용한 객체 탐지를 목표하였으나 ram용량으로 인한 에러가 발생하여 cifar10 dataset을 이용한 이미지 분류로 목표를 수정하였다.) 프로젝트 계획 1. regnet과 BiFPN에 대한 배경지식이 없기에 이들의 탄생 목적과 작동 과정을 학습한다. 2. 학습한 개념을 바탕으로 regnet과 Bi.. 2024. 1. 7.