컴퓨터 비전

Machine Learning

[CV 4] Object Detection Model - YOLO

이전에 Object Dection 모델은 여러 객체들이 존재하는 이미지 내에서 각각의 객체가 있는 위치(Regression 문제), BBox 내의 객체에 대한 클래스 분류(Classification 문제) 수행한다고 배웠다. YOLO는 기존의 image segmentation기법, 다른 object detection모델 중 2-stage 방식인 R-CNN계열과 비교했을 때, 비슷한 성능을 기준으로 훨씬 빠른 속도를 자랑한다! You Only Look Once : 한 번만 봐도 된다! 주어진 이미지에서 Bounding Box(BBox)의 위치, classification을 한번에 수행하는 object detection model이다. 현재 YOLO v1~v8 버전까지 나와있다. 모델이 어떻게 발전했는지에 ..

Machine Learning

[CV] CNN, Tranfer Learning

패턴이 복잡한 컬러 이미지는 MLP로는 분류가 힘들다. 이미지는 위치에 맞는 공간적인 특성을 가지고 있다. But, 배웠던 MLP에서는 flatten으로 펴준 뒤 연산하기 때문에, 이런 공간적인 특성을 잘 살려내지 못한다. CNN은 공간적 특성을 보존하며 학습할 수 있다. 합성곱 층은 이미지의 일부분을 흝으면서 연산이 진행되며 특징을 잡아내어 학습하기 때문에 층이 깊어지더라도 공간적 특성을 최대한 보존한다. 🌀 CNN의 구조 입력값이 이미지로 들어오고, (1) conv+pooling layer반복(Feature extractor), (2) 쭉 펼쳐서 fully connected layer를 만들고 softmax를 이용해 출력값냄. (classifier) 🌀 Convolution & Pooling conv..

bomishot
'컴퓨터 비전' 태그의 글 목록