AI 16

Deeplab V1 : Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully connected CRFs

1. 논문소개 위 논문은 기존의 DCNNs(Deep Convolutional Neural Networks) 모델은 Classification에는 좋은 성능을 냈지만, Segmentation 에서는 좋은 성능을 내지 못해서 이를 극복하기 위해 나온 논문이며, 모델 이름은 Deeplab 이다. 기존의 DCNNs 모델이 Classification 에서는 좋은 성능을 보이지만, Segmentation 에서는 좋은 성능을 내지 못하는 이유는 pixel 단위의 예측을 해야하는 Segmentation 분야에서는 해당 픽셀의 특징과 함께 지역적인 정보도 중요한데 , Max Pooling 과 CONV layer를 통과하면서 지역적인 특징을 잘 추출하기 어렵기 때문이다. 그 외에도, DCNNs 의 경우 Fc layer를 ..

AI/CV 2023.07.06

Convolution 연산 종류

CNN 계열의 모델은 기본적으로 Kernel이라는 이미지의 특징을 잡아내기 위한 파라미터가 존재하고 이와 input 행렬과 연산하는 것을 Convolution 연산이라고한다. 가장 기본적인 Convolution연산은 아래와 같다. CNN Convolution 연산으로 인한 파라미터는 K x K x input channel x output channel 이다. 즉 인풋 채널이 3(일반적인 RGB채널) 이고 커널의 크기가 3X3 아웃풋채널이 64인 경우인 레이어의 경우에는 파라미터는 3x3x3x64 = 1,728 이다. 파라미터 수가 많으면 많을 수록 메모리비용과 연산속도는 기하급수적으로 늘어난다. 이에, 다양한 Convolution 연산을 통해 이미지의 특징은 잘 추출하면서 연산속도와 메모리비용을 감소시키..

AI/Concept 2023.07.04

SegNet : A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

1. 논문소개 위 논문은 real time task , 자율주행에서의 Segmentation에 기여한 논문이다. 기존의 Segmentation 모델 , Deconvnet, FCN,U-net의 경우 파라미터 수가 많고, 연사량이 많아 추론시간이 많이 소모된다. 이는 즉각적으로 추론해야 하는 자율주행분야에서는 큰 단점 중 하나이다. 또한, 기존모델은 Encoder와 Decoder를 거치면서 Coarse feature map 현상이 일어난다. 이로 인해 사물간의 경계선이 잘 구분되어 있지 않는다. 이에, SegNet은 파라미터 수를 획기적으로 줄여, 추론시간을 감소키시고, max - pooling indices를 통해 사물간의 경계를 더욱 잘 나타게 할 수 있도록 architecture를 구성하였다. 2. 모..

AI/CV 2023.07.03

VGG : Very Deep Convolutional Networks for Large-Scale Image Recognition

1. 논문소개 위 논문의 모델인 VGG는 2014 이미지 인식 대회에서 2등을 한 모델로 1등은 GooleNet이 차지했지만, 모델 구성이 간편하여 2등임에도 불구 하고 더 많이 사용되고 있는 모델이다. AlexNet 이후로 Layer를 깊게 쌓는것에 대한 논의가 지속되면서 Layer를 더 깊게 쌓으면서 overfitting,vanishing/exploding gradient 문제를 어떻게 해결할 것인지에 대한 Discussion이 많이 이뤄지게 되는데 VGG는 layer를 최대 19개 까지 쌓으면서 overfitting,vanishing과 같은 문제점을 효과적으로 해결한 모델이라고 할 수 있다. ImageNet과 같은 대용량 데이터셋이 나오고, 컴퓨팅시스템의 발전으로 layer를 깊게 쌓는것이 가능해지..

AI/CV 2023.06.17

Class imbalance(클래스불균형) 및 해결 방법

세상에 잘 정제된 데이터만 있으면 얼마나 좋을까요? 하지만 그건 너무 비현실적입니다. 그래도 우리는 이런 쉽지 않은 데이터를 기반으로 유의미한 예측을 하고 분류를 진행해야 합니다. 결측값이 너무 많다거나, 데이터의 이상치가 너무 크거나, 아니면 데이터의 분포가 한쪽으로 쏠리는 등 업무현장에서 많이 마주하게 됩니다. 1. 클래스불균형이란 그 중 제가 첫번째로 잡은 주제는 클래스 불균형 , 예측하려고 하는 클래스가 불균형한(한쪽으로 쏠린) 데이터셋를 가지고 분류를해야 할 때 입니다. 대표적인 예가 "고장분류" 입니다. 어떤 상품이 고장인지 정상인지 분류하는 데이터가 있다고 하면, 아마 98%의 데이터는 정상이라고 할 것이며, 2% 정도가 고장이라고 하는 데이터 일 겁니다.(왜냐면 고장이라는것이 흔한 현상은 ..

AI/Concept 2023.06.10

U-NET: Convolutional Networks for biomedical image segmentation

1. 논문 소개 위 논문은 Image Segmentation 중 의료 이미지에 많이 있는 모델로 2015년에 발표 되었지만, 아직까지도 기본 모델로 많이 쓰이고 있다. 전체적인 architecture 가 U자 모양으로 되어 있어 U-net 이라고 불리우고 있다. 실제로 이러한 U-net 모델을 활용하여 적은 데이터셋으로 높은 정확도를 보여준다고 이 논문은 소개하고 있다. ** Image Segmentation 이란? Image processing 에는 크게 세가지로 분야가 있는데, 첫번째는 우리가 흔히 알고 있는 Classification 이다. 이미지 전체를 하나의 클래스로 예측하는 문제이다. 두번째는 Object Detction 인데, 이는 이미지 내에 한개 이상의 Object가 있고 각각의 Obje..

AI/CV 2023.06.10