ML

    About Detectron2

    보호되어 있는 글입니다.

    [논문리뷰] Accurate Image Super-Resolution Using Very Deep Convolutional Networks (VDSR)

    이 논문은 SRCNN의 한계를 개선하고 SISR 문제에 딥러닝을 적용한 모델을 제안한다. 우선, SRCNN은 다음과 같은 한계를 가진다. 1. it relies on the context of small image regions. 2. training converges too slowly. 3. the network only works for a single scale. 더보기 하나의 모델은 single scale에 대해서만 적용이 가능해서, 새로운 scale이 요구되는 경우, 모델을 새로 학습해야합니다. 2, 3번에 비해 1번이 이해가 잘 되지 않아서, 찾아서 정리해보았다. SRCNN은 작은 영역의 context에 의존한다. 그 이유는 레이어가 단지 3개이기 때문이다. 레이어가 얕아 좁은 이미지 영역에..

    [논문 리뷰] SRCNN의 Hyperparameter에 대해 알아보자.

    논문을 바탕으로 하여 SRCNN의 Hyperparameter에 대해 알아보고, 왜 해당 값으로 정해졌는지에 대해 분석해보자. $$F_{1}(Y) = max(0, W_{1}*Y+B_{1})$$ W1, B1 represent the filters and biases respectivley. W1 corresponds to n1 filters of support c*f1*f1, where c is the number of channels in the input image, f1 is the spatial size of a filter. Intuitively, W1 applies n1 convolutions on the image, and each convolution has a kernel size c*f1*..

    [Interpolation] About Bicubic, Bilinear Interpolation

    interpolation에 대해 이해한 내용을 글로 요약해보자. Interpolation은 보간법으로서 알려진 값을 가진 두 점 사이 어느 지점의 값이 얼마일지를 추정하는 기법이다. linear interpolation에서부터 알아보자면, linear interpolation은 알려진 두 점 사이의 모르는 한 점 c를 추정하기 위해, 알려진 두 점을 잇는 직선에 해당 점 c를 대입하여 그 값을 유추해낸다. 이와 비슷한 방법으로 cubic interpolation에 대해서 알아보자. cubic은 알려진 두 점 사이 모르는 한 점의 값을 추정하기 위해서 3차 함수를 이용한다. 3차 함수를 이용하기 위해서는 변수가 4개이므로 총 4개의 점을 참조해야 우리가 원하는 값을 유추해낼 수 있다. 따라서 알려진 점 이..

    [머신러닝 기초] How to train Neural Network?

    어떻게 Neural Network를 학습시킬 수 있을까? Neural net은 두 가지 방향의 계산을 통해서 학습이 이루어진다. forward propagation: 현재 weight에 대해 loss를 계산한다. back propagation: loss를 뒤에서부터 앞으로 보내면서 가중치를 업데이트한다. Backpropagation backpropagation(역전파)이란 역방향으로 오차를 전파시키면서 각 층의 가중치를 업데이트하고 최적의 학습 결과를 찾아가는 방법이다. 역전파를 이용한 가중치 업데이트 절차는 아래와 같이 요약할 수 있다. 1. 주어진 가중치 값을 이용해 출력층의 출력값을 계산함. 2. 오차를 각 가중치로 미분한 값을 기존 가중치에서 빼준다. (여기서 경사 하강법을 적용하며, 역전파를 통..

    [논문 리뷰] SRCNN - Image Super-Resolution Using Deep Convolutional Networks

    논문 바로가기 arxiv.org/pdf/1501.00092.pdf 이 논문에서는 딥러닝을 이용한 Single Image Super-Resolution 방법을 제안하고 있다. direct로 low/high-resolution image 사이의 매핑 방법을 end-to-end로 학습시킨다. Mapping 방법은 CNN을 이용하며 low-resolution의 input을 high-resolution의 output으로 만들어낸다. SRCNN은 위 그림과 같이 크게 3가지로 구성되어있다. 1. Patch extraction and Representation 이 과정에서 우리는 저해상 이미지로부터 patch를 추출해내며 고차원의 벡터로 representation하는 과정을 거친다. 이 때, 이 벡터들은 피쳐맵으로 ..

    [머신러닝 기초] 퍼셉트론부터 CNN 구조까지

    About Perceptron 퍼셉트론이란? 다수의 신호를 입력으로 받아 하나의 결과를 내보내는 알고리즘이다. 퍼셉트론 신호는 1 또는 0의 두가지 값을 가질 수 있다. 즉, 어떠한 임계값을 기준으로 하여 신호를 활성화하거나, 비활성화할 수 있다. 다수의 입력을 받는 퍼셉트론의 그림을 보자면 다음 그림과 같다. 여기서 x는 입력값을 의미하며, W는 가중치, y는 출력값이다. 그림 안의 원은 인공 뉴런에 해당한다고 볼 수 있다. 각각의 인공 뉴런에서 보내진 입력값 x는 각각의 가중치 W와 함께 종착지인 인공 뉴런에 전달된다. 각 입력값에는 가중치가 존재하는데, 이때 가중치의 값이 크면 클수록 해당 입력 값이 중요하다는 것을 의미한다. 입력값과 가중치가 곱해져 인공 뉴런에 보내지면 그 값이 임계치를 넘는 경..