skinOptions.hljs
[GAN] GAN이란?
·
공부정리/Computer Vision
Generative Adversarial Networks(GANs) 1강 - GAN이란 무엇인가? 문제 복잡하고 고차원인 학습 분포로부터 데이터를 샘플링을 하고자 하나, 이를 직접적으로 하는 것이 불가능 해결책 쉽게 데이터를 샘플링하는 것이 가능한 간단한 분포를 이용(random noise와 같은 것) 이 간단한 분포를 학습 분포로 변형(transformation) 하는 법을 학습 Q. 이러한 복잡한 변형을 표현하려면 어떤 것을 사용해야할까? -> 정답은 Neural network!!! 입력 이미지를 따르는 정규 분포로 Z를 흭득함 -> 그것으로 학습 Neural Network 문제 하지만 각 Sample Z가 어떤 이미지로 매핑 되는지 알 수 없음 학습 이미지를 복원하는 것으로는 학습 불가능 해결책 d..
[GAN] VAE(Variational Auto-Encoder)
·
공부정리/Computer Vision
VAE 목표: Input image X를 잘 설명하는 feature를 추출하여 Latent vector z에 담고, 이 Latent vector z를 통해 X와 유사하지만 완전히 새로운 데이터를 생성하는 것 각 feature가 가우시안 분포를 따른다고 가정하고 latent z는각 feature의 평균과 분산값을 나타냄 수식을 약간 곁들여 이를 표현하면 아래와 같이 나타낼 수 있다. p(z): latent vector z의 확률밀도함수. 가우시안 분포를 따른다고 가정 p(x|z): 주어진 z에서 특정 x가 나올 조건부 확률에 대한 확률밀도함수 θ: 모델의 파라미터 VAE의 구조 Input image X를 Encoder에 통과시켜 Latent vector z를 구하고, Latent vector z를 다시 D..
[GAN] 확률 밀도의 추정과 샘플링
·
공부정리/Computer Vision
확률 분포(Probability distribution)의 추정 (estimation) 주사위를 굴렸을 때 각각의 수를 얻는 확률은 어떻게 될까? 이미지를 학습할 때 확률 변수 x는 64x64x3와 같은 차원을 갖는 고차원 벡터로 표현될 수 있다. 아래 예를 들어 얼굴을 그리기 위해 눈, 코, 입 등의 feature를 Latent vector z에 담고, 그 z를 이용해 그럴듯한 한국인의 얼굴을 그려내야 한다. 이러한 생성 모델에서는 확률 분포가 실제 존재하는 확률 분포와 얼마나 가까이 추정하였는지에 따라 달라질 수 있다. latent vector x3은 금발 여성의 눈 모양의 평균 및 분산, 한국인 코 길이의 평균 및 분산, 한국인 머리카락 길이의 평균 및 분산 등등의 정보를 담고 있다고 생각할 수 있..
[Vision] albumentations라이브러리와 CutMix를 통한 이미지 증강
·
공부정리/Computer Vision
본 게시글은 이미지 증강 과정의 예시를 시각화한 과정입니다. HTML 삽입 미리보기할 수 없는 소스 자세한 코드는 여기에..
[Vision] timm 으로 이미지 사전학습 모델 (ImageNet) 불러오기 / Python 파이썬
·
공부정리/Computer Vision
일반적으로 image classification 분야에서 새로운 model을 설계하는 것은 매우 어려운일이다. 그 이유는, 1) 단순하게 layer를 추가 구성해서 붙이는 과정으로는 model을 효율적으로 업그레이드 하는 것은 불가능함 2) 일반적으로 이미지 입력 크기의 경우 224-by-224 사이즈를 쓰게되는데 충분한 하드웨어 리소스 없이는 batch size를 백단위로 구성하는 것도 힘들며, batch size를 줄여서 학습을 하게 되면 모델 하나 학습하는데 몇일씩 걸리기 때문에 연구 개발 과정이 너무 길어지게 됨 따라서, image classification 분야에서는 주로 이미 개발된 뛰어난 model들을 가져와서 사용하게 된다. (출처: https://paperswithcode.com/sota..