본문 바로가기

Artificial Intelligence2

FaceNet 논문 리뷰 개요이 논문에서는 face verification, recognition,  clustering을 위한 통합된 시스템을 제안하고 있다. 간단히 말해서 Deep convolutional network을 통해 Euclidean embedding을 학습하여 Euclidean distance를 통해 사람의 얼굴을 구분하는 아이디어이다. 여기서 말하는 embedding은 triplet loss를 통해서 훈련된다. 즉, 이 논문에서 제안하는 핵심 개념은 embedding이 아니라 triplet loss인 것이다. Triplet LossFaceNet 모델은 triplet loss를 통해서 128차원 embedding을 직접 훈련시키고 이 embedding의 distance를 통해서 얼굴 identifying을 수행하.. 2022. 9. 5.
VGG 논문 리뷰 공부를 하기 위해 여기에 논문 리뷰를 적기로 했다. 이번에 리뷰할 논문은 VGG이다. 옥스포드 대학교에서 개발한 모델로, 2014년 ILSVRC에서 준우승을 하였다. 매우 유명한 모델이니 자세한 설명은 생략하고 바로 본문으로 들어가겠다. VGG 모델 구조 input은 224x224의 고정된 크기를 사용하고 모델에 들어가기 전에 각 픽셀값을 전체 트레이닝셋의 RGB 평균값을 빼는 preprocessing 단계를 수행한다. 즉, P`(x, y) = P(x, y) – M (P = x, y의 원래 픽셀값, M = 전체 픽셀의 평균값) 몇단계의 conv layer 후에 max pooling을 수행하는 것이 특징이다. 깊이에 상관없이 max pooling은 5번을 수행한다. 그 후에는 3개의 FC layer를 거쳐.. 2022. 8. 9.