[CS231n 1강] Introduction to Convolutional Neural Networks for Visual Recognition

[CS231n 1강] Introduction to Convolutional Neural Networks for Visual Recognition

Tags
AI
CS231n
Published
September 28, 2024
Author
JH
태그
종류
학문 분야

컴퓨터 비전(Computer Vision)이란?

통계에 따르면 최근 인터넷 트래픽 중 80%가 비디오 데이터이다. 이런 시각데이터를 자동으로 이해, 분석하는 알고리즘을 개발하는 것을 컴퓨터 비전(Computer Vision)이라고 한다.

컴퓨터 비전의 역사

생물학적 비전의 역사

5억 4천만년 전, 최초의 눈이 등장하면서 폭발적인 종 분화의 시기를 촉발시켰다.
그리고 현재 비전은 거의 모든 동물, 특히 지능을 가진 동물들의 가장 큰 감각 체계로 진화하였다.

공학적 비전(카메라)의 역사

오늘날 우리가 알고 있는 초창기의 카메라는 1600년대 르네상스 시대의 카메라인 Obscura에서 시작되었는데, 핀홀 카메라 이론을 이용한 카메라이다.
현재 카메라는 스마트폰 카메라나 다른 여러 기기에 이르기까지 사람들이 사용하는 가장 인기 있는 센서 중 하나가 되었다.
그동안 생물학자들은 인간과 동물의 비전의 메커니즘을 연구하기 시작했으며, 대표적인 연구는 다음과 같다.

1950/60년대 Hubel & Wiesel의 연구

notion image
바로 컴퓨터 비전에도 영감을 준 1950/60년대 Hubel & Wiesel의 연구이며, 포유류의 시각적 처리 메커니즘을 밝히기 위해 고양이의 뇌를 연구한다.
고양이 두뇌 뒷면에 전극을 몇 개 꽂아 어떤 자극을 줘야 일차 시각 피질의 뉴런들이 격렬하게 반응하는지를 관찰하였다.
일차 시각 피질에는 가장 중요한 세포가 있었는데 그 세포들은 경계(edges)가 움직이면 이에 반응하는 세포들이였다.
이 연구 덕분에 알 수 있게 된 것은, 시각 처리가 처음에는 단순한 구조로 시작하며 그 정보가 통로를 거치면서 점점 복잡해진다는 것이였다.

1960년대 초반 Larry Roberts의 연구

notion image
1960년대 초반 Larry Roberts가 진행한 Block World는 컴퓨터 비전 분야에서의 최초의 박사 학위 논문이다.
이 연구에서는 우리 눈에 보이는 사물들을 기하학적 모양으로 단순화시켰다.

1966년 MIT의 여름 프로젝트

여름 안에 대부분의 시각 체계를 구현해내려는 시도였으며 컴퓨터 비전이라는 분야의 시초였다.

1970년대 후반 David Marr의 Vision

notion image
David Marr은 1970년대 후반 Vision이라는 책을 저술해, 그가 비전을 무엇이라 생각하는지, 어떤 방향으로 비전이 나아가야 하는지, 컴퓨터가 비전을 인식하기 위해 어떤 방향으로 알고리즘을 개발해야 하는지를 다루었다.

1970년대 Stanford와 SRI의 연구

notion image
모든 객체는 단순한 기하학적 형태로 표현할 수 있다는 관점을 가지고 진행한 연구로 수년간 다른 연구에 상당히 많은 영향을 끼쳤다.

1980년대 David Lowe의 연구

notion image
역시 어떻게 하면 단순한 구조로 실제 세계를 재구성/인식할 수 있을지에 대한 관점을 가지고 진행한 연구로 면도기를 선, 경계, 직선의 조합을 이용하여 표현하였다.

1997년 Shi & Malik의 영상분할 문제

notion image
그래프 이론을 도입해, 영상을 배경인 픽셀과 사람이 속해있을지도 모르는 픽셀을 구분했다.

1999/2000년대 AdaBoost 알고리즘

실시간 얼굴 인식에 성공한 최초의 사례다.

1990년대 후반/2010년 특징 기반 객체 인식 알고리즘

notion image
David Lowe의 SIFT feature은 특징들 중 변화에 더 강인하고 불변한 특징들을 찾아내어 이를 식별하고 매칭하는 것을 특징으로 한다.

2006년 Spatial Pyramid Matching

특징을 사용하게 되면서 특징들을 잘 뽑아낼 수 있다면 그 특징들이 일종의 단서를 제공해 줄 수 있다는 것을 아이디어로 한다.
추출한 특징을 하나의 특징 기술자로 표현하고 Support Vector Algorithm을 적용한다.

사람 인식 관련 연구들

notion image
어떻게 해야 사람의 몸을 현실적으로 모델링할 수 있을지에 관련된 연구들이다.

2000년대 초반 컴퓨터 비전의 문제에 대한 정의

2000년대 초반 컴퓨터 비전이 풀어야 할 문제가 무엇인지의 정의를 어느 정도 내렸으며 바로 “객체 인식”이였다.

ImageNet 프로젝트

이 세상의 모든 것들을 인식하고, 기계학습의 Overfitting 문제를 극복하기 위해 ImageNet 프로젝트가 시작되었다.
notion image
위 사진은 Image Classification Challenge의 결과로 2012년에 오류율이 급격하게 감소했는데, 이 때 우승한 알고리즘이 Convolutional Neural Network 알고리즘이였다.

CNN의 도래

notion image
2012년 ImageNet 챌린지에서 CNN이 빛을 본 것은 사실이지만, CNN은 1990년대 LeCun과 Bell Labs와의 공동 과제에서 처음 등장하였다.
CNN이 최근에야 유명해진 이유는 컴퓨터의 계산 능력의 증가, GPU의 진보, 대형 데이터셋의 등장 때문이다.