본문 바로가기
공부/POSCO AI-Big Data 아카데미 14기

[POSCO 교육 사전학습] 특강/Computer Vision입문

by 로디네로 2021. 4. 7.
반응형

포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의를 듣고 정리한 포스팅이다.

 

pabi.smartlearn.io/

 


수강 내용을 간단히 정리해보고자 한다.

 

CV 입문의 목차는 다음과 같다.

  • Introduction
  • Object Recognition
  • Bigdata & Deep learning
  • Danger of AI

 


 

 

컴퓨터비전분야에서의 문제는 크게 다음과 같이 분류된다

 

  • Object detection (객체인식)
  • Semantic Segmentation (의미론적 영상분할)
  • Image captioning (영상묘사 - 영상을 사람이 묘사하는 것처럼 글로 묘사하는 것이다.)
  • Question Answering (영상과 질문이 주어졌을 때 답을 도출해내는 문제)
  • 3D reconstruction (2D 이미지들의 특징점들을 파악하여 3D로 재구성해낼수있다)

 


 

컴퓨터는 어떻게 물체를 인식하는가

 

binary classification (두가지 물체를 구분)

  • 문제 : 모든 A 물체가 같게 생긴것도 아니고 B물체가 같은 것도 아니다 각각의 환경과 상태가 모두 다르다
  • 고려 : 변화에 적응할 수 있는 model 을 만들어야 된다.

image 를 행렬화 하고 weight를 곱하여 output을 도출해낸다.

 


 

Deep model?

 

hidden layer가 있는 model이다. layer의 수가 많을 수록 deep 하다고 한다.

 

단일 layer로 구성된 model은 선형분류기라고 할 수 있는데

 

이러한 선형 분류기들을 합하면 여러개의 layer를 가지게 되는 분류기가 되게 된다. 즉 Deep 해진다.

 

이는 선형분류보다 더 좋은 성능을 이끌어낼 수 있다.

 

이미지 인식에 대해서는 Convolution 을 사용해 layer 를 구성한다면 좋은 성능을 기대할 수 있다.

 


 

딥러닝과 관련된 중요한 이슈들

 

  • Self-improving machine (아직 인간보다 뛰어난 기계가 출현할것이란 것은 시기상조이다.)
  • Miss links (annotated data 에 기반한 supervised learning이 대부분인데 이것이 존재하지 않을 경우에는 학습을 하지 못하기 때문에 근본적인 문제가 있다.)
  • Challenges (사람의 간섭을 최대한 줄이기 위한 노력을 하고 있다.)

 

 

 

 

 

반응형

댓글