본문 바로가기
공부/POSCO AI-Big Data 아카데미 14기

[POSCO AI교육 본과정] 온라인학습(2주)

by 로디네로 2021. 5. 3.
반응형

Fast Campus 로 2주간의 온라인 과정을 시작했다.

포스코에서 제공해준 이 강좌는 1년 수강권으로 정상적으로 수료할 시에는 유지, 수료하지 못할 경우에는 수강권을 반납한다고 한다 ㅎㄷㄷ..


수강 과목 : 머신러닝과 데이터 분석 A-Z

수강한 챕터는 다음과 같다.

  • Python Programming 기초
  • 데이터 수집을 위한 Python (Crawling)
  • 데이터 처리를 위한 Python (Numpy)
  • 데이터 분석을 위한 Python (Pandas)
  • Machine learning의 개념과 종류
  • 회귀분석
  • 기본적인 Machine learning 모형
  • 앙상블 기법의 종류와 원리
  • 클러스터링

+

  • 딥러닝

간략한 수강후기

Python Programming 기초 :

기본적으로 파이썬 개발환경에서부터 컬렉션 타입 (list, tuple, dict, set), 조건문과 반복문에 대한 이해와 활용, 함수와 람다함수를 배울 수 있었다.

이후 파이썬은 기본적으로 객체지향이라는 설명과 함께 클래스에 대한 이해를 할 수 있었다.

마지막으로는 정규표현식에 대해 배울 수 있었다.

(정규표현식은 정리해놓고 필요할 때 보고 쓰는걸로..)


데이터 수집을 위한 Python (Crawling) :

웹개발을 위한 HTTP method(GET,POST)와 beautifulsoup 을 이용해 parsing 하는 방법, selenium 모듈로 크롤링하는 방법 등을 배울 수 없었다.

솔직히 별로 관심없는 분야여서 재미없었다.

크롤링 뭐 별건가


데이터 처리를 위한 Python (Numpy) :

넘파이! 너무나도 중요한 모듈이다

인덱싱과 슬라이싱, reshape와 axis 등에 대한 개념과 활용에 대해 더 자세히 알 수 있었다.


데이터 분석을 위한 Python (Pandas) :

판다스도 원래는 전혀 알지 못했으나 현대 오토에버? 에서 과제테스트를 볼때 뜬금없이 pandas를 이용해야 해서 급하게 배웠었다.

물론 지금생각해보면 판다스 하나 몰랐다는게 부끄럽긴 하다.

Series 타입과 DataFrame 타입의 생성과 변경, 슬라이싱, join 등에 대해 알 수 있었다.


Machine learning의 개념과 종류 :

머신러닝에 대한 개괄적인 정의를 알 수 있었다.

지도학습과 비지도학습 / ML 의 종류 / DL의 종류 / 모델의 적합성 실험 등을 배웠다.


회귀분석 :

엄청나게 많은 강의수로 듣기도전에 머리가 아팠다.

우선 통계부터 시작했다. 여러 확률분포와 추정, 추론, 검정통계량, 유의확률 a 등을 배웠다.

이후엔 MLE와 Matrix 미분 에 대해 알아보았고 (너무나 수학적인것...)

마지막으론 회귀분석에 대해 알아보았다.

  • 회귀계수의 의미, 검정
  • 단순선형회귀
  • 다중회귀분석
  • 다중공선성
  • 성능지표
  • 변수선택법
  • 교호작용
  • 로지스틱회귀분석
  • 회귀계수 축소법
  • Feature selection
  • 차원축소
  • 공분산행렬
  • 고유벡터, 고유값
  • PCA

단순나열만 해도 엄청나게 많은 소주제가 존재했다.


기본적인 Machine learning 모형 :

이전까지 딥러닝 모델만 알고 머신러닝 모형에 대해서는 전혀 알지 못했다.

하지만 데이터 분류문제에는 굳이 복잡한 딥러닝 모델보다는 머신러닝으로도 성능이 더 좋을 수 있다는 것을 알게되었다. (바퀴벌레 잡는데 총을 쏘지 말라는 예시를 들어주셨다. 휴지보다 성능이 안좋은 총)

나이브베이즈, KNN, LDA, SVM(그 유명한), 의사결정나무, 신경망모형(Back propagation 에 대해 정확히 알 수 있었다.) 의 목차를 가졌다.


앙상블 기법의 종류와 원리 :

강의를 듣고 난 후기는 딥러닝 모델을 학습시킬 때 앙상블기법을 써보고 싶은 마음뿐이다.

앙상블에 대해서 자세히 알지는 못했는데 여러가지 기법들에 대해서 알 수 있었다.

Bagging, RandomForest, Boosting, Stacking 등의 기법에 있었다.


클러스터링 :

클러스터링 방법에 대해 배웠다.

K-means와 계층적 클러스터링, DBSCAN 에 대해 알아보고 사용방법을 알 수 있었다.


딥러닝 :

사전 수강 필수 강좌가 아니여서 듣지는 않았지만 꼭 들어볼 예정이다.


이렇게 합숙 교육 전 패스트캠퍼스 강의를 수강할 수 있었다.

이해가 안가는 부분이 많지만 (특히 통계) 다시 강의를 해주신다니..(but 시험봐야됨)

열심히 해봐야겠다

담당교수님께선 이해안가는 부분은 두 번 돌려보고 오라고 하셨는데

한번보기에도 시간이 벅찼다.

모쪼록 다 듣긴했다. ㅋㅋ

반응형

댓글