본문 바로가기

데이터과학2

[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_2 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의이다. 2주차 강의의 목차는 다음과 같았다 데이터의 평균 데이터의 분산 데이터와 빅데이터 데이터 탐색의 첫걸음 데이터의 평균 : 평균이란 데이터를 하나의 값으로 표현한 요약된 정보이다. (추정치) 모든 데이터를 더한 후 갯수로 나는 값 평균은 혼자 존재하는 개념이 아니다. 어떻게 표본선정을 하느냐에 따라 평균값에 영향을 미친다. 평균과 표본선정 : 표본이 적합하게 추출되었는지 평가하는 방법 (평균을 예제로 하면) 1. Bias 가 적은가? - 표본 추출 시 표본으로부터의 통계치의 기대값이 모수의 참값과 유사한가 2. Precision이 높은가? - 반복해서 표본을 추출할 때 얼마나 유사.. 2021. 3. 16.
[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_1 데이터 과학과 통계 과목을 수강한 이유 : 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나로 지금까지 한 번도 접해보지 못했던 데이터 과학에 대한 강의를 수강했다. Python, Tf, torch, numpy, SQL, pandas 등등 AI에 관련한 많은 툴들을 만져보고 적용해봤지만 이들의 DB가 되는 데이터에 대해 자세히 배워본 적 없어서 수강하게 되었다. 데이터 과학이란 : 통계학 - 데이터마이닝 - 빅데이터 - 딥러닝 - 인공지능 은 연결되어있는 분야이다. 데이터 분석 : 예측모형만을 말하는 것이 아니라 1. 데이터 큐레이션 - 데이터 추출, 변환 (SQL, R, Python) 2. 데이터 시각화 - ggplot, pyplot, matplotlib 3.. 2021. 3. 16.
반응형