본문 바로가기

공부/POSCO AI-Big Data 아카데미 14기28

[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_5 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의를 듣고 정리한 포스팅이다. pabi.smartlearn.io/ 청년 AI·Big Data 아카데미 온라인 기초과정 (MOOC) 취업 준비생 누구나 POSTECH과 POSCO가 제공하는 무료 온라인 교육 과정에 참여할 수 있습니다. pabi.smartlearn.io 지난 포스팅에 이어 이번에는 통계 검정방법에 대한 강의를 수강하였다. 통계 검정방법 신뢰구간의 의미 통계적 검정은 왜 필요한가 두 집단 t-검정 p-value의 실제의미 신뢰구간의 의미 신뢰구간 이라는 용어를 많이 듣게 되는 곳은 여론조사때 미디어! ex) 지지율이 37%, 40% 일때 오차범위가 3%면 34% ~ 40% 3.. 2021. 3. 25.
[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_4 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의를 듣고 정리한 포스팅이다. 강의 링크 : pabi.smartlearn.io/? 청년 AI·Big Data 아카데미 온라인 기초과정 (MOOC) 취업 준비생 누구나 POSTECH과 POSCO가 제공하는 무료 온라인 교육 과정에 참여할 수 있습니다. pabi.smartlearn.io 확률의 기초개념 : 통계란? - 데이터를 수집, 처리, 분석, 활용하는 지식 확률이란? - 특정한 사건이 일어날 가능성을 0~1 사이의 값으로 나타내는 것 장기적으로 어떤 사건이 일어날 가능성은 확률적으로 예측이 가능하다 사건 : 표본 공간에서 관심의 대상인 부분집합 표본공간 : 확률실험의 모든 가능한 결과의.. 2021. 3. 17.
[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_3 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의를 듣고 정리한 포스팅이다. 강의 링크 : pabi.smartlearn.io/? 청년 AI·Big Data 아카데미 온라인 기초과정 (MOOC) 취업 준비생 누구나 POSTECH과 POSCO가 제공하는 무료 온라인 교육 과정에 참여할 수 있습니다. pabi.smartlearn.io 데이터 시각화 (Data Visualization) : - 데이터 분석결과를 쉽게 이해할 수 있도록 보여주는 것 나타내는 방법 : 인포그래픽 (Infographic) 히스토그램 (Histogram) 상자그림 (Box plot) 산점도 (Scatter plot) 효과적인 데이터 시각화의 조건 : 어떤 메시지를 .. 2021. 3. 17.
[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_2 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나인 데이터 과학에 대한 강의이다. 2주차 강의의 목차는 다음과 같았다 데이터의 평균 데이터의 분산 데이터와 빅데이터 데이터 탐색의 첫걸음 데이터의 평균 : 평균이란 데이터를 하나의 값으로 표현한 요약된 정보이다. (추정치) 모든 데이터를 더한 후 갯수로 나는 값 평균은 혼자 존재하는 개념이 아니다. 어떻게 표본선정을 하느냐에 따라 평균값에 영향을 미친다. 평균과 표본선정 : 표본이 적합하게 추출되었는지 평가하는 방법 (평균을 예제로 하면) 1. Bias 가 적은가? - 표본 추출 시 표본으로부터의 통계치의 기대값이 모수의 참값과 유사한가 2. Precision이 높은가? - 반복해서 표본을 추출할 때 얼마나 유사.. 2021. 3. 16.
[POSCO 교육 사전학습] AI 입문 - 데이터사이언스를 위한 통계_1 데이터 과학과 통계 과목을 수강한 이유 : 포스코 포스텍에서 제공하는 청년 AI-BigData 아카데미 과정의 온라인 예습 과정 중 하나로 지금까지 한 번도 접해보지 못했던 데이터 과학에 대한 강의를 수강했다. Python, Tf, torch, numpy, SQL, pandas 등등 AI에 관련한 많은 툴들을 만져보고 적용해봤지만 이들의 DB가 되는 데이터에 대해 자세히 배워본 적 없어서 수강하게 되었다. 데이터 과학이란 : 통계학 - 데이터마이닝 - 빅데이터 - 딥러닝 - 인공지능 은 연결되어있는 분야이다. 데이터 분석 : 예측모형만을 말하는 것이 아니라 1. 데이터 큐레이션 - 데이터 추출, 변환 (SQL, R, Python) 2. 데이터 시각화 - ggplot, pyplot, matplotlib 3.. 2021. 3. 16.
[POSCO 교육 사전학습] AI 입문 - 컴퓨팅사고1_8 포스텍과 포스코가 공동으로 제공하는 청년 AI-Big Data 아카데미의 온라인 과정(MOOC)을 수강하고 간단히 기록한 포스팅입니다. 이전 과정은 전 포스팅인 1_6,7 에 기록해두었습니다. 순서열 연산자 : '더미' 의 의미에 맞게 빠트림 없이 -'더미'의 의미에 맞게 작동 -'더미'로 정의한 순서열 원소를 빠트림 없이 처리 순서열 연산자 설계 검증하기 1. 순서열 만든 직후 원소나 원소 더미를 뽑아내서 검사 2. 내용을 모르는 순서열을 받아서 복제할 수 있는지 검사 순서열 복제하기 - 사용하는 연산자 --> 순서열 == [] --> 순서열[0] --> 순서열[1:] - 상수 op에 기록된 순서열 복제하기 --> [] if op==[] else [op[0]]+op[1:] 이렇게 해서 컴퓨팅사고의 모든.. 2021. 3. 13.
[POSCO 교육 사전학습] AI 입문 - 컴퓨팅사고1_6,7 포스텍과 포스코가 공동으로 제공하는 청년 AI-Big Data 아카데미의 온라인 과정(MOOC)을 수강하고 간단히 기록한 포스팅입니다. 이전 포스팅인 컴퓨팅사고 1_5 에서 이어집니다. 6장 : 연산 지금까지 컴퓨터의 계산은 무엇으로 이루어지는지 알아보았다. 그 중 연산에 대해 알아보도록 한다. 계산 = 무엇(계산대상) + 어떻게(계산과정) 무엇 - 알맹이요약하기, 계산자료 어떻게 - 연산, 명령 연산자 종류 단항 연산자 : not True 이항 연산자 : A + B Python 언어에서는 + - / % * ** 을 모두 사용할 수 있다. 연산시 우선순위 지수승 ** 부호 변환 + - 곱셈 나눗셈 나머지 * / % 덧셈 뺄셈 문자열잇기 + - + 논리 부정 not 논리곱 and 논리합 or 순이다. 또한.. 2021. 3. 13.
[POSCO 교육 사전학습] AI 입문 - 컴퓨팅사고1_5 포스텍과 포스코가 공동으로 제공하는 청년 AI-Big Data 아카데미의 온라인 과정(MOOC)을 수강하고 간단히 기록한 포스팅입니다. 1_5는 앞선 1_4 과정에어 이어지는 과정입니다. 계산 자료 - 같은 꼴의 더미 - 계산 설계가 쉬워짐 - 알맹이 요약하기에서 중요 같은 꼴의 더미를 표현하기 위해서 순서열을 사용할 수 있다. [자료1, 자료2, 자료3...] 빈 더미의 표현 [] 로 표현할 수 있다. 작은 순서열 맨 앞에 원소 하나를 덧붙이기 [원소] + 작은 순서열 순서열과 여러곱 여러곱 - 원소 갯수가 고정 - 원소 추가하면 새로운 꼴의 여러곱이 나온다 순서열 - 원소가 몇 개 포함될지 미정 - 원소를 추가해도 종류가 달라지지 않는다 순서열의 사용 [2] + [3] = [2,3] 다음 유도하기와 .. 2021. 3. 12.
반응형