일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DP문제
- sort
- 삼성역량테스트
- bfs문제
- 그리디
- 포스코 교육
- 포스코 AI교육
- 임베디드 딥러닝
- 초소형머신러닝
- 다이나믹프로그래밍
- 삼성코딩테스트
- 코딩테스트
- tflite
- dfs
- 자료구조
- MCU 딥러닝
- BFS
- 삼성역테
- 삼성코테
- 컴퓨팅사고
- 알고리즘
- tinyml
- 포스코 ai 교육
- dfs문제
- 딥러닝
- 코테 문제
- DP
- 코테
- TensorFlow Lite
- 영상처리
- Today
- Total
코딩뚠뚠
[머신러닝 공부] 5. 가설의 표현 본문
머신러닝 입문자들의 필수코스라고 할 수 있는 앤드류 응 님의 강의를 번역해놓은 아래 브런치를 참고하여 공부하고 핵심내용만 정리해보고자 한다.
원문 출처 : brunch.co.kr/@linecard/441
모델을 표현하는 방법에 대해 :
회기(Regression) 알고리즘을 따라가며 모델의 전체과정을 설명한다.
- 주택 가격을 예측하는 데이터가 있고 내 집은 30평이다. 이를 얼마에 팔수 있는지 예측하고싶다.
- 우선 1차원적으로 데이터셋에 부합하는 값을 찾을 수 있을것이다.
- 각 학습예제의 정답이 있기때문에 부합하는 값을 알 수 있었다. 이게 지도학습이다. 실제 데이터를 바탕으로 주택가격을 예측했기 때문이다.
지도학습에서 데이터 셋의 공식명칭은 ?
Training Set 이라고 한다.
표기법을 정의하자 :
m : 학습용 데이터의 수
x : 피쳐를 나타내는 입력변수
y : 출력값 또는 결과를 예측하기 위한 목표변수
(x,y) : 단 하나의 학습용 데이터 값
(x^(i),y^(i)) : i 번째 학습용 데이터
간단한 동작 방식 :
Training Set 을 Learning Algorithm을 돌려 h (hypoesis : 가설) 을 생성해준다.
집의 크기(데이터셋) 를 h를 이용해 연산하면 집의 가격을 도출해 낼 수 있을것이다. (지도학습 : Regression에서)
가설 (h) 의 표현방법 :
hθ(x) = θ0 + θ1x
이는 x의 선형함수인 y를 예측하는 것이다.
따라서 이 함수는 하나의변수를 가진 선형회귀 라고 불린다. 또는 같은 이름으로 단변수 선형회귀 라고도 불린다.
이 모형을 구현하는 것은 다음 포스팅에서..
'공부 > ML&DL' 카테고리의 다른 글
[머신러닝 공부] 7. 비용 함수 2 (0) | 2021.01.12 |
---|---|
[머신러닝 공부] 6. 비용 함수 1 (0) | 2021.01.12 |
[머신러닝 공부] 4. 비지도학습 (0) | 2021.01.05 |
[머신러닝 공부] 3. 지도학습 (0) | 2021.01.05 |
[머신러닝 공부] 2. 머신러닝의 정의 (0) | 2021.01.05 |