등장 배경
- 스팸 필터, 자율주행차 등등
- Rule이 너무 많고 복잡하다
- 1959년 Arthur Samuel "데이터를 학습해서 판단하는 프로그램을 만들자"
종류
- Supervised Learning
- labeled data (training set) 을 가지고 학습하는 방법
- ex) 고양이, 개, 모자, 컵 등을 분류하는 프로그램
- Unsupervised Learning
- label이 없는 데이터를 스스로 학습하는 방법
- ex) Google news grouping, 비슷한 단어 모음 (word clustering)
Supervised Learning
- Image labeling
- Email span filter : label을 가지고 spam or ham email인지 판단
- Predicing exam score : 이전 시험 점수와 소요 시간으로 시험 점수 예측
- AlphaGo : training data set(이전 대국 기록)을 가지고 가장 이길 것 같은 위치에 바둑알 배치
Supervised learning의 종류
- 소요 시간으로 시험 점수 예측 (0부터 100까지) - regression
- 아래와 같은 training data set이 있다고 할 때, x = 7 일 때 y? 75점 정도로 예측할 수 있음.
x(hours) | y(score) |
10 | 90 |
9 | 80 |
3 | 50 |
2 | 30 |
- 소요 시간으로 Pass/Fail 예측 - binary classification
- 2가지로(binary) 분류(classification)
x(hours) | y(P/F) |
10 | P |
9 | P |
3 | F |
2 | F |
- 소요 시간으로 학점 예측 (A, B, C, E, and F) - multi-level classification
x(hours) | y(grade) |
10 | A |
9 | B |
3 | D |
2 | F |
※ inflearn 모두를 위한 딥러닝 강좌를 듣고 정리한 내용입니다.
'Deep Learning' 카테고리의 다른 글
TensorFlow로 파일에서 데이터 읽어오기 (0) | 2019.04.21 |
---|---|
여러 feature의 linear regression (0) | 2019.04.15 |
Linear Regression의 cost 최소화 알고리즘의 원리 (0) | 2019.04.14 |
Linear Regression의 Hypothesis와 cost (0) | 2019.04.14 |
TensorFlow의 설치 및 기본적인 operations (0) | 2019.04.14 |