이번 글에서는 입력 데이터를 학습한 뒤, 데이터를 두 가지로 분류하는 방법을 다룹니다.
이 글에서 사용할 예제는 다음과 같습니다.
보고서 제출 여부(x1) | 쪽지 시험 점수(x2) | 출석 수(x3) | 합격 여부(y) |
---|---|---|---|
1 | 2 | 1 | 0 |
0 | 3 | 2 | 0 |
1 | 3 | 3 | 0 |
1 | 5 | 5 | 1 |
1 | 7 | 5 | 1 |
1 | 2 | 5 | 1 |
Linear Regression에서는 가설 함수를 y = w1x1 + w2x2 + w3x3
형태로 작성을 하였습니다. 그러나 Logistic Regression에서는 결과를 0 또는 1로 만드는 것이 목표이기 때문에 가설 함수의 값을 0과 1 사이로 조정할 필요가 있습니다.
가설 함수를 다음과 같이 작성합시다.
아래줄에 있는 식은 시그모이드(sigmoid)함수라고 불리며, 입력 데이터를 0부터 1사이의 값으로 적절히 변환하여 반환해줍니다. 그래프는 아래 사진과 같습니다.
입력 값이 작아지면 0으로 수렴하고, 커지면 1로 수렴하는 함수입니다.