티스토리 뷰
2. Neural Networks / L1. Introduction to Neural Networks - Maximum Likelihood, Maximizing Probabilities
chrisysl 2018. 6. 27. 14:23Maximum Likelihood
- 확률은 딥러닝에 있어 매우 중요한 도구 중 하나이다.
- 확률을 어떻게 우리의 모델에 적용시켜 사용할 수 있는지 알아보자.
- 여러 모델 들이 있다 가정하고, 하나의 사건이 있을때 그 사건에 대해 모델들이 확률을 리턴한다 가정해보자.
- 이 경우 일어난 사건에 대해 더 높은 확률을 부여하는 모델이 가장 유용한 모델이 된다.
- 이러한 방법을 Maximum-Likelihood 라고 한다.
- 존재하는 label들에 대해 가장 높은 확률을 부여하는 모델을 선택하는것이 우리가 해 나갈 일이다.
- 그러므로 확률을 극대화 함으로써 우리는 가장 유용한 모델(best model)을 고를 수 있다.
- 위의 두개의 모델중 왼쪽의 모델은 2개의 옳게분류된 점과 2개의 잘못 분류된점으로 나누고 있고,
- 오른쪽 모델은 정확하게 모두 옳게 분류하여 나눴다. 그러므로 오른쪽 모델이 더 올바른 모델이라 바로 알 수 있다.
- 이것을 확률적 측면에서 한번 생각해보면, 오른쪽의 모델이 왼쪽보다 훨씬 더 일어날 가능성이 높음을 알 수 있다.
- stigma function을 통해 확률을 얻어내면, 기존에 파랑일 확률을 얻어냈었다.
- 이 개념을 동일하게 우측 모델에 적용시켜본다면, 0.3024라는 확률을 얻게되고
- 이는 잘못된 모델(왼쪽) 보다 훨씬 높은 확률을 나타낸다는 것을 확인 할 수 있다.
- 그러므로, 오른쪽 모델이 더 낫다고 판단할 수 있는 이유는
- 나열된 점들이 실제로 그 색을 가질 가능성이 더 크게 만들기 때문이다.
- 이제 이 Maximum-Likelihood를 적용해보자면, bad-model에서부터 확률을 얻어낸 다음
- good-model의 확률까지 경계를 바꿔가며 계속 확률을 구하다, 그 확률에 도달하게 되면 그 때가
- 우리가 의도한 그리고 올바른 경계선을 갖게된다.
- 즉, Maximum-Likelihood에 있어서 가장 유용한 모델은
- 대부분의 점들을 정확하게 분류해내고, 전체 확률 P(all)은 얼만큼 그 모델이 정확한지를 나타내준다.