본문 바로가기
엘리스 AI 트랙 4기/Data Analysis Study

머신러닝 종류와 머신러닝 관점 모델 평가

by _sweep 2022. 2. 8.

엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다.

 

 머신러닝의 종류

머신러닝은 지도 학습과 비지도 학습으로 나뉜다.

 

✔️ 지도 학습

지도 학습(Supervised Learning)은 input data와 output data를 둘 다 가지고 예측 모델을 만드는 것을 의미한다.

지도 학습은 두 가지로 나뉘는데 범주를 예측하는 분류(Classification)와 숫자를 예측하는 회귀(Regression)이다.

 

지도 학습

 

✔️ 비지도 학습

비지도 학습(Unsupervised Learning)은 input data만 가지고 grouping하거나 해석한다.

비지도 학습에는 유사한 그룹끼리 군집화하는 Clustering이 속한다.

 

비지도 학습

 

 

 모델 평가

머신러닝 업무 프로세스의 3번째 단계인 모델 구축과 분석에서 모델 평가를 시행한다.

 

Regression(회귀)은 실제 값과 예측한 값 사이의 차이 즉, 오차를 통해 모델의 성능을 평가한다.

Classification(분류)은 실제 범주와 예측한 범주의 정확도를 통해 모델의 성능을 평가한다.

 

경우에 따라서 모델 도입을 통해 기대되는 손익이 더 중요할 때가 있다.

따라서 기대 손익(Expected Value)은 어떤 이벤트가 발생할 확률(𝑃(𝑥))과 그로 인해 발생하는 손익(𝑉)을 계산하여 평가한다.

 

𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑉𝑎𝑙𝑢𝑒 = 𝑃 𝑥1 × 𝑉1 + 𝑃 𝑥2 × 𝑉2 + ⋯

 

결론적으로 모델 평가는 머신러닝 관점에서 정확도가 높고 비즈니스 관점에서 기대 손익이 좋은 모델을 최종 선택한다.

 

✔️ 혼동 행렬과 확률행렬

 

혼동행렬

 

혼동행렬(Confusion Matrix)은 분류 모델의 성능을 평가할 때 사용하는 지표이다.

 

확률행렬

 

확률행렬(Matrix of probabilites)은 혼동행렬 값을 확률로 정규화 한 행렬이다.

 

 

 

 

 

댓글