엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다.
✅ 머신러닝의 종류
머신러닝은 지도 학습과 비지도 학습으로 나뉜다.
✔️ 지도 학습
지도 학습(Supervised Learning)은 input data와 output data를 둘 다 가지고 예측 모델을 만드는 것을 의미한다.
지도 학습은 두 가지로 나뉘는데 범주를 예측하는 분류(Classification)와 숫자를 예측하는 회귀(Regression)이다.
✔️ 비지도 학습
비지도 학습(Unsupervised Learning)은 input data만 가지고 grouping하거나 해석한다.
비지도 학습에는 유사한 그룹끼리 군집화하는 Clustering이 속한다.
✅ 모델 평가
머신러닝 업무 프로세스의 3번째 단계인 모델 구축과 분석에서 모델 평가를 시행한다.
Regression(회귀)은 실제 값과 예측한 값 사이의 차이 즉, 오차를 통해 모델의 성능을 평가한다.
Classification(분류)은 실제 범주와 예측한 범주의 정확도를 통해 모델의 성능을 평가한다.
경우에 따라서 모델 도입을 통해 기대되는 손익이 더 중요할 때가 있다.
따라서 기대 손익(Expected Value)은 어떤 이벤트가 발생할 확률(𝑃(𝑥))과 그로 인해 발생하는 손익(𝑉)을 계산하여 평가한다.
𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑉𝑎𝑙𝑢𝑒 = 𝑃 𝑥1 × 𝑉1 + 𝑃 𝑥2 × 𝑉2 + ⋯
결론적으로 모델 평가는 머신러닝 관점에서 정확도가 높고 비즈니스 관점에서 기대 손익이 좋은 모델을 최종 선택한다.
✔️ 혼동 행렬과 확률행렬
혼동행렬(Confusion Matrix)은 분류 모델의 성능을 평가할 때 사용하는 지표이다.
확률행렬(Matrix of probabilites)은 혼동행렬 값을 확률로 정규화 한 행렬이다.
'엘리스 AI 트랙 4기 > Data Analysis Study' 카테고리의 다른 글
[프로그래밍수학] 수열 (0) | 2022.02.10 |
---|---|
[프로그래밍수학] 소수 (0) | 2022.02.10 |
머신러닝 업무 프로세스와 핵심 용어 (0) | 2022.02.08 |
데이터 과학과 머신러닝 (0) | 2022.02.08 |
[Python] csv와 파이썬 함수들 (0) | 2022.01.30 |
댓글