본문 바로가기
엘리스 AI 트랙 4기/Data Analysis Study

데이터 과학과 머신러닝

by _sweep 2022. 2. 8.

엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다.

 

 데이터 과학

데이터 과학(Data Science)은 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제를 해결하는 작업을 의미한다.

데이터 과학은 다음의 형태로 발전했다.

 

 

  1. Descriptive Analytics : 기술 분석. 기술 통계나 현상에 대한 설명을 찾는다.
  2. Diagnostic Analytics : 왜 현상이 발생했는지 원인이나 이유를 찾고자 한다. 전통적인 통계 분석이 여기에 속한다.
  3. Predictive Analytics : 미래에는 어떻게 될지 예측하고자 한다.
  4. Prescriptive Analytics : 예측에서 끝나는 것이 아니라 예측된 결과를 통해 다음에는 어떤 행동을 취해야 할지 분석한다. 자율주행, 알파고 등이 여기에 속한다.

 

 

 머신러닝

머신러닝(Machine Learning)은 컴퓨터가 데이터로부터 스스로 학습을 할 수 있도록 프로그래밍하는 과학적인 활동을 의미한다.

이때 과학적인 활동이란 현실의 문제에 대해 가설을 세우고 검증하는 작업이다.

 

머신러닝은 다음과 같은 경우에 쓰면 좋다.

  1. 규칙이 많거나 수동으로 조정, 관리하는 경우.
  2. 전통적인 접근법을 사용하는 경우.
  3. 새로운 데이터에대한 적응을 필요로 하는 경우.

 

✔️ 머신러닝과 다른 접근 방법의 차이

머신러닝 이외에도 빅데이터 분석, 통계 분석과 같은 다양한 접근 방법이 존재한다.

 

빅데이터 분석은 상관관계를 찾는 작업이다.

프로그래밍을 포함한 기술 분석을 통한 마케팅을 의미하는 그로스해킹이 빅데이터 분석에 속한다.

 

통계 분석은 실제 세계를 이해하고 해석하는데 중점을 둔다.

통계분석은 적은 데이터를 이용한다.

 

그에 반해 머신러닝은 예측과 패턴을 분석하는데에 중점을 두며 빅데이터를 다룬다.

 

✔️ 전통적인 접근법 vs 머신러닝

 

전통적인 접근법은 문제 파악 및 정의, 규칙 작성, 평가의 순서로 진행된다.

평가 시 에러가 생기면 이를 문제에 반영하고 문제 파악 및 정의 단계로 다시 돌아간다.

에러가 확인되지 않았다면 이를 서비스에 도입하는 단계로 넘어가며 작업이 완료된다.

 

 

이에 반해 머신러닝은 문제 파악 및 정의, 머신러닝 모델 학습, 평가의 순서로 진행된다.

평가 시 에러가 확인되면 이를 문제에 반영하고 문제 파악 및 정의 단계로 돌아가는 것은 전통적인 접근법과 같다.

그러나 에러가 확인되지 않아 서비스 도입으로 단계가 넘어간 이후부터 달라진다.

머신러닝은 서비스 도입 이후 새로 생성된 데이터를 업데이트하고 이들의 결과를 또 머신러닝 모델 학습에 사용한다.

 

 

 

 

 

댓글