본문 바로가기

엘리스 AI 트랙 4기/Data Analysis Study18

[인공지능/머신러닝 기초] 회귀분석 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 회귀 분석 머신러닝은 지도학습, 비지도학습, 강화학습으로 나뉘는데 지도학습은 다시 회귀 분석과 분류로 나뉜다. 즉, 회귀 분석은 지도학습에 속하므로 input과 output data를 가지고 예측 모델을 만든다. 회귀 분석(Regression Analysis)은 가장 넓은 의미로는 독립변수(x)로 종속변수(y)를 예측하는 것을 의미한다. 여기서 독립변수란 변수의 변화 원인이 모형 밖에 있는 변수, 종속변수란 변수의 변화 원인이 모형 안에 있는 변수이다. 독립변수는 다른 변수의 변화와 관계없이 독립적으로 변하고 다른 변수의 값을 결정한다. 이때 독립변수에 의해 결정되는 값이 종속변수이다. ✅ 선형회귀분석 회귀 분석을 좀 더 좁은 의미로 말할 때는.. 2022. 2. 13.
[인공지능/머신러닝 기초] 선형대수 기초 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ Vector 스칼라(scalar)는 크기만 존재하는 양으로 길이, 넓이, 질량, 온도 등이 스칼라 값에 속한다. 쉽게 말해 그냥 숫자를 생각하면 된다. 벡터(vector)는 크기와 방향이 모두 존재하는 양으로 속도, 위치 이동, 힘 등이 있다. ✔️ 벡터 연산 벡터는 아래와 같이 표기한다. 벡터끼리 더하는 것은 피연산자가 같은 차원의 벡터일 때 가능하며 같은 차원끼리 더하면 된다. 벡터에 스칼라값을 곱할 수도 있는데 이 때에는 각 값에 동일한 스칼라 값을 곱하면 된다. ✔️ Norm n차원 벡터 \(\overrightarrow{x}=(x_{1},x_{2}, ..., x_{n})\) 에 대해 Norm은 다음의 값을 가진다. $$ ||\overri.. 2022. 2. 12.
[프로그래밍수학] 확률 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 확률 확률(Probability)은 어떤 사건이 일어날 때 우리가 집중하고자 하는 사건이 어느 정도의 비율로 일어나는지를 알려준다. 같은 원인에서 특정한 결과가 나타나는 비율을 뜻하기도 한다. 우리가 일어나기를 기대하는 사건을 근원사건이라고 정의한다면 근원사건이 일어날 확률은 다음과 같다. 확률의 계산에 있어 원소란 사건이 일어남에 있어 나타날 수 있는 모든 상황을 의미한다. 경우의 수와 달리 확률은 원소가 나타나는 빈도를 고려한다. 확률은 0부터 1까지의 값을 가지며 확률값이 0이면 절대 일어나지 않는 사건, 1이면 반드시 일어나는 사건임을 의미한다. 확률은 P로 표기한다. ✔️ 통계적 확률 확률식을 적용하는 데 있어 중요한 점은 각각의 경우.. 2022. 2. 10.
[프로그래밍수학] 순열과 조합 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 경우의 수 사건은 같은 조건에서 여러 번 할 수 있는 실험이나 관찰로 얻어진 결과를 의미한다. 경우의 수는 사건에서 일어날 수 있는 경우의 가짓수를 말한다. 예를 들어 주사위를 던졌을 때 1, 2, 3, 4, 5, 6의 결과가 나올 수 있으니 이때의 경우의 수는 6이다. ✔️ 합의 법칙 사건 A 또는 B가 일어나는 경우 전체 경우의 수는 두 사건의 경우의 수를 더한 값이 된다. 사건 A의 경우의 수가 a이고 사건 B의 경우의 수가 b라면 사건 A 또는 B가 일어날 경우의 수는 a + b이다. 이렇듯 합의 법칙은 각 사건이 동시에 일어나지 않을 때 사용한다. ✔️ 곱의 법칙 사건 A와 B가 동시에 일어나는 경우 전체 경우의 수는 두 사건의 경우의.. 2022. 2. 10.
[프로그래밍수학] 수열 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 수열 수열은 숫자의 나열을 의미한다. 수열은 나열 순서가 있고 중복이 허용된다는 점에서 집합과 구분된다. 1, 2, 3, 4, 5와 같이 개수가 정해져 있어 끝이 있는 수열을 유한 수열이라고 하며 1, 2, 3, 4, 5, ... 처럼 개수가 정해지지 않아 끝이 없는 수열을 무한 수열이라고 한다. 수열을 이루는 구성원을 수열의 항(term) 또는 원소(element)라고 한다. 수열은 항의 유형에 따라 자연수열, 실수열 등 다양한 형태로 존재할 수 있다. ✔️ 등차수열 등차수열은 연속하는 두 항의 차이가 모두 일정한 수열을 뜻한다. 즉, 일정한 간격으로 원소들이 커지거나 작아진다. 예를 들어 1, 3, 5, 7, 9, ... 는 각 원소들이 2.. 2022. 2. 10.
[프로그래밍수학] 소수 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 모듈러연산 모듈러 연산(Modular arithmetic)은 a mod b = c와 같이 표기하며 "a를 b로 나눈 나머지는 c"라는 뜻이다. 즉, 모듈러 연산은 나머지 연산이다. 프로그래밍 언어들은 보통 나머지 연산에 대해 % 기호를 사용한다. ✅ 소수 소수(Prime number)는 1과 자기 자신을 제외한 어떤 수로도 나누어 떨어지지 않는 1보다 큰 자연수이다. 소수와 반대의 개념으로 1보다 큰 수 중 어떠한 수로 나누어 떨어지는 수를 합성수(Composite number)라고 한다. 1은 소수에도 합성수에도 속하지 않는다. def isPrime(n): if n == 1: return False for i in range(2, n): if.. 2022. 2. 10.
머신러닝 종류와 머신러닝 관점 모델 평가 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 머신러닝의 종류 머신러닝은 지도 학습과 비지도 학습으로 나뉜다. ✔️ 지도 학습 지도 학습(Supervised Learning)은 input data와 output data를 둘 다 가지고 예측 모델을 만드는 것을 의미한다. 지도 학습은 두 가지로 나뉘는데 범주를 예측하는 분류(Classification)와 숫자를 예측하는 회귀(Regression)이다. ✔️ 비지도 학습 비지도 학습(Unsupervised Learning)은 input data만 가지고 grouping하거나 해석한다. 비지도 학습에는 유사한 그룹끼리 군집화하는 Clustering이 속한다. ✅ 모델 평가 머신러닝 업무 프로세스의 3번째 단계인 모델 구축과 분석에서 모델 평가를.. 2022. 2. 8.
머신러닝 업무 프로세스와 핵심 용어 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 머신러닝 업무 프로세스 머신러닝 업무 프로세스는 문제 파악 및 정의, 데이터 준비, 모델 구축과 분석, 결과 공유, 모니터링의 5가지 단계로 구성된다. ✔️ 문제 파악 및 정의 문제 파악 및 정의 단계는 비즈니스 문제를 파악하고 머신러닝 문제로 전환하는 단계이다. 머신러닝 도입 필요성 또는 가능성을 체크하며 도입에 따른 효과 검증을 설계한다. ✔️ 데이터 준비 데이터 준비 단계에서는 가능한 많은 데이터를 확보한다. 머신 러닝을 도입할 시스템을 설계하며 데이터를 분석, 이해하는 과정을 거친다. 이때 데이터 분석 및 이해 과정은 세 단계로 나뉘는데 Understanding(이해), Preprocessing(전처리), Exploring(탐색)의 순서.. 2022. 2. 8.
데이터 과학과 머신러닝 엘리스에서 제공한 강의와 자료를 보고 정리한 내용입니다. ✅ 데이터 과학 데이터 과학(Data Science)은 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제를 해결하는 작업을 의미한다. 데이터 과학은 다음의 형태로 발전했다. Descriptive Analytics : 기술 분석. 기술 통계나 현상에 대한 설명을 찾는다. Diagnostic Analytics : 왜 현상이 발생했는지 원인이나 이유를 찾고자 한다. 전통적인 통계 분석이 여기에 속한다. Predictive Analytics : 미래에는 어떻게 될지 예측하고자 한다. Prescriptive Analytics : 예측에서 끝나는 것이 아니라 예측된 결과를 통해 다음에는 어떤 행동을 취해야 할지 분석한다. 자율주행, 알파고 등이 여기에 속한다... 2022. 2. 8.