본문 바로가기
엘리스 AI 트랙 4기/Data Analysis Study

데이터의 이해

by _sweep 2022. 1. 26.

엘리스에서 제공한 자료를 보고 정리한 내용입니다.

 

 

 데이터와 정보

✔️ 데이터

데이터(data)는 "주다"라는 뜻인 라틴어 dare의 과거분사형으로 "주어진 것"이라는 의미로 사용되었다.

컴퓨터의 등장으로 다양한 분야에서 데이터가 사용되면서 오늘날에는 "추론과 추정의 근거를 이루는 사실" 이라는 정의를 가지게 되었다.

통계학에서는 자료, 관측값과 동일한 의미로 사용하기도 한다.

 

데이터는 정성적 데이터(Qualitative)정량적 데이터(Quantitative)로 나눌 수 있다.

 

정성적 데이터

  • 형태 : 이미지, 자연어, 동영상 등.
  • 특징 : 저장, 검색에 비용이 많이 듦. 분석이 어려움. 

정량적 데이터

  • 형태 : 숫자, 기호, 테이블 등.
  • 특징 : 저장, 검색이 용이하고 분석도 정성적 데이터에 비해 쉬움.

 

✔️ 데이터와 정보

데이터와 정보의 관계는 DIKW(Data-Infomation-Knowledge-Wisdom) 피라미드로 나타낼 수 있다.

 

 

 

 

 데이터베이스

✔️ 데이터베이스와 특징

데이터베이스는 동시에 복수의 업무를 지원할 수 있도록 복수 이용자의 요구에 대응하여 데이터를 받아들이고 저장, 공급하기 위해 일정한 구조에 따라 편성된 데이터의 집합이다.

쉽게 이야기하자면 데이터를 체계적으로 수집, 축적하여 정리한 것의 집합체이다.

 

데이터베이스는 다음과 같은 특징을 가진다.

  • 통합된 데이터 : 동일한 데이터가 중복 저장되지 않음.
  • 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장되어 있음. 컴퓨터와의 교감을 전제로 설계됨.
  • 공용 데이터 : 여러 사용자가 서로 상이한 목적을 가지고 공동 이용이 가능함.
  • 변화하는 데이터 : 끊임없는 삽입, 삭제, 갱신을 전제로 구성. 저장된 내용은 현 시점에서의 상태를 반영함.
  • 정보의 축적 및 전달 : 정보기기가 읽고 쓸 수 있음. 정보를 다양한 방법으로 검색할 수 있음. 원거리 접근 가능.
  • 정보 이용 : 이용자의 요구에 따라 다양한 정보를 신속하고 정확하게 추출.
  • 정보 관리 : 일정한 질서와 구조에 따라 정리, 저장, 검색할 수 있도록 해 많은 양의 정보를 체계적으로 관리하고 효율적으로 업데이트함.
  • 정보기술 발전 : 정보처리, 검색〮관리 소프트웨어, 관련 하드웨어, 정보 전송 네트워크 기술 발전을 견인함.
  • 산업, 경제 : 다양한 정보를 필요에 따라 신속〮정확하게 제공하는 인프라 제공.

 

✔️ 데이터베이스 분야

데이터 베이스의 분야는 다음과 같이 나눌 수 있다.

 

제조부문

  • ERP (Enterprise Resource Planning) : 기업 전 부문의 경영자원 관리 시스템을 하나로 통합한 시스템
  • BI (Business Intelligence) : 데이터에 기반한 경영 의사결정 프로세스
  • CRM (Customer Relationship Mgt.) : 고객 데이터를 바탕으로 한 장기적이고 개인화된 마케팅
  • RTE (Real-time Enterprise) : 실시간으로 기업 전 부문의 정보를 통합 관리하는 시스템

 

유통부문

  • KMS (Knowledge Mgt. System) : 기업 경영을 지식 관점에서 재조명하는 접근법 (지식관리시스템)
  • RFID (Radio Freq. Identification) : 주파수로 ID를 식별하는 전자태그 시스템

 

금융부문

  • EAI (Enterprise Application Integration) : 기업 내 정보를 중앙집중적으로 통합/관리하는 환경
  • EDW (Enterprise Data Warehouse) : DW를 전사적으로 확장하여 다양한 데이터 분석의 소스를 제공

 

 

 

 

 

댓글