자격증/ADsP

ADsP 1일차

임빵빵 2024. 6. 30. 15:33

20240630 ADsP 1일차 : 데이터와 정보

 

1. ADsP 개요

<구성>

1. 데이터 이해 2. 데이터분석기획 3.데이터 분석

 

ADsP : 데이터 이해를 바탕으로 데이터 분석 기획, 데이터 분석 능력을 갖추고 있는지 평가,

실기 없이 필기만 객관식 50문항 시간은 90분

 

2. 데이터의 이해

데이터(Data)=정보(Information)

저장이나 처리에 효율적인 형태로 변환된 정보

 

1 Byte == 8 Bit

1 Kilo == 1000 Byte

1 Mega == 1000 Kilo

1 Giga == 1000 Mega

1 Tera == 1000 Giga

1 Peta == 1000 Tera

1 Exa  == 1000 Peta

1 Zeta == 1000 Exa

1 Yota == 1000 Zeta

>>무한하게 증가하는 데이터를 잘 저장하고 관리하는 기술이 필요

 

데이터 정의 -- 외울 필요 없음

데이터 특성

-존재적 특성 : 있는 그대로의 객관적 사실

-당귀적 특성 : 추론, 예측, 전망, 추정을 위한 근거

>>이러한 데이터는 축적되어 사용되며 객관적 사실로서의 개별데이터를 중요X

 

데이터 유형

정성적 데이터 - 언어, 문자 등 // 정량적 데이터 - 수치, 기호, 도형 등

 

정형데이터 - 고정된 틀이 있으며 연산 가능 ex) CSV ,Excel, 스프레드시트,  관계형 데이터베이스

비정형 데이터-고정된 틀이 없으며 연산 불가능 ex) NoSQL, 명상, 음성 등

반정형 데이터- 고정된 틀을 가지고 있지만 연산 불가능 ex) HTML, JSON, XML 등

 

암묵지와 형식지 - 지식을 구분하는 방법

암묵지 - 자전거 타기와 같이 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식, 외부로 표출 X 

>>공유와 전달 어려움

형식지 - 교과서, 메뉴얼 등과 같이 형상화된 지식을 의미하며 유형의 대상이 있기 때문에 공유 가능한 지식

 

DIKW 피라미드 - 데이터에서 지혜를 얻어내는 과정을 계층구조로 설명

  • 데이터(Data) : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실(순수한 수치나 기호)
  • 정보(Information) : 데이터의 가공 및 처리와 데이터 간 연관 관계 속에서 의미 도출(의미부여)
  • 지식(Knowledge) : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화
  • 지혜(Wisdom) : 지식의 축적과 아이디어가 결합된 창의적 산물(예측) > 지식보다 한 발자국 더 나아간 것이라고 생각

 

3.데이터베이스

-용어의 연혁은 한 번만 읽어보기 외우기 x

-데이터베이스의 다양한 정의 부분도 그냥 읽어보기 외우기x

 

헷갈리기 쉬운 DB system - 차이를 묻는 질문 종종 나옴

  • DB : 필요로 하는 정보를 체계적으로 수집/축적하여 제공하는 정보의 집합체
  • DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어

 

데이터베이스 종류

관계형 데이터베이스(Relational Database) = 표(Table)

  • 데이터를 행과 열로 표현된 표현식으로 저장하며 데이터 간의 관계를 나타내는 테이블 사용
  • 관계형 데이터베이스를 SQL을 사용하여 데이터를 조작하고 검색

비관계형 데이터베이스(NoSQL)

  • "Not only SQL" or "Non-SQL" 의 약자로, 다른 형태의 데이터베이스 관리 시스템을 나타내는 용어
  • 관계형과는 다른 데이터 모델과 기술을 사용하여 데이터 저장, 검색 및 관리
  • 비정형 데이터와 대용량 데이터 분석 및 분산 처리에 용이

 

데이터베이스의 일반적인 특징-- 설명이 나오고 어떤 특징인지

  • 통합된 데이터- 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미
  • 저장된 데이터- 컴퓨터 기술을 바탕으로 텀퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
  • 공용 데이터- 다수의 사용자가 다양한 목적으로 데이터를 이용한다는 것을 의미
  • 변화되는 데이터 - 데이터의 삽입, 삭제, 갱신으로 변화하면서도 항상 정확한 데이터 상태 유지

 

데이터베이스의 다양한 측면에서의 특징

  • 정보의 축적 및 전단 후면(기계)
  • 정보이용측면(사용)
  • 정보 관리측면(데이터관리)
  • 정보기술 발전의 측면
  • 경제,상업적 측면

 

기업내부 데이터베이스 

[1980년대]

OLTP(Online Transaction Processing) : 정보시스템

  • 데이터베이스의 데이털르 수시로 갱신하는 프로세싱, 데이터 갱신 위주

OLAP(Online Analytical processing) : 분석 중심 시스템

  • 데이터 조회 위주 > 모아둔 데이터에 초점

[2000년대]

CRM(Consumer Relationship Management, 고객 관계 관리)

  • 고객의 구매이력 데이터를 분석하여 고객에 대한 이해도를 높이고 이를 바탕으로 효과적이고 효율적인 마케팅 전략을 펼치는 것

ERP

RTE(Real Time Enterprice) : 업무 프로세스 중 발생하는 정보들에 신속한 대응

 

산업 부분별 데이터베이스 발전 과정 읽어보고 이해하기

 

사회기반의 구조로서의 데이터베이스 >> 이 부분은 더 자세히 읽어보기