20240630 ADsP 1일차 : 데이터와 정보
1. ADsP 개요
<구성>
1. 데이터 이해 2. 데이터분석기획 3.데이터 분석
ADsP : 데이터 이해를 바탕으로 데이터 분석 기획, 데이터 분석 능력을 갖추고 있는지 평가,
실기 없이 필기만 객관식 50문항 시간은 90분
2. 데이터의 이해
데이터(Data)=정보(Information)
저장이나 처리에 효율적인 형태로 변환된 정보
1 Byte == 8 Bit
1 Kilo == 1000 Byte
1 Mega == 1000 Kilo
1 Giga == 1000 Mega
1 Tera == 1000 Giga
1 Peta == 1000 Tera
1 Exa == 1000 Peta
1 Zeta == 1000 Exa
1 Yota == 1000 Zeta
>>무한하게 증가하는 데이터를 잘 저장하고 관리하는 기술이 필요
데이터 정의 -- 외울 필요 없음
데이터 특성
-존재적 특성 : 있는 그대로의 객관적 사실
-당귀적 특성 : 추론, 예측, 전망, 추정을 위한 근거
>>이러한 데이터는 축적되어 사용되며 객관적 사실로서의 개별데이터를 중요X
데이터 유형
정성적 데이터 - 언어, 문자 등 // 정량적 데이터 - 수치, 기호, 도형 등
정형데이터 - 고정된 틀이 있으며 연산 가능 ex) CSV ,Excel, 스프레드시트, 관계형 데이터베이스
비정형 데이터-고정된 틀이 없으며 연산 불가능 ex) NoSQL, 명상, 음성 등
반정형 데이터- 고정된 틀을 가지고 있지만 연산 불가능 ex) HTML, JSON, XML 등
암묵지와 형식지 - 지식을 구분하는 방법
암묵지 - 자전거 타기와 같이 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식, 외부로 표출 X
>>공유와 전달 어려움
형식지 - 교과서, 메뉴얼 등과 같이 형상화된 지식을 의미하며 유형의 대상이 있기 때문에 공유 가능한 지식
DIKW 피라미드 - 데이터에서 지혜를 얻어내는 과정을 계층구조로 설명
- 데이터(Data) : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실(순수한 수치나 기호)
- 정보(Information) : 데이터의 가공 및 처리와 데이터 간 연관 관계 속에서 의미 도출(의미부여)
- 지식(Knowledge) : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화
- 지혜(Wisdom) : 지식의 축적과 아이디어가 결합된 창의적 산물(예측) > 지식보다 한 발자국 더 나아간 것이라고 생각
3.데이터베이스
-용어의 연혁은 한 번만 읽어보기 외우기 x
-데이터베이스의 다양한 정의 부분도 그냥 읽어보기 외우기x
헷갈리기 쉬운 DB system - 차이를 묻는 질문 종종 나옴
- DB : 필요로 하는 정보를 체계적으로 수집/축적하여 제공하는 정보의 집합체
- DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어
데이터베이스 종류
관계형 데이터베이스(Relational Database) = 표(Table)
- 데이터를 행과 열로 표현된 표현식으로 저장하며 데이터 간의 관계를 나타내는 테이블 사용
- 관계형 데이터베이스를 SQL을 사용하여 데이터를 조작하고 검색
비관계형 데이터베이스(NoSQL)
- "Not only SQL" or "Non-SQL" 의 약자로, 다른 형태의 데이터베이스 관리 시스템을 나타내는 용어
- 관계형과는 다른 데이터 모델과 기술을 사용하여 데이터 저장, 검색 및 관리
- 비정형 데이터와 대용량 데이터 분석 및 분산 처리에 용이
데이터베이스의 일반적인 특징-- 설명이 나오고 어떤 특징인지
- 통합된 데이터- 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미
- 저장된 데이터- 컴퓨터 기술을 바탕으로 텀퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
- 공용 데이터- 다수의 사용자가 다양한 목적으로 데이터를 이용한다는 것을 의미
- 변화되는 데이터 - 데이터의 삽입, 삭제, 갱신으로 변화하면서도 항상 정확한 데이터 상태 유지
데이터베이스의 다양한 측면에서의 특징
- 정보의 축적 및 전단 후면(기계)
- 정보이용측면(사용)
- 정보 관리측면(데이터관리)
- 정보기술 발전의 측면
- 경제,상업적 측면
기업내부 데이터베이스
[1980년대]
OLTP(Online Transaction Processing) : 정보시스템
- 데이터베이스의 데이털르 수시로 갱신하는 프로세싱, 데이터 갱신 위주
OLAP(Online Analytical processing) : 분석 중심 시스템
- 데이터 조회 위주 > 모아둔 데이터에 초점
[2000년대]
CRM(Consumer Relationship Management, 고객 관계 관리)
- 고객의 구매이력 데이터를 분석하여 고객에 대한 이해도를 높이고 이를 바탕으로 효과적이고 효율적인 마케팅 전략을 펼치는 것
ERP
RTE(Real Time Enterprice) : 업무 프로세스 중 발생하는 정보들에 신속한 대응
산업 부분별 데이터베이스 발전 과정 읽어보고 이해하기
사회기반의 구조로서의 데이터베이스 >> 이 부분은 더 자세히 읽어보기