20240702 TIL4.숫자와 문자열의 다양한 기능-문자열의 format() 함수format() 함수 : 문자열이 가지고 있는 함수"{}".format( )#format() 함수로 숫자를 문자열로 변환하기string_a = "{}}.format(10)print(string_a) #10 format() 함수의 다양한 형태#숫자를 문자열로 변환format_a = "{}만 원".format(5000)format_b = "파이썬 열공하여 첫 연봉 {}만 원 만들기 ".format(5000)format_c = "{} {} {}".format(3000, 4000, 5000)format_d = "{} {} {}".foramt(1, "문자열", True)print(format_a) #5000만 원print(forma..
전체 글
데이터 분석가로 나아가는 중20240702 ADsP 6일차 데이터 전 처리1. 데이터 마트데이터 마트란?데이터 웨어하우스로부터 특정 사용자가 관심을 갖는 데이터들을 주제별, 부서별로 추출하여 모은 비교적 작은 규모의 데이터 웨어하우스효율적인 데이터 마트 개발을 위해서는 R에서 제공하는 다양한 패키지 활용데이터 마트로 분리시 시간/공간적인 효율성을 기대할 수 있음데이터 전처리전처리에는 데이터를 정제하는 과정과 분석 변수를 처리하는 과정 포함데이터 정제 과정은 크게 결측값과 이상값을 처리하는 내용요약변수원래 데이터로부터 기본적인 통계 자료를 추출한 데이터 마트에서 가장 기본적인 변수많은 모델을 공통으로 사용될 수 있어 재활용성 높음파생변수특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미(목적)을 부여한 변수주관적일 수 있으므..
44번 - 가격대 별 상품 개수 구하기PRODUCT 테이블에서 만원 단위의 가격대 별로 상품 개수를 출력하는 SQL 문을 작성해주세요. 이때 컬럼명은 각각 컬럼명은 PRICE_GROUP, PRODUCTS로 지정해주시고 가격대 정보는 각 구간의 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시해주세요. 결과는 가격대를 기준으로 오름차순 정렬해주세요. 만원 단위의 가격대 별로 상품을 나누면가격대가 0원 ~ 1만원 미만인 상품은 PRODUCT_ID 가 2인 상품 1개,가격대가 1만원 이상 ~ 2만원 미만인 상품들은 PRODUCT_ID 가 1, 4, 6인 상품 3개,가격대가 2만원 이상 ~ 3만원 미만인 상품은 PRODUCT_ID 가 3인 상품 1개,가격대가 3만원 이상 ~..
20240701 TIL1. 문자열문자열=String글자들이 나열된 것"Hello" 'String' '안녕하세요' "Hello Python Programming"큰따옴표를 붙이나 작은따옴표를 붙이나 마찬가지의 결과를 출력▷ 큰따옴표를 문자열 내부에 넣고 싶다면?print('"안녕하세요"라고 말했습니다')# 답 : "안녕하세요"라고 말했습니다 ▷작은따옴표를 넣고 싶다면?print("'배가 고픕니다'라고 생각했습니다")# 정답 : '배가 고픕니다'라고 생각했습니다 -이스케이프 문자를 사용해 문자열 만들기\" : 큰따옴표를 의미\' : 작은따옴표를 의미\n : 줄바꿈을 의미\t : 탭을 의미print("\"안녕하세요\"라고 말했습니다")# 답 : "안녕하세요"라고 말했습니다print('\'배가 고픕니다\'라고 ..
20240701 ADsP 4일차 : 분석 마스터플랜1. 마스터플랜 수립 개요마스터플랜 수립 프레임워크 개요우선순위를 정하는 일분석 과제의 적용 범위 및 방식 설정분석 과제의 우선순위와 적용 범위 및 방식을 종합적으로 고려하여 최종적으로 분석 구현의 로드맵 수립우선순위 고려요소>적용범위 / 방식 고려요소1. 전략적 중요도적용 우선순위 설정1. 업무 내재화 적용 수준Analytics 구현 로드맵 수립2. 비즈니스 성과/ROI2. 분석 데이터 적용 수준3. 실행 용이성3. 기술 적용 수준 빅데이터의 특징을 고려한 분석 ROI 요소4V3V1. 크기(Volume)데이터 규모 / 양>투자비용 요소(Investment)2. 다양성(Variety)데이터 종류 / 유형3. 속도(Velocity)데이터 생성속도 / 처리속..
20240701 ADsP 3일 차 : 데이터 분석 기획1. 데이터 분석기획 분석 기획 정의:분석 기획은 실제 분석을 수행하기 전에 과제의 정의와 결과 도출을 관리하는 사전 계획 작목표 달성에 필요한 데이터와 방법을 계획하는 중요한 사전 작업분석 기획 특징:데이터 사이언티스트의 요구 역량: 수학/통계학적 지식, 데이터 및 프로그래밍 기술, 비즈니스 이해와 전문성 분석 대상과 방법에 따른 4가지 분석 주제:최적화 : 문제와 방법이 명확할 때솔루션 : 문제는 명확하지만 방법을 모를 때발견 : 문제와 방법 모두 모를 때통찰력 : 문제는 모르는 데 방법을 알 때목표 시점별 분석 기획:과제 중심 접근 : 빠른 문제 해결 필요시장기 마스터플랜 : 지속적인 분석 내재화 필요시 당면한 분석 주제의 해결(과제 단위)지속적..
20240701 SQL CODEKATA💻 41번 - 조건에 맞는 도서 리스트 출력하기BOOK 테이블에서 2021년에 출판된 '인문' 카테고리에 속하는 도서 리스트를 찾아서 도서 ID(BOOK_ID), 출판일 (PUBLISHED_DATE)을 출력하는 SQL문을 작성해주세요. 결과는 출판일을 기준으로 오름차순 정렬해주세요.select book_id, substr(published_date, 1, 10) pusblished_datefrom bookwhere published_date like '2021%' and category='인문'order by published_date 조회 : book_id, published_date조건 : 2021년도에 출판 -- where publised_date ..
20240630 ADsP 2일차 : 데이터의 가치와 미래1. 빅데이터 정의가트너그룹의 더그래니의 정의(3V)-데이터의 양(Volume) -데이터 유형과 소스 측면의 다양성(Variety) -데이터수집과 처리 측면에서 속도(Velocity) 빅데이터의 새로운 특징(4V)3V의 추가로 Value(가치) or veracity(정확성)를 포함해 4V로 설명하기도 함여기에 Visualization(시각화), variability(가변성) 등을 추가하는 견해도 있음 빅데이터 출현 배경 출현배경내용산업계고객 데이터 축적-양질 전환 법칙으로 설명 가능-양적인 변화가 축적되면 질적인 변화도 이루어짐학계거대 데이터 활용 과학 확산-필요한 기술 아키텍처 및 통계 도구들이 지속적으로 발전기술발전관련 기술의 발달-저장 기술의 ..