20240906 TILDA, PA 관점carrying Capacity(이하 CC)매일 들어오는 유저, 매일 매일 얼마나 잃고 있는지계산식 = 기간 중 새로 들어오는 유저수(마케팅, 광고없이) / 기간 중 잃게 되는 유저 비율(MAU대비)아하 모먼트제품의 핵심 가치XX라는 행동을, 가입한지 YY라는 날짜 안에 ZZ번 한다토스의 아하 모먼트: 4일 안에 두번이상 송금리텐션에 대한 기준리텐션의 높이가 기업의 가치를 정함리텐션 40% : 유니콘리텐션 70% : 세상을 바꿀 수 있는 정도 Shape ValueActivation : 고객의 행복한 경험전환율이 아닌 다음 퍼널로 넘어가는지 기간이 중요복귀(부활) 유저 : CC에 도달하면 대부분 부활 유저 2. 프로덕트와 친해지기1) Growth Loop 2) 유저 세..
✨Today I Learned
20240904 TIL데이터 정합성 체크대시보드를 만들고 계산식을 SQL, Python으로 더블 체크 하기모든 코드는 주석 처리태블로 주석 기호 --> //지표 프레임 워크 종류1) 지표 프레임 워크란?서비스 흐름에 따라 퍼널과 퍼널에 맞는 지표를 정의하고 해당 지표를 개선하기 액션을 수립그로스에서 가장 많이 사용되는 지표 프레임 워크 --> AARRR회사의 현 상황에 따라 어떤 프레임 워크를 선택할지를 결정2) HEART 프레임 워크Google UX research팀의 HEART 프레임워크 더보기행복(Happiness): 사용자는 얼마나 행복합니까?앱 스토어 평점, NPS참여도(Engagement): 사용자가 단기적으로 얼마나 참여하고 있나요?구매 전환율, 유저당 주문 금액채택(Adoption): 얼..
https://school.programmers.co.kr/learn/courses/30/lessons/12917 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr문제 설명문자열 s에 나타나는 문자를 큰것부터 작은 순으로 정렬해 새로운 문자열을 리턴하는 함수, solution을 완성해주세요.s는 영문 대소문자로만 구성되어 있으며, 대문자는 소문자보다 작은 것으로 간주합니다. 제한 사항str은 길이 1 이상인 문자열입니다.입출력 예sreturn"Zbcdefg""gfedcbZ"def solution(s): str_list = list(s) str_..
20240816 TIL1. 의사결정나무의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법더보기성별 기준으로 의사결정나무 시각화 루트 노드(Root Node): 의사결정나무의 시작점. 최초의 분할조건리프 노드(Leaf Node): 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준(criteria): sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로, 남성인 경우 우측 노드로 분류불순도(impurity)불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스가..
20240814 TIL1. 예측모델링 프로세스 (1) 데이터 수집데이터 분석가는 이미 존재하는 데이터를 SQL 혹은 Python으로 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당더보기Data SourceOLTP Database: OnLine Transaction Processing 은 온라인 뱅킹,쇼핑, 주문 입력 등 동시에 발생하는 다수의 트랜잭션(데이터베이스 작업의 단위) 처리 유형Enterprise Applications: 회사 내 데이터 (ex 고객 관계 데이터, 제품 마케팅 세일즈)Third - Party: Google Analytics와 같은 외부소스에서 수집되는 데이터Web/Log: 사용자의 로그데이터Data Lake: 원시 형태의 다양한 유형의 데이터를 저장Data Warehouse: ..
20240813 TIL1. 타이타닉 생존 분류 문제Kaggle 타이타닉 예측 대회주제: 탑승한 승객의 정보를 바탕으로 생존 유무를 예측하는 분류 문제Y(종속변수): 사망(0), 생존(1)X(독립변수): 티켓등급, 성별, 요금 등 2. 로지스틱회귀 이론 ▶ 오즈비(Odds ratio) : 실패확률 대비, 성공확률그러나 바로 사용 불가능왜? P는 확률 값으로 0,1 사이 값인데 P가 증가할수록 오즈비가 급격하게 증가하기 때문에 --> 선형성을 따르지 않게 됨따라서 로그를 씌워 완화오즈비와 확률의 관계 / 로짓과 확률의 관계로짓의 그래프가 더 선형적인 그림을 나타내어 선형회귀의 기본식을 활용할 수 있게 됨 --> 로지스틱 "회귀" 라고 불리는 이유 ▶ 로지스틱 함수시그모이드 함수 중 하나로 딥러닝에서 다시 활..
20240809 TIL1. 회귀분석 평가지표 회귀 평가지표 - MSE에러 정의방법방법1) 에러 = 실제 데이터 - 예측 데이터 로 정의하기방법2) 에러를 제곱하여 모두 양수로 만들기, 다 합치기방법3) 데이터만큼 나누기에러 정의 방법 수식화방법2)가 Mean Squared Erorr(MSE)y값의 머리에 있는 ^ 표기를 hat이라고 하며, 예측(혹은 추정)한 수치에 표기 ▶ 선형회귀만의 평가 지표 - R SquareR Square는 전체 모형에서 회귀선으로 설명할 수 있는 정도기초 용어$y_{i}$: 특정 데이터의 실제 값$\bar{y}$: 평균 값$\hat{y}$: 예측, 추정한 값 R Square 정의 --> ADsP 시험에도 중요하게 나오기 때문에 알아두면 좋음!2. 선형회귀 심화▶ 다중선형회귀 ..
20240808 TIL1. 머신러닝기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고 이를 바탕으로 예측, 분류하는 방법론머신러닝이 발전한 이유 - 인간은 데이터를 기반으로 한 의사결정을 내리고 싶기 때문 ▶ 머신러닝 종류 지도 학습비지도 학습강화 학습2. 선형회귀 이론공통Y는 종속 변수, 결과 변수X는 독립 변수, 원인 변수, 설명 변수통계학에서 사용하는 선형회귀 식베타0 : 편향(Bias)베타1 : 회귀 계수마지막 : 오차(에러), 모델이 설명하지 못하는 Y의 변동성수식 계산 - 각 변수가 사실 행렬로 이루어진 값 머신러닝/딥러닝에서 사용한느 선형회귀 식Y = wX + bw: 가중치b: 편향(Bias)*머신러닝/딥러..