전체 글

데이터 분석가로 나아가는 중
·CODEKATA
https://school.programmers.co.kr/learn/courses/30/lessons/70128 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr 문제 설명길이가 같은 두 1차원 정수 배열 a, b가 매개변수로 주어집니다. a와 b의 내적을 return 하도록 solution 함수를 완성해주세요.이때, a와 b의 내적은 a[0]*b[0] + a[1]*b[1] + ... + a[n-1]*b[n-1]입니다. (n은 a, b의 길이)제한사항a, b의 길이는 1 이상 1,000 이하입니다.a, b의 모든 수는 -1,000 이상 1,000 이하입니다.입..
·CODEKATA
문제 설명길이가 n이고, "수박수박수박수...."와 같은 패턴을 유지하는 문자열을 리턴하는 함수, solution을 완성하세요. 예를들어 n이 4이면 "수박수박"을 리턴하고 3이라면 "수박수"를 리턴하면 됩니다.제한 조건n은 길이 10,000이하인 자연수입니다.입출력 예nreturn3"수박수"4"수박수박"def solution(n): answer = '' for i in range(n): if i % 2 == 0: answer = answer + "수" else: answer = answer + "박" return answer 1. answer 이라는 빈 문자열 선언 --> answer = '' 2. for 문을 통해 0부터..
·CODEKATA
문제 설명단어 s의 가운데 글자를 반환하는 함수, solution을 만들어 보세요. 단어의 길이가 짝수라면 가운데 두글자를 반환하면 됩니다.재한사항s는 길이가 1 이상, 100이하인 스트링입니다.입출력 예sreturn"adcde""c""qwer""we"def solution(s): if len(s) % 2 == 0: return s[len(s)//2-1 : len(s)//2+1] else: return s[len(s)//2] 1. 길이를 구하려면 --> len 함수 사용 --> len(s)2. 입출력 예를보면 짝수일때와 홀수일때로 나뉘기 때문에 if문을 사용하여 짝수와 홀수로 나누기3. 중앙값을 구하기 위해서 len(s) //2로 사용💡return 값 앞에 s가 붙는..
·자격증/SQLD
20240819 TIL1. DML테이블에 데이터를 삽입(insert), 삭제(DELETE), 수정(UPDATE), 조회(select) 하는 일을 수행하는 SQL추가적으로 데이터베이스에 완전하게 반영하는 커밋(COMMIT)과 데이터베이스 작업의 취소를 위한 롤백(ROLLBACK)▶ INSERT데이터를 저장할 때 사용 1. 칼럼 리스트를 명시하는 방법어떤 칼럼에 넣을지 명시하며 저장할 데이터도 칼럼의 순서에 맞게 작성2. 칼럼 리스트를 명시하지 않는 방법모든 칼럼에 값을 넣을 것이라는 의미테이블에서 정의된 칼럼의 개수에 맞추어 저장되는 값을 순서대로 입력-- 칼럼 리스트 명시INSERT INTO player (name, height, weight) VALUES ('KIM', 184, 75);-- 칼럼 리스트..
★ 총 평머신러닝 강의 다 들었음!SQLD도 꾸준히 듣고 있는 중 .....코드카타 소홀히 했다 ......vscode 에러 사건8월달 들어서면서 느꼈지만 시간이 너무 빠르게 지나가는 것 같다. 벌써 다음주면 또 프로젝트 시작이기 때무네 .....이번엔 정말 자신이 좀 없다 ㅠㅠ 머신러닝 강의와 기초 통계학 강의를 들으면서 생각보다 너무 어려웠고 이해가 안되는 부분도 많았다어렵다고 해도 이겨내야 하는 부분이지만 팀원들한테 민폐 끼칠까봐 혹은 프로젝트를 제대로 수행하지 못할까봐 걱정이다이런 약한 소리 하기 싫지만 공부하면서 너무 직격탄으로 느껴지기 때문에 흑흑 그래도 열심히 해봐야겠쥐 ...또 머신러닝 실습해보면서 설치해야 할 것들도 있었는데 중간중간 오류가 계속 나서 정말 힘들었다. 결국엔 커널 자체에 ..
·✨Today I Learned
20240816 TIL1. 의사결정나무의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법더보기성별 기준으로 의사결정나무 시각화 루트 노드(Root Node): 의사결정나무의 시작점. 최초의 분할조건리프 노드(Leaf Node): 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준(criteria): sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로, 남성인 경우 우측 노드로 분류불순도(impurity)불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스가..
·✨Today I Learned
20240814 TIL1. 예측모델링 프로세스 (1) 데이터 수집데이터 분석가는 이미 존재하는 데이터를 SQL 혹은 Python으로 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당더보기Data SourceOLTP Database: OnLine Transaction Processing 은 온라인 뱅킹,쇼핑, 주문 입력 등 동시에 발생하는 다수의 트랜잭션(데이터베이스 작업의 단위) 처리 유형Enterprise Applications: 회사 내 데이터 (ex 고객 관계 데이터, 제품 마케팅 세일즈)Third - Party: Google Analytics와 같은 외부소스에서 수집되는 데이터Web/Log: 사용자의 로그데이터Data Lake: 원시 형태의 다양한 유형의 데이터를 저장Data Warehouse: ..
·✨Today I Learned
20240813 TIL1. 타이타닉 생존 분류 문제Kaggle 타이타닉 예측 대회주제: 탑승한 승객의 정보를 바탕으로 생존 유무를 예측하는 분류 문제Y(종속변수): 사망(0), 생존(1)X(독립변수): 티켓등급, 성별, 요금 등 2. 로지스틱회귀 이론 ▶ 오즈비(Odds ratio) : 실패확률 대비, 성공확률그러나 바로 사용 불가능왜? P는 확률 값으로 0,1 사이 값인데 P가 증가할수록 오즈비가 급격하게 증가하기 때문에 --> 선형성을 따르지 않게 됨따라서 로그를 씌워 완화오즈비와 확률의 관계 / 로짓과 확률의 관계로짓의 그래프가 더 선형적인 그림을 나타내어 선형회귀의 기본식을 활용할 수 있게 됨 --> 로지스틱 "회귀" 라고 불리는 이유 ▶ 로지스틱 함수시그모이드 함수 중 하나로 딥러닝에서 다시 활..