20240819 TIL1. DML테이블에 데이터를 삽입(insert), 삭제(DELETE), 수정(UPDATE), 조회(select) 하는 일을 수행하는 SQL추가적으로 데이터베이스에 완전하게 반영하는 커밋(COMMIT)과 데이터베이스 작업의 취소를 위한 롤백(ROLLBACK)▶ INSERT데이터를 저장할 때 사용 1. 칼럼 리스트를 명시하는 방법어떤 칼럼에 넣을지 명시하며 저장할 데이터도 칼럼의 순서에 맞게 작성2. 칼럼 리스트를 명시하지 않는 방법모든 칼럼에 값을 넣을 것이라는 의미테이블에서 정의된 칼럼의 개수에 맞추어 저장되는 값을 순서대로 입력-- 칼럼 리스트 명시INSERT INTO player (name, height, weight) VALUES ('KIM', 184, 75);-- 칼럼 리스트..
분류 전체보기
★ 총 평머신러닝 강의 다 들었음!SQLD도 꾸준히 듣고 있는 중 .....코드카타 소홀히 했다 ......vscode 에러 사건8월달 들어서면서 느꼈지만 시간이 너무 빠르게 지나가는 것 같다. 벌써 다음주면 또 프로젝트 시작이기 때무네 .....이번엔 정말 자신이 좀 없다 ㅠㅠ 머신러닝 강의와 기초 통계학 강의를 들으면서 생각보다 너무 어려웠고 이해가 안되는 부분도 많았다어렵다고 해도 이겨내야 하는 부분이지만 팀원들한테 민폐 끼칠까봐 혹은 프로젝트를 제대로 수행하지 못할까봐 걱정이다이런 약한 소리 하기 싫지만 공부하면서 너무 직격탄으로 느껴지기 때문에 흑흑 그래도 열심히 해봐야겠쥐 ...또 머신러닝 실습해보면서 설치해야 할 것들도 있었는데 중간중간 오류가 계속 나서 정말 힘들었다. 결국엔 커널 자체에 ..
20240816 TIL1. 의사결정나무의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법더보기성별 기준으로 의사결정나무 시각화 루트 노드(Root Node): 의사결정나무의 시작점. 최초의 분할조건리프 노드(Leaf Node): 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준(criteria): sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로, 남성인 경우 우측 노드로 분류불순도(impurity)불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스가..
20240814 TIL1. 예측모델링 프로세스 (1) 데이터 수집데이터 분석가는 이미 존재하는 데이터를 SQL 혹은 Python으로 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당더보기Data SourceOLTP Database: OnLine Transaction Processing 은 온라인 뱅킹,쇼핑, 주문 입력 등 동시에 발생하는 다수의 트랜잭션(데이터베이스 작업의 단위) 처리 유형Enterprise Applications: 회사 내 데이터 (ex 고객 관계 데이터, 제품 마케팅 세일즈)Third - Party: Google Analytics와 같은 외부소스에서 수집되는 데이터Web/Log: 사용자의 로그데이터Data Lake: 원시 형태의 다양한 유형의 데이터를 저장Data Warehouse: ..
20240813 TIL1. 타이타닉 생존 분류 문제Kaggle 타이타닉 예측 대회주제: 탑승한 승객의 정보를 바탕으로 생존 유무를 예측하는 분류 문제Y(종속변수): 사망(0), 생존(1)X(독립변수): 티켓등급, 성별, 요금 등 2. 로지스틱회귀 이론 ▶ 오즈비(Odds ratio) : 실패확률 대비, 성공확률그러나 바로 사용 불가능왜? P는 확률 값으로 0,1 사이 값인데 P가 증가할수록 오즈비가 급격하게 증가하기 때문에 --> 선형성을 따르지 않게 됨따라서 로그를 씌워 완화오즈비와 확률의 관계 / 로짓과 확률의 관계로짓의 그래프가 더 선형적인 그림을 나타내어 선형회귀의 기본식을 활용할 수 있게 됨 --> 로지스틱 "회귀" 라고 불리는 이유 ▶ 로지스틱 함수시그모이드 함수 중 하나로 딥러닝에서 다시 활..
원문 : https://yozm.wishket.com/magazine/detail/1931/ 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 | 요즘IT실무에서 원활히 머신러닝으로 데이터를 분석하는 데 얼마나 많은 알고리즘을 알고 있어야 할까요? 선형, 군집, 트리 같은 기본 개념을 알고 XGBoost와 LightGBM 같은 최신 알고리즘을 알면 우선 현yozm.wishket.com➕ 아티클 요약 및 주요 내용요약 :1. 선형회귀-가장 기초적인 머신러닝 모델-여러 가지 데이터를 활용하여 연속형 변수인 목표 변수를 예측해 내는 것 장점모델이 간단하기 때문에 구현과 해석이 쉬움모델링 하는 데 오랜 시간 걸리지 않음단점최신 알고리즘에 비해 예측력 떨어짐독립변수와 예측 변수의 선형 관계를 전제로 하기..
어느 자동차 대여 회사에서 대여 중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블>자동차 대여 기록 정보를 담은 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블>자동차 종류 별 대여 기간 종류 별 할인 정책 정보를 담은 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블 >CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블에서 자동차 종류가 '세단' 또는 'SUV' 인 자동차 중 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능하고 30일간의 대여 금액이 50만원 이상 200만원 미만인 자동차에 ..
★ 총 평-기초 통계학 다 들었음!-ADsP 내일 시험-머신러닝 기초 시작!ADsP때문에 다른 강의들에 집중 못하는 중 ㅠㅠ프로젝트가 끝나 시간 좀 있을 줄 알았더니 이제 데이터분석 입문으로 들어오면 들어야 하는 강의들이 많아졌다 ^^ .....기초통계학, 머신러닝 기초, 심화를 들어야하는데 다행히 ADsP를 공부 중이라 기초 통계학은 어느정도 이해하면서 들었지만 머신러닝은 한 번 듣는걸로는 절대 이해 불가능할 것 같다 ㅠㅠ 생각보다 시간이 꽤 들지도 ....그리고 코드카타에 신경을 못 써주고 있어서 좀 걱정 ......... SQL은 진짜 너무너무 어려워져서 어떻게 해야할지 살짝 막막하다 흑흑이번 프로젝트도 잘 끝낼 수 있을지도 좀 걱정된다 ... 그래도 힘내보잣 !!! ☆ 배운 것머신러닝 기초-선..