20240809 TIL1. 회귀분석 평가지표 회귀 평가지표 - MSE에러 정의방법방법1) 에러 = 실제 데이터 - 예측 데이터 로 정의하기방법2) 에러를 제곱하여 모두 양수로 만들기, 다 합치기방법3) 데이터만큼 나누기에러 정의 방법 수식화방법2)가 Mean Squared Erorr(MSE)y값의 머리에 있는 ^ 표기를 hat이라고 하며, 예측(혹은 추정)한 수치에 표기 ▶ 선형회귀만의 평가 지표 - R SquareR Square는 전체 모형에서 회귀선으로 설명할 수 있는 정도기초 용어$y_{i}$: 특정 데이터의 실제 값$\bar{y}$: 평균 값$\hat{y}$: 예측, 추정한 값 R Square 정의 --> ADsP 시험에도 중요하게 나오기 때문에 알아두면 좋음!2. 선형회귀 심화▶ 다중선형회귀 ..
전체 글
데이터 분석가로 나아가는 중20240808 TIL1. 머신러닝기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고 이를 바탕으로 예측, 분류하는 방법론머신러닝이 발전한 이유 - 인간은 데이터를 기반으로 한 의사결정을 내리고 싶기 때문 ▶ 머신러닝 종류 지도 학습비지도 학습강화 학습2. 선형회귀 이론공통Y는 종속 변수, 결과 변수X는 독립 변수, 원인 변수, 설명 변수통계학에서 사용하는 선형회귀 식베타0 : 편향(Bias)베타1 : 회귀 계수마지막 : 오차(에러), 모델이 설명하지 못하는 Y의 변동성수식 계산 - 각 변수가 사실 행렬로 이루어진 값 머신러닝/딥러닝에서 사용한느 선형회귀 식Y = wX + bw: 가중치b: 편향(Bias)*머신러닝/딥러..
테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블>보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알아보려 합니다. 0시부터 23시까지, 각 시간대별로 입양이 몇 건이나 발생했는지 조회하는 SQL문을 작성해주세요. 이때 결과는 시간대 순으로 정렬해야 합니다.이 문제는 처음에는 쉽게 date_format을 이용해 시간을 구한다음 그룹바이를 해주면 되는 쉬운 문제인지 알았는데결과값을 보니 없는 시간대가 있었고 이걸 새로 만들어줘야했다 그래서 1차로 테이블에 애초에 없는데 어떻게 만들지란 생각이 들었고결국엔 구글링 해보는 수 밖에 없었다.그 결과 밑과 같은 쿼리문 실행!with recursive cte (hour) as( select 0 union all select hour + 1 f..
중고거래 게시판 정보를 담은 USED_GOODS_BOARD 테이블>중고거래 게시판 첨부파일 정보를 담은 USED_GOODS_REPLY 테이블>USED_GOODS_BOARD와 USED_GOODS_REPLY 테이블에서 2022년 10월에 작성된 게시글 제목, 게시글 ID, 댓글 ID, 댓글 작성자 ID, 댓글 내용, 댓글 작성일을 조회하는 SQL문을 작성해주세요. 결과는 댓글 작성일을 기준으로 오름차순 정렬해주시고, 댓글 작성일이 같다면 게시글 제목을 기준으로 오름차순 정렬해주세요.select a.title, a.board_id, b.reply_id, a.writer_id, b.contents, date_format(b.created_date, '%Y-%..
의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블>동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재오프라인 상품 판매 정보를 담은 OFFLINE_SALE 테이블>동일한 날짜, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재ONLINE_SALE 테이블과 OFFLINE_SALE 테이블에서 2022년 3월의 오프라인/온라인 상품 판매 데이터의 판매 날짜, 상품ID, 유저ID, 판매량을 출력하는 SQL문을 작성해주세요. OFFLINE_SALE 테이블의 판매 데이터의 USER_ID 값은 NULL 로 표시해주세요. 결과는 판매일을 기준으로 오름차순 정렬해주시고 판매일이 같다면 상품 ID를 기준으로 오름차순, 상품ID까지 같다면 유저 ID를 기준으로 오름차순..
★ 총 평-기초프로젝트 잘 마무리 함!-기초 통계학 강의 들어갔다-ADsP 시험이 다음주이기 때문에 열심히 공부 중-코드카타들 다시 시작했는데 엄청 어렵다!-공부할 때 시간 배분을 잘 해야 할 것 같다.-오늘 새로운 팀 배정!! 8월 중순에 있을 프로젝트도 아자아자!!!!기초프로젝트가 끝나니 마음이 편안해지는 동시에 ADsP가 있다는 것이 생각나 부랴부랴 공부를 하고 있다 ... 다행히도 ADsP 3과목과 새롭게 강의를 들어야 하는 기초통계학이 겹치는 내용이라 같이 공부할 수 있어서 좋았다.오랜만에 프로젝트가 끝나 코드카타들을 풀었는데 갑자기 너무 어렵게 느껴져서 좀 자신감이 떨어졌다 .. ㅠㅠ원래도 쉽지 않았다는 걸 알았지만 오전 9시부터 10시까지 SQL 한 문제 겨우 풀 정도이다 .. 이렇게 되다보..
문제 설명정수를 저장한 배열, arr 에서 가장 작은 수를 제거한 배열을 리턴하는 함수, solution을 완성해주세요. 단, 리턴하려는 배열이 빈 배열인 경우엔 배열에 -1을 채워 리턴하세요. 예를들어 arr이 [4,3,2,1]인 경우는 [4,3,2]를 리턴 하고, [10]면 [-1]을 리턴 합니다. 제한 조건arr은 길이 1 이상인 배열입니다.인덱스 i, j에 대해 i ≠ j이면 arr[i] ≠ arr[j] 입니다.입출력 예arrreturn[4,3,2,1][4,3,2][10][-1]def solution(arr): answer = [] if len(arr) 1. 리스트의 길이가 1인지 아니면 비어있는지 확인-arr의 길이가 하나거나 하나보다 작으면 -1을 return-->answer = ..
20240802 TIL MEMBER_PROFILE 테이블> REST_REVIEW 테이블> MEMBER_PROFILE와 REST_REVIEW 테이블에서 리뷰를 가장 많이 작성한 회원의 리뷰들을 조회하는 SQL문을 작성해주세요. 회원 이름, 리뷰 텍스트, 리뷰 작성일이 출력되도록 작성해주시고, 결과는 리뷰 작성일을 기준으로 오름차순, 리뷰 작성일이 같다면 리뷰 텍스트를 기준으로 오름차순 정렬해주세요. with max_ as ( select count(*), member_id from rest_review group by member_id order by count(*) desc limit 1)select m.member_name, r.review_text, ..