임정 튜터님 피드백
- EDA:
-- 이상치제거하지 않은 것도 결과가 있었으면 좋겠다. IQR 이상치는 방법론이지 항상 정답은 아니라는 것을 인지하시면 좋겠다.
-- 상관관계는 선형적 상관관계가 없는것일 뿐 임을 인지하시길.
-- isholldya에서 더많은 주간 매출액임을 집게로 볼수있는데 이릉 t-test를 통해서 검정해볼수도있고 errrobar옵션을 이용해서 데이터 분포에 대한 추가 정보를 제공할 수도 있다.
- 모델 선택, 평가:
-- 산점도 Hexbin 플롯을 보는것도 좋을듯.
-- 회귀 계수를 0으로 만드는 라쏘가 좋은것으로 보아서 변수 선택이 중요한 이슈였던것 같음.
다중공선성 문제를 해결하고 변수선택과 차원축소를 하게되면 릿지나 엘라스틱 넷도 좋은 성능을 보여줄수있음
또한 AIC,BIC방법과 같은 변수선택방법론을 적용해봐도 좋을듯
-- 이탈이라고 하면 생존분석이라는 lifeline패키지를 적용해볼수도 있을 것.
-- 시계열 분석방법은 ARIMA, Prophet, 딥러닝(LSTM)등을 적용해볼수도있음.
-- Xgboost,randomforest에서 예측된 주간매출액이 나타나지 않는 이유는 해당하는 정보가 없을어서 그럴확률이큼
임의로 피쳐엔지니어링 해서 결과를 보아도 좋았을듯.
- 결과해석 및 보고:
-- Prophet과 xgb,rf를 종합한 하나의 통합된 모델로 만드는것도 유의미했을듯
회귀분석을 하는 의의는 Y를 맞추는 것도 있지만 X와 Y의 관게를 회귀계수 beta로 정량하므로 이를 해석을 추가해도좋을듯
정현석 튜터님 피드백
[데이터 EDA 및 전처리]
전처리 및 결측치 제거 같은 경우 이번 프로젝트에서 가장 문제의 컬럼 MarkDown에 대한 데이터 해석 및 결측치 비율을 파악 사용하지 않은 부분은 좋은것 같습니다. object 변수의 변수 전처리 또한 위와 같이 해석을 하고 진행하셨으면 더 좋았을것 같습니다. 원핫인코딩과 라벨링 사이에서 고민을하시고 왜 원핫 인코딩을 사용했는지 이유를 적어주시면 더 좋았을것 같습니다.이상치 판단 같은 경우 IQR 기법으로 우선 파악을 하되 분석가의 인사이트가 들어가서 판단하는 과정이 더 있었으면 좋았을것 같습니다. 상관 관계 차트를 보여주며 분석 및 모델링 작업이 진행되기 전 미리 독립변수와 종속 변수에 상관 관계를 파악하는 부분은 좋았으며 데이터에 시각화로 전반적인 데이터에 이해를 도운 부분은 좋았습니다.
[모델링 및 평가]
많은 모델을 테스트 해보고 선택 이유 학습 및 검증 그리고 평가지표를 비교하면서 모델링을 진행한 부분은 매우 좋았습니다. 각 모델의 특성을 정확하게 이해하시고 계셨고 단계에 따라서 모델의 해당 데이터에 핏함을 확인하고 각 모델의 문제점을 개선할수 있는 모델을 하나씩 찾아가시는 과정이 매우 인상 깊었습니다. RSME, R2 스코어 , MAE의 지표를 마지막에 각 모델별로 정리하신 점 그리고 모델 선택 및 RMSE 값이 높은 이유에 대한 추가적인 설명을 넣으신 부분은 모델 선택에서 좋은 모델을 선택한 이유를 충분하게 설명하는 과정인것 같습니다.머신러닝을 진행할때 지표를 단순하게 평가 수단으로 여기는 것 보다 왜 높게 나오는지 해석하고 찾아보시는 노력이 좋았습니다. 앞으로 이런 과정은 계속 지속하셨으면 좋겠습니다.
[결과 해석 및 보고]
데이터분석의 마무리 과정으로 인사이트를 내는 파트에서 실질적은 액션 플랜을 제안하는 부분이 좋았습니다. 또한 시즌별 연말 연초 등 다양한 케이스에 대한 마케팅 방안을 제시하는 부분도 해당 프로젝트가 단순히 데이터 분석 및 모델링으로 끝나지 않고 추가적인 인사이트를 만들어 내는 과정으로 보일수 있을것 같습니다. 종합으로 재고 효율적 관리 및 매출 증대 기여라는 주제를 어필하시고 해당 주제를 위해 분석 및 모델링을 하시는 과정이 마무리 되는 장표 구성은 매우 좋았습니다.모델링 같은 경우도 각 모델별 예측 효과를 정확하게 정리하여서 해당 모델링 작업에 대한 이유가 만들어져서 해당 발표를 보는 사람들에게 이런 이유로 모델링을 진행했구나라는 이야기 흐름을 완벽하게 이끌고 오신것 같습니다.
[총평]
전처리에서 부터 모델링 그리고 인사이트 까지 하나의 스토리로 넘어가는 과정을 잘 보여주셨습니다. 앞으로 프로젝트에도 해당 플로우를 잘 기억하시고 발전해나가신다면 휼륭한 분석가가 되실것 같습니다. 고생하셨습니다.
'Project' 카테고리의 다른 글
[실전 프로젝트] 아마존 데이터 속으로 떠나는 인사이트 모험2 (0) | 2024.11.11 |
---|---|
[실전 프로젝트] 아마존 데이터 속으로 떠나는 인사이트 모험1 (4) | 2024.09.27 |
[심화 프로젝트] 이커머스 주간 판매량 예측3 (0) | 2024.08.30 |
[심화 프로젝트] 이커머스 주간 판매량 예측2 (1) | 2024.08.28 |
[기초 프로젝트] END! + 피드백 (0) | 2024.07.29 |