20240724 TIL
오늘부터 첫 기초 프로젝트를 시작했다. 어떤 프로젝트일지, 어떻게 진행할지 궁금했는데 오늘 발제를 하면서 궁금증 풀렸다
아직 데이터를 만들어본 것도 분석 해보지도 않았지만 사실 걱정이 더 앞서긴 한다 왜냐하면 내가 비전공자이기도 하고 이때까지 배운 것들을 제대로 이해 못했다는 생각에 .. ㅠㅠ 혹시나 팀원분들께 폐 끼칠까봐 제일 걱정이다 그래도 일단 최선을 다해 보기로 했다 !!
그리고 내가 기초 프로젝트를 어떻게 진행하는지 오늘부터 꾸준히 블로그에 남길 예정이다 ! 그럼 화이팅팅팅
1. 주제 정하기
일단 주제들은 여러가지를 준비해주셨기 때문에 우리 팀은 고민하다가
https://teamsparta.notion.site/409b1f8d6e0f4a6a9b85f726b131ccb5
음악 플랫폼 유저 행동 데이터 분석이라는 주제를 골랐다.
그 이유는 음악이라는 것이 친숙한 도메인이고, 직관적으로 재미있어 보여서 흥미를 가지고 작업에 임할 수 있을 것 같다고 고르게 됐다.
이 노션에 들어가면 알겠지만, 주제와 배경 등은 이미 설정돼 있어서 여기서 우리가 더 생각하여 데이터 분석을 하면 된다.
2. 주제를 가지고 어떤 프로젝트를 진행 할 것인지, 데이터 정리
<배경>
- 고객의 행동데이터를 탐색하여, 타 부서에게 서비스 현황을 볼 수 있게 해주세요.
- 우리의 서비스가 앞으로 어떠한 방향으로 나아갈 지 확인할 수 있었으면 좋겠어요.
일단 '스포티파이' 라는 플랫폼으로 데이터 분석을 할 것이다.
스포티파이는
- 음악 스트리밍 서비스로, 사용자들에게 음악, 팟캐스트 및 오디오북을 제공합니다. 이 서비스는 스마트폰, 태블릿, 컴퓨터, 스마트 스피커 등 다양한 기기에서 이용 가능하다
- 사용자의 취향에 맞는 음악 추천 기능을 제공하며, 사용자가 자신의 플레이리스트를 만들고 다른 사람들과 공유할 수도 있습니다. 또한 프리미엄 서비스를 이용하는 사용자들은 광고 없이 음악을 듣고 오프라인에서도 음악을 재생할 수 있다.
데이터 분석은 이 데이터를 이용하여 사용 할 예정이다.
스포티파이라는 플랫폼과 스포티파이 관련 데이터를 이용하여 우리가 만들 예정인 프로젝트는
프로젝트 명: SIMF(spotify is my life) 프로젝트
주제:
① 팟캐스트와 음악의 강점을 살린 점유율 유지 방안
② 1020 트렌드 파악 및 1020 신규 고객 유입 방안
이제 이 주제를 가지고 어떤 식으로 데이터를 분석할껀지 데이터 리터러시를 해 볼 것이다.
1. 예상 결과물
<주제1에 관한 예상 결과물>
- 연령대 별 음악과 팟캐스트에 대한 장르 선호도 파악할 수 있다
- 연령대 별 새로운 음악을 어떻게 발견하는지와 팟캐스트에 대해 만족하고 있는지 파악할 수 있다.
- --> 선호도와 음악발견방법, 만족도에 따라 맞춤형 추천 시스템을 강화시키고 더 많은 컨텐츠와 음악을 발견할 수 있게 한다.
- --> 인기 있는 팟캐스트와 음악 장르를 확대하고, 더 다양한 콘텐츠를 확보하여 점유율을 유지 할 수 있다.
<주제2에 관한 예상 결과물>
- 1020 세대의 음악과 팟캐스트에 대한 장르 선호도를 파악할 수 있고 청취시간대와 청취 빈도를 통해 트렌드 파악 가능
- --> 1020 세대는 소셜 미디어를 많이 사용하기 때문에 소셜 미디어를 통한 홍보 효과가지기(ex) 이벤트 or 틱톡 같은 플랫폼과 콜라보 Or 인플루언서)
- --> 소셜 미디어를 많이 사용하는 1020세대들을 위해 커뮤니티 기능 강화하기(스포티파이는 지난해 3월에 숏폼 영상 업로드 서비스 클립스 론칭)
- --> 청취시간대를 파악해 특정 시간대에 맞춤형 추천 시스템 강화하기
데이터소스
- fav_music_genre(선호하는 음악 장르) -- 주제1, 주제2
- fav_pod_genre(선호하는 팟캐스트 장르) --주제1, 주제2
- music_time_slot(가장 좋아하는 음악 감상 시간대) -- 주제2
- pod_lis_frequency(팟캐스트 청취 빈도) -- 주제2
- music_recc_rating(음악 추천 평가) -- 주제 1의 유지방안에 대한 데이터 소스
- Age(사용자의 연령층) -- 주제1, 주제2
- pod_variety_satisfaction(팟캐스트의 다양성과 가용성에 만족하는지) -- 주제1
- music_expl_method(새로운 음악을 어떻게 발견하는지) -- 주제1
-해외 1020 세대의 소셜 미디어 이용률 추이 데이터가 있으면 좋을 것 같다.
분석방법
- pandas와 Matplotlib을 이용해 분석할 것
데이터처리
1. 데이터 정제 - 결측치 확인 및 처리 --> 중복 데이터가 있다면 처리 --> 이상치가 있다면 필요에 따라 제거하거나 수정
2. 데이터 전처리 - 주제를 통해 결정된 예상 결과물과 데이터 소스를 보고 거기에 맞는 전처리를 진행
3. 데이터 시각화 - 전처리를 했다면 다른 사람들이 보기 편하고 분석 결과를 효과적으로 전달할 수 있기 때문에 시각화로 마무리
시각화 계획
연령대별 음악 장르 선호도
연령대별 팟캐스트 장르 선호도
연령대별 음악 청취 시간대
연령대별 팟캐스트 청취 빈도
연령대별 새로운 음악 발견 방법
연령대별 팟캐스트 만족도
부족하지만 여기까지 이 데이터와 주제를 가지고 어떻게 분석하면 좋을지 생각해봤다
그런 다음 팀원들과 내용을 합치했다. 결과적으로 노션에 담은 내용이 나왔다
https://www.notion.so/teamsparta/c0bba0be1dab4ccd8378e9af4def56f6
주제1번까지하면 너무 많을 것 같아 주제2번만 하기로 했다.
처음 이런 분석을 해봐서 좀 미숙했지만 팀원분들이 다들 너무 잘해주셔서 그래도 큰 어려움 없이 해결했다.
이제 각자 칼럼을 맡아서 데이터 분석을 할 예정이다 우여곡절이 좀 있어 원래 정했던 내용 말고 지금 현재 주제로 하는거라 사실 시간이 좀 빠듯하다 그래도 주어진 시간 동안 열심히 해봐야겠다 !!!
데이터 분석에 관한 내용은 그 다음 블로그에 담아보겠다
'Project' 카테고리의 다른 글
[심화 프로젝트] 이커머스 주간 판매량 예측3 (0) | 2024.08.30 |
---|---|
[심화 프로젝트] 이커머스 주간 판매량 예측2 (1) | 2024.08.28 |
[기초 프로젝트] END! + 피드백 (0) | 2024.07.29 |
[기초 프로젝트] DAY 3 (0) | 2024.07.26 |
[기초 프로젝트] DAY 2 (0) | 2024.07.25 |