책 구매 사이트: https://product.kyobobook.co.kr/detail/S000001019698
이 책은 정말 데이터 분석가가 되고 싶은 사람이거나 이미 데이터 분석가인 사람들에게 추천하고 싶은 책이다.
그만큼 내용도 알차고 누구나 한번 쯤은 생각해봤을 고민에 대한 해결방안을 알려주고 있기 때문에 현재 또는 미래에 데이터 분석가이거나 될꺼라면 한 번쯤은 입문서로 읽어보는 것을 추천한다!
나는 책의 1장부터 2장까지의 내용에 대한 아티클을 작성했다
➕ 아티클 요약 및 주요 내용
요약 :
1. 앞으로 필요한 건 데이터 문해력 : 분석보단 활용
중요한 것은 앞으로 자신에게 필요한 기술이 무엇인지 아는 것!
- 기계에 맡길 수 있는 일, 맡기는 편이 더 나은 일과 기계가 할 수 없는 것, 사람이 해야 하는 것을 구별하고 후자를 갈고닦아 자신에게 필요한 형태로 효과적으로 활용해서 최대한의 결과물을 창출하는 것을 목표로 삼는 것
가치 있는 결과를 도출하려면?
- 우리가 직접 익혀야 하는 고도로 가치 있는 기술이 필요하다
직접 익혀야 하는 고도로 가치 있는 기술 --> 데이터 활용에 필요한 3가지 상자
(1) 분석 전에 문제 및 목적을 정의하고 가설을 구축
(2) 분석을 위한 기술과 지식
(3) 분석 결과에 대한 해석 및 스토리 구축
(1)과 (3)을 합친 것이 데이터 문해력이라고 한다
데이터 문해력의 또 다른 말 = 목적 사고력:
데이터 작업 전에 무슨 말을 하고 싶은지를 생각해보고 이에 필요한 데이터를 활용해 작업을 진행하는 접근방식
'데이터 활용을 못 하는' 사람들의 공통적인 과제, 문제점
- 앞서 말한 상자(2) 작업을 선행한다.
- 데이터를 적절하게 분석하면 문제와 목적, 결론이 나올 것으로 생각한다(이것은 본래 분석자 스스로가 생각해야 하는 것)
- 눈앞의 데이터를 적절히 가공하면 뭔가 유용한 정보를 얻을 수 있을 것으로 생각한다. 아무것도 안 나오게 되면, 분석 방법에 문제가 있다고 생각한다
--> 데이터 안에는 해답 따위가 존재 X
대신, '당신이 무엇을 알고 싶은지, 이를 알게 되면 무엇을 하고 싶은지,
이를 이해서 어떤 데이터가 필요한지 구체적으로 생각하는 것이 무엇보다도 중요하다
목적과 문제 -> | 목적과 문제에 따라 데이터 수집 및 방법론 구축 -> | 목적과 문제에 대한 결론 |
2. 올바른 데이터로 올바른 문제를 풀고 있는가?
주요 원인 1: 풀고자 하는 문제가 명확하지 않다
자신의 결론으로 이끌어 내는 이야기를 만드는 능력이 앞으로 더욱 중요해진다!
그렇기에, 가장 먼저 해야 하는 작업은 목적과 문제에 대한 정의'하는 것이다.
- 무엇이 문제이며 구체적으로는 어디 사는 누가 어떤 식으로 곤란에 처해 문제가 발생한 것인지, 이런 점을 명확하게 해야 한다
- 생각 없이 우연히 눈에 띈 데이터를 모아 그래프로 그려봤자 그 안에는 어떠한 논리성도 객관성도 없다
- 문제, 원인, 해결방안을 잘 구분해야 한다
ex) 1. 인재 부족으로 효율적이고 효과적인 영업 활동을 못하고 있다.
2. 작업 효율화를 높여 구조 조정을 하고 싶다.
첫 번째 정의
문제점 1. 효율적이고 효과적인 영업 활동을 못 하고 있다를 문제로 설정 + 문제 정의 안에 인재 부족이라는 원인이 뒤섞여 있다.
문제점 2. 그 원인이란 것이 가정이나 가설에 지나지 않다.
문제점 3. 효율적이고 효과적인 영업 활동을 못하고 있는 것이 가장 문제인가?
-수주 수 급감이 문제 -> 효과적인 영업 활동을 못하고 있는 것이 원인 중 하나로 간주 가능
-어떠한 원인을 풀기 위한 해결 방안을 설명하고 있다고 할 수도 있다
즉,
진짜 문제: 수주 수가 급감했다.
진짜 원인: 고객 상담 및 대응 부실
원인에 대한 해결방안: 효과적이고 효율적인 영업활동이라는 구조 성립
두 번째 정의
문제점 1. 작업 효율화란 구조 조정이라는 목적을 위한 해결방안
-> 방안을 제시하는 것 자체가 문제 X 목적과 문제를 정의하는 시점에서 이미 결론을 내버리는 것이 위험하다
문제점 2. 문제를 해결하기 위한 접근 방식을 취하고 있다면?
-> 구조 조정이 예정대로 진행되지 않는다를 문제로 설정
-> 원인에 대해 생각해 본 다음, 원인 중 하나에 대한 해결 방안으로서 작업 효율화를 제시하는 것이 자연스럽다
문제를 정의하는 시점에서 구체적인 원인을 규명하고 방안을 수립하는 것은 불가능
주요 원인 2: 정의한 문제와 사용하는 데이터가 일치하지 않는다
지표 결정이 중요하다 --> 어떤 지표를 사용할지 검토를 더 많이 할수록, 가장 적합하고 수집하기 쉬운 지표를 선택할 수 있게 된다.
<결론을 도출하는 프로세스>
(1) 평가 지표 및 기준을 결정 - 어떤 요소와 지표가 더욱 목적에 부합하는가?
(2) 적합한 데이터 및 그래프를 선택 - 어떤 데이터 형태와 그래프가 효과적인가?
(3) 결론 - 결국 무슨 말을 할 수 있는가?
ex1)
결론: 고객 불편사항에 대한 개선이 이루어지지 않고 있다
지표: 클레임 수
-클레임 수를 지표로 정한 것 자체가, 개선되지 않은 문제의 원인을 클레임 수에 의한 것이라고 단정했을 가능성이 크다
-> 개선되지 않은 것이 문제인지, 클레임이 많은 것이 문제인지 명확히 하는 것이 중요!
-> 개선이 잘되지 않고 있다는 문제를 직접적으로 드러내는 지표는 클레임 수 대비 개선 수 등이 적절
-> 원인을 따져볼 때는 클레임 수와 고객 응대 인원, 효율 등과 관련된 지표를 살펴보는 것이 좋다
Ex2)
결론: 담당자 의존 업무 증가
지표: 임직원 퇴직 및 이직 데이터
- 담당자 의존 업무 자체가 특정 담당자만이 업무 내용을 이해/파악하고 있어 다른 사람에게 인수인계가 쉽지 않은 업무
-> 담당자 의존 상태를 직접적으로 나타내기 어렵기 때문에 다른 방식 생각해봐야 한다
- 결론과 지표가 거리가 있어 보이기 때문에 보다 문제와 관련 있는 데이터를 고려해야 할 필요가 있다
Ex3)
결론: 공립 유치원 대기 아동 수를 0으로 만들고자 한다
지표: 아동 수 추이
-대기 아동 수를 0으로 한다는 것이 목적이라면 상황을 파악하는 직접적인 지표가 아동 수 추이는 아닐 것이다
-아동 수의 증감이나 많고 적음을 파악하는 것이 대기 아동 수 0 달성은 쉽다/어렵다는 결론을 내린다면
숫자를 효과적으로 사용한 주장이 아닐뿐더러 논리도 성립하지 않는다
-> 효과적일 수 있는 지표 : 지역 내 모든 시설 중, 대기 아동 수가 0인 시설 수 및 그 비율
- 데이터에는 정답은 존재하지 않지만, 어떻게 고치면 목적과 문제의 정의가 보다 개선되고 적절한 데이터 선택이 가능할지, 우리 스스로가 구체적으로 생각해봐야 한다.
- 실제로 스스로 진행할 때, 목적이나 문제로서 내가 말하고자 하는 바는 무엇인가? 가 명확하다는 것을 전제로 다음과 같이 자문자답을 해보는 것이 좋다
주요 포인트 :
- 데이터 문해력과 목적 사고력은 데이터를 효과적으로 활용하기 위해 필수적인 능력이다
- 문제와 목적을 명확히 정의하고, 적절한 데이터를 선택하고 분석하여 유용한 결론을 도출하는 것이중요하다
- 데이터 분석의 성공을 위해서는 문제 정의와 목적 설정이 가장 기본적이고 중요한 단계임을 명심해야 한다
➕ 핵심 개념 및 용어 정리
핵심 개념 :
데이터 문해력 : 데이터를 단순히 분석하는 것을 넘어서 문제를 정의하고, 가설을 설정하며, 분석 결과를 해석하고 스토리를 구축하는 능력
용어 정리:
- 데이터 문해력(Data Literacy) : 데이터를 이해하고, 해석하고, 분석하며, 효과적으로 활용할 수 있는 능력
- 목적 사고력(Purposeful Thinking) : 데이터를 사용하기 전에 명확한 목표와 질문을 설정하는 사고방식
- 지표(Indicator) : 특정 현상이나 변화를 측정하고 평가하는 데 사용되는 데이터 포인트
➕느낀 점
나는 아직 데이터 분석가가 되진 않았지만 벌써 여기에 나오는 문제점들을 행하고 있거나 고민하고 있었다. 그래서 글을 읽으면서 좀 자아성찰(?) 하는 기분이었고 고민됐던 문제들이 좀 풀리는 시간이었다.
하지만 머리로는 이해가 되지만 막상 예시들을 보고 해보려고 하면 잘 되지 않았다. 아무래도 데이터 활용을 잘 하기 위해선 꾸준한 노력이 답일 것 같다 ...
이 책의 앞부분에 보면 중요한 것은 앞으로 자신에게 필요한 기술이 무엇인지 아는 것이라고 했는데 나는 기계가 할 수 없는 것을 잘하는 사람이 되고 싶다고 생각했다.
지금 이 책을 조금 읽어본 나로써는 이 정도까지 생각할 수 있을 것 같고 더 나아가는 것은 부트캠프가 끝나가있을때, 혹은 지금보다 실력이 더 늘었을때 생각해보면 좋을 것 같다.
아티클 초입에 얘기했던 것처럼 데이터 분석가가 되고 싶거나 이미 데이터 분석가이신 분들이 읽으면 정말 도움이 많이 되는 책 같다. 부트캠프를 통해서 이런 책을 선물받아 미리 읽어볼 수 있어서 감사하다 !
'아티클스터디' 카테고리의 다른 글
아티클 스터디: 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 (0) | 2024.08.12 |
---|---|
아티클 스터디 : 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 3장 (0) | 2024.07.24 |
아티클 스터디 : 그 데이터는 잘못 해석되었습니다 (0) | 2024.07.17 |
아티클 스터디 : 데이터 분석가가 되어보니 중요한 것들 (0) | 2024.07.15 |
아티클 스터디 : SQL 질문 잘 하는법 (0) | 2024.07.10 |