Data Analyst

데이터 분석의 시작, 문제정의(1)

프랑스어전공 2023. 12. 20. 02:03

 

세상을 구할 시간이 1시간이라면 문제를 정의하는데 55, 해결책을 찾는데 5분을 사용할 것이다"

- 아인슈타인

여기서 ‘문제’란 사전에 따르면 다루거나 이해하기 어려운 대상 또는 일을 뜻합니다. 즉 문제를 정의한다는 것은 문제를 명확히 발견하고, 문제를 해결하기 위함입니다. 그러면 왜 우리는 문제를 정의하는데에 해결책을 찾는 것보다 더 많은 노력을 기울려야 할까요?

문제 정의가 꼭 필요할까?

우선 문제정의가 꼭 필요할지 생각해 봅시다. 이 물음에 앞서 기업에서 데이터 분석을 하는 목적을 생각해봐야 할 것입니다. 데이터 분석은 데이터를 기반으로 비즈니스 의사결정에 유용한 인사이트를 도출하는 작업입니다. 여기엔 ‘문제 해결’이라는 목적도 포함되어 있습니다. 예를 들면 ‘왜 고객들이 우리 어플리케이션의 신기능을 사용하지 않는지’, ‘투자를 많이 했지만 왜 유입률은 떠 떨어졌는지’ 등 여러 문제가 있을 것입니다. 꼭 기업의 문제 뿐만 아니라 데이터 분석 프로젝트를 하면서 일상의 문제를 해결하려는 노력도 많이 합니다. 예를 들어 ‘인구 밀집지역 시각화를 통한 추가 쓰레기통 설치 위치선정’ 같은 프로젝트에선 길거리에 쓰레기가 늘어나고 있으나 지자체에선 무한정 쓰레기통을 배치할 수 없는 실정이니 효율적인 위치선정이라는 문제해결책을 내놓기 위한 목적을 가지고 있습니다.

 

 

문제를 정의 하지 않고 프로젝트를 시작하게 되면 방향성은 옅어지게 됩니다. 초반 회의에서 여러 아이디어가 나오고 대부분 괜찮은 아이디어니 일단 시도해 보는 쪽으로 갈 수 있습니다. 하지만 이렇게 될 경우 서로 생각한 문제가 달랐고 풀려고 하는 문제를 문장으로 정의하지 못하여 혼란을 겪게 됩니다.

 

 

최근 뉴욕 택시데이터(TLC Hvhfs)를 통해 대시보드를 기획,제작하는 프로젝트를 했었는데, 저희는 데이터를 가지고 다양한 아이디어를 냈습니다. 다 너무 괜찮은 아이디어 여서 처음엔 ‘팁’에 관해서 팁과 관련된 데이터 시각화를 해보기도 하였으나 분석을 해보니 데이터 누락이 많아 이상치를 보였던 ‘공항’과 관련한 운행에 대해 분석하기도 하였습니다. 다들 Tableau를 입문하는 터라 할 수 있는건 다 해보자고 했었습니다. 그 결과, 다들 생각한 문제가 달랐고 각자 기획해온 대시보드를 조합하니 ‘그래서 우린 주제가 뭐야..?’, ‘KPI는 뭐가 좋을까..?’ 등 분석의 방향성을 잃어 갈피를 못잡은 경험이 있습니다. 프로젝트 시작 전, 문제를 명확하게 정의하는게 중요하다는 것을 배울 수 있던 좋은 경험이었습니다.

 

 

문제는 굉장히 많이 존재하고, 대부분의 문제는 서로 관련되어 있을 가능성이 높습니다. 또한 우리는 시간이 무한정이지 않습니다. 그렇게 때문에 투자 대비 효율(Return On Investment)이 좋은 문제를 선별해야만 합니다.

 

문제 발견하기

 

문제를 정의하기 위해선 문제를 발견해야합니다. 문제란 바라는 것과 인식하는 것의 차이입니다. 현재 상황과 바라는 상황의 괴리에서 생기는 것이죠. 우리는 괴리에서 생기는 어려움을 겪게 될 것입니다. 따라서 문제를 제대로 파악하기 위해선 현재 우리가 어떤 상황에 있는지 바라는 상황은 어떤 것인지 알아야 합니다.

 

 

취준생이라면 가고싶은 회사가 분명 있을 것입니다. 하지만 대부분이 그렇듯이 바람과 달리 역량이 많이 부족하여 걱정 할 수 있습니다. 따라서 현재상황과 바라는 상황을 이렇게 생각해 볼 수 있습니다.

예시에 따르면 ‘바라는 상황’의 경우에 입사하고 싶은 회사가 높은 SQL 활용역량을 요구하거나 SQL코딩 테스트가 있을 수 있습니다. 또한 입사하기 위해선 경쟁력 있는 프로젝트 성과가 있어야 할 것입니다. 따라서 현재 상황과 바라는 상황의 Gap이 있기 때문에 문제가 발생하고 우리는 여기에서 문제를 발견하고 정의할 수 있게 됩니다. 또한 해결책 까지 나아갈 수 있습니다. 

  • SQL 역량 부족 -> SQL을 잘 다루려면 어떤 공부를 해야할까?
  • 프로젝트 경쟁력 부족 -> 경쟁력을 위해서 어떤 데이터 분석 프로젝트를 해야할까?

 

문제 정의에 대해 끊임없이 재질문 하기

 

문제 자체에 대해 끊임없이 탐구하고 재정의하는 과정이 필요합니다. 아래 다섯 가지의 질문에 대해 끊임없이 재질문 해야합니다.

 

  • 문제 정의가 다양하게 해석될 수 있는가?
  • 이해 관계자는 누가 있는가?
  • 어떤 사람이 겪고 있는 문제인가?
  • 문제를 겪고 있는 맥락은 무엇인가?
  • 정말로 해결해야 하는 문제인가?

 

 

출처 ‘PM을 위한 데이터 리터러시 - 카일스쿨’

 

문제를 정의할때 정의는 명확해야합니다. 다양하게 해석될 여지가 있으면 모호한 문제입니다. 또한 누가 이 문제와 관련이 있는지 고려해야합니다. 고객이 이 문제를 겪고 있는지 사내에서 문제를 겪고 있는 지, 왜 이러한 문제가 있는지 파악을 해야합니다. 또한 정말로 이 문제를 해결해야 하는 건지 고려해야합니다. 우리는 모든 문제를 다 해결할 순 없기에 ROI가 좋은 문제를 선별해야 합니다.

 

 

또한 남의 욕구를 나의 욕구로 만드는 것또한 굉장히 중요합니다. 초기 트위터에는 @나 #기능이 없었다고 합니다. 고객의 아이디어 였습니다. 따라서, 중요한 것은 고객과 계속 소통을 해야한다는 것입니다. 어떤 욕구가 있는지, 어려움이 있는지 계속 탐구하고 파악해야합니다. 종종 우연히 문제를 발견하기도 합니다. 길을 걸으며 노래를 듣다가 우리 회사의 서비스에서 문제를 발견할 수도 있습니다.

 

 

다음 포스팅에선 문제 정의를 하기 위한 방법론들을 살펴보겠습니다.