Small Steps Every Day

매일 천천히 조금씩 앞으로 나아가다.

새싹(SeSAC) | 전Z전능 데이터분석가/#5 SQL 실무 프로젝트

[성동3기 전Z전능 데이터 분석가] DAY 42 _ SQL프로젝트 _ 팀빌딩 / 주제선정 / 문제정의 / 데이터 탐색

mindata1 2025. 2. 24. 21:52
사용 데이터셋

 

이미 데이터 분석 프로젝트로 많이 사용된 브라질의 Olist 데이터셋을 선정했다. 많이 사용되었다는 것은 그 만큼 유용한 데이터가 포함되어있다는 것으로 해석을 했다. 그리고, 이커머스 시장은 복잡 다변하기 때문에 명확한 목적을 갖고 주제를 깊게 파고들면 누구나 할 법한 지루한 프로젝트 내용을 피할 수 있을 것이라 생각했다. 따라서 주제 선정에 상당히 시간을 많이 할애했다.

 

 

주제 선정

 

주제 선정을 하기 전, 도메인에 대한 지식을 쌓기 위해 여러가지 서치를 해보았다.

  1. 브라질의 이커머스 시장 특성
  2. Olist 회사 개요 및 비즈니스 구조
  3. 하이브리드 이커머스 특징
  4. 위 내용을 기반으로 도출할 만한 인사이트

팀원분들이 각자 서치한 내용을 통합하여 서로 공유하고, 이해도를 함께 높이는 시간을 가졌다.

 

페르소나를 설정하자 !

 

 

이번 프로젝트 목적은 "실무적인 관점으로 비즈니스 인사이트를 도출해보자" 였다. 따라서, 보다 더 주체적으로 접근하기 위해 페르소나를 만들어 보기로 했다. 그리하여, 우리는 "Olist 전략기획실 DA팀" 으로서  "매출 증대 전략 도출을 위한 프로젝트를 진행" 하기로 했다.

 

 

문제정의

 

페르소나를 정한 후, 전략기획 직무에서 하는 일에 대해 찾아보며 매출증대를 위한 아이디어를 발산하였다. 하지만, 데이터셋을 구체적으로 들여다 보지 않은 상태라 발산된 아이디어들이 구현화 될 수 있을 지는 미지수였다. 따라서, 문제정의에 대한 큰 틀만 만들어 놓은 후 데이터를 들여다보며 구체화해 나아가기로 합의했다.

 

 

데이터 탐색 _ 엔티티 관계도

 

데이터 간 관계를 탐색해보기 위해 DBeaver 를 통해 엔티티 관계도를 연결시켜 보았다. 기본키를 잘 찾아내는 것이 관건이었다. 기존 데이터셋의 관계도를 참고하여, 데이터 간 어떻게 연결이 되어 있는지 파악해보려 했다.

 

 

Reflection

 

이제 본격적으로 데이터 전처리를 한 뒤, 분석을 해볼 것이다. 내일의 나 정말 화이팅...🤞