드디어 4주차가 끝났다.
이번주는 삼일절도 있었고, 워크샵도 이틀 정도 껴져 있어서 생각보다 빠르게 간 느낌?
그러나 생각보다 태블로가 어려웠고, 배워야 할 내용이 길었다. ㅠ
태블로는 노코드 툴이라 언어를 하나도 모르는 사람도 드래그 앤 드롭으로 짱 멋진 대시보드를 만들 수 있다.
진심 파이썬으로 했던 하나하나 색입히기, 머 이중 축 차트 만들기 등등 그냥 모든게 된다.
그리고 데이터 베이스들끼리 조인도 가능하며, 컬럼 이름 수정이나.. 간단한 전처리도 가능하다.
그리고 K-means 알고리즘 이용한 클러스터링이나 회귀선 그리기도 가능하며 이 부분도 바로 시각화 할 수 있다.
사실 태블로를 배우면서 너무 놀람의 연속이라 ㅋㅋㅋ
아니 이것도 된다고? 아니 이것도 된다고 ? 하는 것들이 쌓이고 쌓여서 의문이긴 했다.
태블로가 너무너무 강력한 툴이라 굳이 다른 파이썬, r 같은 스킬을 습득해야 할까?
그러나 잘 생각해보면 아무리 태블로가 클러스터링, 리그레이션 등이 가능하다고 해도 데이터 분석가로서 더 고도화된 알고리즘을 태블로로 적용하기는 어려울 것 같다.
아무튼 이번주는 데이터 드리븐 디자인 씽킹 주제로 워크샵 이틀 + 휴일 하루 + 태블로 이틀 이렇게 구성되어 있었던 커리큘럼이었다.
태블로 강의는 유데미에서 진행하는 강의를 들었는데 영어 강의라 한글자막이 약간 안맞는거 빼면 아주 훌륭한 강의였고, 만족도가 높았다.
태블로로 클러스터링하기
태블로 클러스터링 기능이 너무 신기해서 이 기능을 중점으로 포스팅 해보려고 한다.
우선 주어진 과제애 대한 설명을 하자면 세탁 관련 스타트업이 신지점 10개를 냈는데 어느 지점에 더 투자를 해야할지? 고민하는 문제로 기억한다.
-
여기서 태블로의 하이라이트 기능이 나옴!
하이라이트 기능은 필터처럼 아예 그것만 보여주는게 아니라 전체 데이터를 보여주면서 강조하고 싶은 데이터만 강조할 수 있는 기능이다.
지금 이 스타트업이 낸 지점이 아래와 같이 표시되는데, 여기서 새로 낸 10개 지점만 하이라이트 하고 싶다면?
1. new, old라고 구분짓는 컬럼 New expansion 컬럼을 세부정보로 드래그!
2. 우클릭 후 하이라이터 표시 클릭
3. 표시된 하이라이터 기능으로 자유롭게 new, old를 강조할 수 있다.
-
자 이제 여기서 새로 낸 10개 지점 중 어느 지점에 더 투자를 하면 좋을까?
우선 지금까지 낸 지점들의 데이터를 Revenue, marketing spend 기준으로 뿌려보았다.
그러고 나서 분석 탭에 클러스터를 가져와 차트에 놓아주면, 이렇게 자동으로 클러스터링이 된다.
지금은 저 클러스터 창의 변수가 marketing spend, revenue 두 가지를 기준으로 그룹을 나눈 것이다.
그런데 세탁 사업이라는 것은 인구에 비례하여 성장한다.
인구가 많으면 많을 수록 세탁물도 많고 서비스를 이용할 가능성이 높아지는 것이다.
그렇기 때문에 변수에 인구를 추가해보자.
변수에 인구수를 추가했더니 클러스터가 세 개로 나뉘었다.
각 클러스터에 추세선을 추가해보았다.
각 클러스터에 그려진 추세선들의 기울기를 확인해보니
빨강색 클러스터의 기울기는 3.17, 파란색 클러스터의 기울기는 7.32, 노란색 클러스터의 기울기는 0.94이다.
이제 새로운 지점 10개에서 3개의 지점만 골라서 투자를 해야 한다면 어느 지점을 선택할까?
추세선을 그리기 전까지는 뭔가 빨간색 클러스터에 들어있는 지점 중 3개를 선택했을 거이다.
마케팅 스펜드를 쓰면 쓸 수록 그에 따른 투자를 얻어오는 것처럼 보이니까 말이다
그러나 추세선의 기울기는 마케팅 비용 1달러당 얻어들이는 Revenue를 말한다.
빨강색 클러스터는 마케팅 비용 1달러를 투자했을 경우 3.17 달러의 투자수익을, 파란색 클러스터는 1달러 투자 시 7.32의 투자수익을 벌 수 있다, 노란색 클러스터는 기울기가 0.94로 1달러 투자시 0.94달러를 벌어온다는 의미이므로 적자이다.
이제 앞으로 투자할 3가지 지점을 고른다면 1달러 비용을 썼을 때, 가장 투자수익이 높은 파란색 클러스터에서 먼저 3가지 지점을 고를것이다. 이렇게 간단하게 중요한 의사결정을 내릴 수 있었다. 이 모든게 파이썬이나 R을 추가로 켤 필요 없이, 오직 태블로만으로 얻어낸 결과이다.
태블로는 정말 강력하다.
시각화 툴 중 왜 1위인지 너무나 잘 알 수 있는 시간이었다.
단 이틀이었지만 습득도 굉장히 빨랐고, 물론 하루에 거의 7시간을 투자하는 결과기는 했지만 ㅎ
아 그렇다고 노코드 툴이라고 만만하게 보면 안된다. 고급과정은 생각보다 머리를 많이 써야 하고 고도의 집중력을 요한다.
데이터 드리븐 디자인 씽킹 워크샵
이번에는 저번주 금요일부터 이번주 화요일까지 총 3일간 진행했던 워크샵에 대한 내용을 써보려고 한다.
계속 강의만 듣다가 굉장히 오랜만에 팀별로 프로젝트도 진행해보고 발표도 많이 해보는 시간을 가졌다.
강사님 주도하에 진행되었는데 계속 머리에 무언가를 집어넣는 연습만 하다가, 머리에서 무언가를 꺼내는 활동을 하자니 초반에는 익숙하지가 않았다. 그러나, 생각해보지 못했던 주제에 대해 이야기도 해보고, 어떤 능력을 더 기르면 좋을지 생각해볼 수 있는 좋은 계기가 된 것 같다.
데이터 드리븐 디자인 씽킹은 아래와 같은 순서로 이루어졌는데, 팀별로 한 주제를 정해서 프로토 타입을 만들어보는 내용까지 해보았다.
물론 엄청 짧은시간에 짜낸 주제를 가지고 만든 프로토 타입이라 엄청 퀄리티가 높지는 않았지만, 참신한 주제들이 굉장히 많이 나왔고 나또한 참신한 주제들을 생각해볼 수 있었다.
공감 - 문제정의 - 아이디어 발산 - 프로토타입 - 피드백 & 개선
이 과정에서 또 한번 느낀 거는 아이디어 발산이 익숙하지 않고, 되게 힘들었다는 것이다.
평소에 얼마나 닫힌 생각을 가지고 살았는지 알 수 있는 시간이었다 ㅋㅋㅋ
그리고 또 저렇게 창의적인 생각들을 가지고 있는 사람들은 나와 무엇이 다를까? 어떻게 하면 저렇게 될 수 있을까? 하는 생각도 들었다.
음 .. 평소에 시사나 여러 가지 주제에 대한 (꼭 민감한 주제가 아니어도) 나의 관점을 생각해보는 시간이, 나에게는 부족했던 것 같고, 세상에 대한 관심이랄까 ㅎㅎ 그런 부분이 조금 부족했던 것 같다.
그래서 뉴스와 책과 좀 많이 친해져야겠다는 생각이 들었다.
이번 해에는 꼭 좋은 습관들을 많이 기르고 싶다. 필사라던지, 책 읽기라던지 ..! 그리고 나와 다른 관점을 가지고 있는 친구들이나 지인들을 만나 다양한 주제로 토론해보는 것도 좋을 거 같다.
여러모로 유익한 시간이었고 또 한번 나의 부족함을 깨닫는 시간이었다.
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'유데미 스타터스' 카테고리의 다른 글
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 6주차 학습일지 (0) | 2023.03.19 |
---|---|
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 5주차 학습일지 (0) | 2023.03.12 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 3주차 학습 일지 (0) | 2023.02.26 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 2주차 학습 일지 (0) | 2023.02.19 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 1주차 학습 일지 (0) | 2023.02.12 |