[유데미 스타터스 취업 부트캠프 4기] 6주차 학습 일지(데이터분석/시각화(태블로))

[출처 : Udemy - STARTERS 블로그 학습일지 안내]

 

안녕하세요! 오늘은 유데미 스타터스 부트캠프 6주차 학습일지입니다! 🙂

 

이번주는 태블로 오프라인 강의가 시작된 첫번째 주입니다!

이번 주 오프라인 강의는 생각보다 훨씬!! 재밌었고, 또 매우!! 힘들었는데요 🤣

 

매일 교육장에 오며 정말 행복했습니다 😃

 

그럼 어떻게 6주차를 보냈는지, 스타터스 부트캠프 6주차 학습일지 시작해보겠습니다 !💨

 


❤️‍🔥 LIKED

5일간의 팀활동

이번주부터 태블로 오프라인 학습을 시작하며 본격적인 활동이 진행되었습니다 😀

월요일은 태블로 수퍼스토어 데이터 이용하여 임원, 지역 매니저를 위한 대시보드를 각각 만들어보았습니다.

화요일부터 금요일까지는 에어비앤비 가상 데이터를 이용해 전략 컨설팅 대시보드를 만들었습니다.

 

위 사진을 통해 지난 일주일 사이 저희 팀의 실력이 얼마나 늘었는지 보이시나요..!!

아직 많이 부족하지만 매일 프로젝트를 진행하며 저희의 실력이 늘고있음을 팀원들과 느끼고 있습니다 😌

 

대시보드를 만든 후 강사님의 피드백을 통해 저희가 아예 생각하지 못했던 점이나 혹은 중요하다고 생각하지 않고 넘겼던 부분들이

대시보드를 사용하는 사람의 입장에서 왜 필요한지 충분히 느낄 수 있었습니다.

반대로 중요하다 생각하여 꼭 포함시켰던 차트 또한 피드백을 받고 다시 확인해보면 '아, 이 차트는 꼭 대시보드로 구현할 필요는 없구나' 느끼기도 합니다.

 

이번주 태블로 학습을 하며 가장 중요하게 느낀 점은,

대시보드는 결국 누군가 사용 혹은 열람하도록 만든 것이고 그렇기에 사용자 관점에서 만들어야 한다는 것입니다.

 

만들다 보면 만들고 있는 ‘나’의 관점이 들어가고 내 입장에서 이해가 되고 편한 대시보드를 만들게 되는데,

아무런 정보 없이 이 대시보드를 보게될 사용자의 관점을 잊지 않도록 주의해야겠다는 생각을 하였습니다.

 


🌟 LEAREND

매개변수

1. 껍데기 만들기

¤ 데이터 유형 : 날짜가 아닌 이상 무조건 문자열로 설정

¤ 허용 가능한 값 : 목록

¤ 표현형식 : 껍데기에 표현될 이름

2. 알맹이 채우기

① 차원 매개변수  ② 숫자 측정값 매개변수

 

필터

· 필터 설정 종류

 ① 일반 - 목록에서 선택

 ② 와일드카드 : 문자열에서 자주 쓰임 (사용빈도↓ - 매뉴얼한 작업이기에 실수 발생 확률 높음)

 ③ 조건 : 필드 기준 (매뉴얼한 작업) / 수식 기준 (자동화)

 ④ 상위 : 필드 기준 (사용빈도↑)

 

· 필터에는 우선순위 존재 → [컨텍스트에 추가]를 이용해 지정

 

동작

¤ x을 움직여 y에 영향을 준다는 논리

¤ 쌍방향 영향은 오류 날 가능성 있음 - 원본 시트 하나, 원본 시트 제외하고 하나 선택하도록

¤ 마우스 오버 : 어지럽고 렉걸릴 가능성 많음

동작 설정 과정

 

차트 소개

· 제일 많이 사용하는 차트

 ① 텍스트 (임원들이 제일 많이 보는게 엑셀이기 때문 )

 ② 히트맵 (빨강·파랑 표시해야 함)

 ③ 막대그래프 (남용안돼 / 이중축 이용)

 ④ 도넛차트 (최대한 간단한 필드만 들어간걸로 만들어야 함 오류가 잘 생겨서 ..)

 

· 차트 만들기

 

유니온

- 유니온은 조인과 달리 컬럼이 모두 동일해야 가능

- 유니언 : 중복 제외하고 다 붙이기

- 유니온 ALL : 중복 있더라도 다 붙이기

 

조인

- 회사에서는 inner 조인은 데이터 유실 가능성으로 잘 쓰이지 않음

- 제일 많이 쓰이는 건 left 조인

- 동일 컬럼이 여러개일 경우 모두 조인 조건에 포함시켜야 함 (혹은 groupby로 컬럼을 모두 그루핑시켜야함)

 

혼합관계 편집

- 컬럼명은 다르더라도 컬럼 내 동일한 데이터가 하나라도 있어야 한다!

 

대시보드 tip

- 도구설명에 그래프 → 보충 설명할 수 있는 테이블을 넣자

- 대시보드 하단 혹은 상단 : 데이터 원본 이름, 데이터 테이블 업데이트 시간

- 외면당한 디비, 테이블을 이용하면 망한 대시보드를 만든거임

 

날짜형 연습
1. DATEADD(date_part, interval, date)
date 에 date_part 단위의 interval을 더함

ex) DATEADD('year', 2, #2021–08–02#)=2023–08–02 12:00:00AM

2. DATEDIFF(date_part, date1, date2, [start_of_week])
date1(시작일)과 date2(종료일) 사이의 간격을 date_part 단위로 구함

이때 [start_of_week]는 선택사항이며, 'sunday' 로 지정 시, 일요일이 주의 첫번째 요일로 고려함

ex) DATEDIFF('week', #2021–08–04#,#2021–08–07#)=0

ex) DATEDIFF('week', #2021–08–04#,#2021–08–07#, 'saturday')=1

위의 예시는 월요일을 주의 첫 번째 요일로 고려한 것 -> 4일(수)와 8일(일)은 같은 주->0

아래의 예시는 토요일을 주의 첫 번째 요일로 고려한 것-> 수요일과 토요일은 다른 주-> 1

3. DATENAME(date_part, date, [start_of_week])
date의 date_part를 문자열로 반환

DATENAME('month', #2021–08–04#) = "August"

4. DATEPART(date_part,date,[start_of_week]
date의 date_part를 정수형으로 반환

DATENAME('month', #2021–08–04#) = 8

5. DATEPARSE(date_format, [date_string])
date_string(문자열)을 date_format의 형태(날짜형)로 반환

파싱 진행!!!!

ex) DATEPARSE('MMMM dd, YY', 'August 04, 21'). 
ex) left(str(DATEPARSE('MMMM dd, YY', 'August 04, 21')),10) =2021–08–04

6. DATERUNC(date_part, date, [start_of_week])
date 기준 date가 속한 date-part 의 첫째 날 반환

ex) DATRUNC('quarter',#2021–08–04#)= 2021–07–01. 

ex) DATRUNC('month',#2021–08–04#)= 2021–08–01 

7. ISDATE(string)
string(문자열)이 유효한 날짜면 true 반환

ex) ISDATE('August 4,2021')=true

8. MAKETIME(hour, minute, second)  시,분,초로 구성된 날짜값 반환


ex) MAKETIME(16,24,00) = #16:24:00#  -> #처음에는 디폴트값 년도,달,일 + 시간 나옴. 우 클릭 정확한 날짜 선택 시 시간만 보이지만 측정값으로 변함 + 컴퓨터마다 인식 다름.. 안 되는 경우도 다반사

9. MAX(expr1, expr2)            
a와 b의 최대값 반환(동일한 유형이어야 함, 둘 중 하나라도 Null 이면 Null 반환)

ex) MAX('2021–01–01' ,'2021–03–01') = 2021–03–01 12:00:00 AM
or '2021-01-01' 부분이 아예 date 형식이어야 가능 

10. MIN(expr1, expr2)           
a와 b의 최소값 반환(동일한 유형이어야 함, 둘 중 하나라도 Null 이면 Null 반환)

ex) MIN('2021–01–01' ,'2021–03–01') = 2021–01–01 12:00:00 AM
or '2021-01-01' 부분이 아예 date 형식이면 가능 

11. YEAR(date)
주어진 날짜의 연도를 정수로 반환

ex)YEAR(#2021–08–15#) = 2021

12. MONTH(date)
주어진 날짜를 월의 정수로 반환

ex) MONTH(#2021–08–15#) = 8

13. WEEK(date)
date의 날짜 주를 정수로 반환

ex) WEEK(#2021–04–15#)=16

14. DAY(date)
date의 날짜 일을 정수로 반환

ex) DAY(#2021–08–04#)=4

15. QUARTER(date)
date의 분기를 정수로 반환

ex) QUARTER(#2021–08–04#)=3

16. TODAY()
현재 날짜 반환

TODAY()=2021–08–15

💦 LACKED

대시보드 체크리스트

● 대시보드 디자인

 - 숫자/글자의 크기

 - 차트 내 숫자/단위 표시

 - 최소한의 색상 테마 (빨강파랑 의미)

 

● 대시보드 요소 

- 캘린더 형식 : 좌-우 선호

- 점수 : 100점 만점화

- 추가 설명은 차트 하단에 텍스트 추가

- 대시보드 사용에 관한 설명 기재(필요한 경우)

 

● 대시보드 내 차트

- 이 차트가 의미있는지?(경우에 따라 변화하는지, 늘 똑같은지)

- 이 차트가 대시보드에 꼭 들어가야 할까?

- 차트를 보고 무엇을 의미하는지 바로 알 수 있어야 함

- 모든 차트에 이름 다 넣어야 함

 

● 사용자 관점의 대시보드

- 사용자에 따른 필터 개수

- 사용자에 따라 무엇이 궁금하고, 무엇에 집중하는지


✍🏻 LONGED FOR

어떤 사고방식을 가져야 할까

 

이번주 내내 프로젝트를 진행하다보니 단순히 툴을 사용하는 능력보다도,

데이터를 이해하는 능력 그리고 어떤 관점에서 데이터를 분석해야 할지 인지하는 능력이 정말 중요하다는 것을 느꼈습니다.

 

팀원들보다 태블로 실력이 너무 부족함이 늘 느껴져서.. 같이 만든 대시보드도 혼자 만들면서 여러번 복습해봐야 하기도 하지만 ..!!

이번주 통근시간에는 위 책을 읽어보려고 합니다 😙

데이터 분석 과정에서 어떤 사고방식을 가져야 할지 배울 수 있을 것 같네요 🙃

 


그럼 이상으로 6주차 학습일지를 마치겠습니다 !

7주차도 열심히 달려보겠습니다 !!!💨

 

 

* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.