데이터 시각화는 데이터 분석에 있어 더욱 직관적이고 명료한 방법을 찾게 해주는 도구라고 할 수 있습니다.
지난 콘텐츠에서 데이터 시각화의 중요성과 시각화 차트 기본 사례에 대해 소개해 드렸는데요. 시각화의 중요성에 대해 충분히 인지를 했다면, 이에 대한 활용도를 조금 더 높일 차례입니다. 지난 시간에는 한 가지 지표의 데이터를 보고 동향을 파악하였다면 이번엔 두 가지 이상의 지표 데이터를 보고 인사이트를 얻을 수 있는 방향으로 소개해보고자 합니다.
지난 게시글 보기 : 데이터 시각화 차트 유형과 활용사례 기본 →
두 가지 정보를 비교하여 예측하기
맛집을 찾아 헤매는 것은 또 하나의 콘텐츠로 자리 잡을 만큼 한 가지 문화가 되었다고 할 수 있는데요. 실제로 취미가 무엇이냐는 질문에 “맛집 여행하기”, “맛집 리뷰하기” 등으로 대답하는 사람이 많아졌습니다. 그래선지 입소문을 타기 시작한 가게들은 금세 대기줄이 늘어지게 되곤 합니다. 줄을 서는 수고를 덜기 위해서는 조금이라도 사전 조사가 필요해진 시대입니다.
지인들과의 약속을 정할 때 만나는 장소의 혼잡함이 걸림돌이 되지 않도록 저는 ‘카카오맵’의 시간별 방문자 데이터를 활용하곤 합니다. 전체 평균 추이 뿐만 아니라 주 평균, 요일별 평균을 데이터로 제공해주어서 제가 찾아갈 시간대에 어느 정도 붐빌지 예측할 수 있습니다.
위 예시는 강남구에 위치한 한 가게로, 점심보다는 저녁이 인기가 많고, 주중과 주말의 그래프가 꽤 다르게 그려집니다. 하지만 일요일에는 하루 평균 방문자가 현저히 떨어지는 것을 볼 수 있습니다. 만약 주말 중에서 해당 위치에 가고자 할 때 조금이라도 덜 혼잡한 시간을 고르고 싶다면 일요일을 선택하는 것이 나쁘지 않겠습니다.
시각적인 활용 요소로는 비교 대상 중 평균값의 색을 덜어내고 마치 배경처럼 처리해 단일 라인 차트가 더욱 눈에 띄도록 배치하여, 조회한 요일과 해당 요일의 평균을 가장 먼저 보여줍니다. 두 가지 요소가 시각적으로 충돌하지 않도록 두 데이터의 성질에 차이를 두고 함께 배치하여 즉각적인 비교가 가능하도록 했는데요. 또한 ‘최고 인기 시간’을 강조해서 내가 가야 할 시간에 주 평균보다, 하루 시간대 별 중에서 얼마나 인기가 많을지 예측하기 쉽도록 시각화 되었습니다.
위 그래프는 비즈스프링 ‘LOGGER’에서 제공하는 실시간 방문자 트렌드입니다. 앞서 설명한 ‘카카오맵’ 예시와 비슷한 성질을 지니면서 실시간에 조금 더 가깝습니다. 근거로 ‘카카오맵’ 방문자 추세와 다르게 ‘LOGGER’의 실시간 현재 방문자는 라인 차트와 막대 차트를 섞어서 제공합니다. 주 평균과 요일 평균을 보여주기 위해 두 가지 평균값을 비교한 차트와 달리, 로거의 차트는 평균값과 실시간 추세를 비교하고 있기 때문입니다.
LOGGER 실시간 방문자 추세는 지난 평균값을 통해서 현재 시간대별 방문자의 다음 추이를 예측할 수 있습니다. 화면 캡쳐 시각은 14시 11분 경으로, 주황색이 칠해진 칸이 11분 동안 유입한 방문자 수이며, 14-15시 사이의 방문자 추이가 어떻게 될 지 예측에 대해 빈 막대 차트를 그려 함께 제공합니다. 이 차트를 읽는다면 현재 시각 뿐만 아니라 15시 이후의 대응까지도 가능하지 않을까요?
데이터는 끊임없이 연결되고 있고, 현상에 대한 원인을 분석하고 고찰하는 것도 중요하지만 과거의 데이터를 기반으로 더 앞선 인사이트를 얻을 수 있다는 걸 알 수 있습니다. 이처럼 평균 데이터와 현재 데이터를 비교하여 현재 혹은 미래를 예측할 수 있는 수단이 될 수 있습니다.
데이터 테이블을 여러 방식으로 표현해보자
데이터를 가장 기본으로 나열할 수 있는 방법은 무엇일까요? 다들 엑셀을 쉽게 떠올릴 수 있을 것 같네요. 데이터 시각화의 목적은 방대한 데이터를 그래프로 변환하여 더 직관적으로 읽기 위함입니다. 하지만 데이터 시각화에는 분명히 한계도 있습니다. 특히 여러 지표나 많은 양의 데이터를 감당하려면 한 화각 안에서 표현을 다 해내기는 어려운데요. 그래서 시각화 대시보드에도 여전히 데이터 테이블은 꾸준히 함께 활용되고 있습니다. 그럼 이 데이터 테이블을 조금 더 쉽게 볼 수 있는 방법은 없을까요?
위 테이블은 매체별 노출수/클릭수/광고비/전환수/매출액을 한번에 비교할 수 있는 테이블입니다. 이 내용을 시각화를 활용해 가독성을 높여보고자 하는데요, 각 매체별 지표 비중을 자세하게 보고 싶다면 어떻게 표현해야 할까요?
Growth Platform에서 제공하는 ‘광고 매체 통합 대시보드’의 매체별 비중 테이블은 각 지표를 클릭하면 해당 지표의 매체별 비중을 시각화 데이터로 함께 제공합니다. 위 데이터 테이블과 같은 내용이지만 관심 있는 지표와 그 비중에 대해서 한 눈에 확인이 쉬운 것을 알 수 있습니다.
Growth Platform ‘광고 매체 통합 대시보드’의 키워드 현황 데이터 테이블 입니다. 좌측에서 키워드 중요도를 클라우드를 통해 직관적으로 보이고 있어 시각적으로 인지하기 편합니다. 각 지표별 키워드 순위를 확인할 수 있으며, 해당 키워드의 매체별 비중이 어떤지 바 그래프를 통해 확인할 수 있습니다.
10개 이상의 매체별 비중을 그래프로 확인하기에는 다소 복잡함이 있습니다. 만약 파이나 막대 차트로 비중을 표현하고자 한다면 더욱 복잡하고, 불필요한 공간을 많이 쓰게 될 것입니다. 그래서 폭을 방해하지 않는 범위 내에서 100% 바 그래프를 활용하여 각 키워드 별 비중을 나타내는 것으로 표현하였습니다.
위는 각 터치포인트 별 활성자 수를 원의 크기로 볼륨을 표현하여 어떤 터치포인트에서 활성자 수가 많이 발생하였는지 파악할 수 있습니다. 세로 막대 그래프로도 수치를 시각화하여 보여줄 수 있겠지만, 광고 매체별로 데이터를 보여주기 위해 여러 컬럼을 사용해야 한다는 점에서 세로 막대 그래프는 적절하지 않습니다. 방대한 양이 펼쳐진 테이블 속에서 활성자 수가 가장 많거나 혹은 비교 대상을 찾기에는 볼륨 표현이 적절합니다.
데이터 시각화에 관심이 있으시다면 구글 루커 스튜디오는 필수적인데요. 루커 스튜디오에서도 이와 같은 테이블 시각화를 제공하고 있습니다. 광고 매체 유입 데이터 테이블보다, 캠페인 현황에서 더 많은 지표를 가지고 있어 각 컬럼에 다른 색을 지정하고, 컬러의 농도로 볼륨을 표현하여 각 지표별 중요도를 나타내고 있습니다.
퍼널을 통해 전환율 파악하기
퍼널 차트는 각 단계 별로 지표가 변화하는 것을 파악하기 위한 목적의 차트입니다. 특정 이벤트가 있을 때 그 이벤트를 통해 유입된 사용자가 전환까지 도달하는 데 과정을 알 수 있습니다. 위와 같은 단계별로 나열을 한다면 어느 지점에서 문제가 발생했는지 파악하기 용이해집니다. 이커머스 퍼널은 보통 사이트 방문 → 상품 조회 → 전환 시도 → 전환(구매 완료)로 이루어 집니다. 매출을 높이기 위해 가장 중요한 지표는 퍼널이라고 할 수 있을 만큼 매우 중요하게 여겨지는 차트 중 하나입니다.
퍼널 차트 중에서도 어떤 형식으로 보여주느냐에 따라 시각적 형태가 달라집니다. 기본적으로 각 단계 전환율과 단계별 사용자 수를 제공하고 있습니다. 비즈스프링 ‘Smart Dash’로 참여했던 내용 중 아래와 같은 퍼널을 제작했습니다.
각 단계별 진척도 뿐만 아니라, 1-3단계, 1-4단계까지의 전환 시도율도 함께 나타내어 전환에 도달하기까지 사용자의 여정을 더욱 다양하게 분석할 수 있도록 하였습니다. 각 단계별 전환율을 제공하기에 가로 배열을 통해 보여주는 것이 적합하다고 생각하여, 더욱 와이드하게 화면을 활용하여 여정을 표기할 수 있었습니다. 위 퍼널을 통해 대략적인 방문 대비 전환율을 확인하고, 사이트 탐색 단계에서 충분한 전환이 이루어지지 못했다는 것을 알 수 있을 것입니다. 이런 식으로 단계별 pain point를 찾기에 적합한 퍼널 차트를 구성하는 것이 중요합니다.
이것으로 데이터 시각화 차트에 대한 이야기를 나눌 수 있었는데요. 데이터를 지표의 종류나 상황에 따라 전혀 다른 연출이 가능함을 알 수 있었습니다. 자신의 비즈니스에 맞는 시각화 차트로 인사이트를 구하는 것이 고객과의 소통에 첫 번째 발걸음이 될 수 있습니다.