시작은 3월로 거슬러 올라갑니다. 3월 ‘숫자를 돈으로 바꾸는 데이터 분석의 기술’ 책을 읽고 ‘구슬이 서 말이어도 꿰어야 보배’ 정신을 실천하고자 데이터에 속성을 부여하여 실험해봤습니다. 지금 이 글은 두 번째 실험을 시도한 내용입니다. 아직 못 보신 분들은 이 글을 보시면 됩니다.
여기 한 ‘평범한’ 여성의류 쇼핑몰이 있습니다.
카페24를 통해 만들어진 쇼핑몰이며 여성 상/하의부터 아우터, 액세서리까지 판매하고 있습니다. 검색포털에 이 쇼핑몰 이름을 검색하면, 유사 타겟을 갖는 수많은 쇼핑몰이 상위노출 경쟁을 하고 있습니다. 브랜드 검색은 하지 않지만, 쇼핑검색광고와 검색광고를 진행하고 있는 ‘평범한’ 쇼핑몰입니다. 이 쇼핑몰을 A몰이라 하겠습니다.
저는 또 한 번 3C (Customer, Campaign, Content) 와 육하원칙(1H5W)을 통해 질문해보았습니다.
Campaign 과 What, Content 와 What 을 결합하고 그 둘을 또 한 번 결합합니다.
- Campaign x What: 어떤 매체/키워드 광고에 반응하는가?
- Content x What: 어떤 콘텐츠/상품을 구매하는가?
- ( Campaign x What ) x ( Content x What ): 어떤 매체/키워드 광고를 클릭하여 방문하고 어떤 콘텐츠를 구매하는가?
유입 키워드는 방문자의 욕망/니즈를 투영한다고 하는데, 그래서 그 욕망이 구매까지 이어질까?
‘원피스’ 키워드를 통해 유입한 방문자는 정말 ‘원피스’를 살까?
‘청자켓’ 키워드를 통해 유입한 방문자는 정말 ‘청자켓’을 살까?
A몰은 로거(logger.co.kr)를 통해서 분석하고 있기에, 로거를 통해 데이터를 확인합니다.
로거의 ‘CPC 키워드별 주문/매출’리포트에서는 검색광고 유입 키워드와 해당 키워드를 통한 방문수, 회원가입수, 주문수, 매출액을 확인할 수 있습니다.
키워드마다 오른쪽에 자리한 아이콘을 선택하면 해당 키워드별 추가 정보를 확인할 수 있습니다.
‘선물상자/상품’ 아이콘을 클릭하면, 해당 키워드를 통해 유입한 방문자들의 주문상품, 주문수량, 매출액을 확인할 수 있습니다.
원하는 데이터를 어디서 어떻게 얻을 수 있는지 확인했으니, 이제 정말 궁금한 것을 확인해봅니다.
‘원피스’ 키워드를 통해 유입한 방문자는 정말 ‘원피스’를 살까?
‘청자켓’ 키워드를 통해 유입한 방문자는 정말 ‘청자켓’을 살까?
아래 순서로 시도했습니다.
1. 로거의 ‘CPC 키워드별 주문/매출’ 리포트에서 최근 3개월간의 유입 키워드별 주문상품 데이터를 다운로드 합니다.
이후에 시각화 작업이 용이하도록 구글 스프레드시트를 통해 작업했습니다.
2. 쇼핑몰의 상품 카테고리를 확인하여 정리합니다.
A몰의 대카테고리와 중카테고리는 아래와 같았습니다.
- 상의 : 티셔츠 | 니트 | 블라우스/셔츠
- 하의 : 팬츠 | 데님 | 슬랙스 | 스커트 | 반바지
- 아우터 : 재킷 | 트렌치코트/코트 | 카디건 | 베스트 | 점퍼/패딩 | 야상
- 원피스 : 원피스 | 점프슈트
- 양말&액세서리 : 언더웨어 | 스타킹/양말 | 레깅스 | 모자 | 액세서리
- 신발: 운동화/슬립온 | 로퍼/블로퍼 | 플랫 | 샌들/슬리퍼 | 힐/부츠
- 머플러
- 가방
3. 유입 키워드와 주문 상품의 카테고리/속성을 정의합니다.
대 카테고리, 중 카테고리로 구분하여 ‘구분1’과 ‘구분2’로 정리하였습니다.
유입 키워드의 경우 ‘A몰’ 자사브랜드 키워드와 경쟁사 쇼핑몰 키워드까지 포함하여 대카테고리와 중카테고리를 정의하였습니다.
4. 데이터를 시각화하여 확인합니다.
저는 구글 데이터 스튜디오(GDS)를 통해 시각화하였습니다.
유입 키워드의 대카테고리별 주문 상품의 대카테고리를 확인합니다.
유입 키워드별 전체 주문 상품의 주문수를 100%으로 볼 때, 주문 상품의 카테고리를 알아봅니다.
대카테고리가 ‘신발’로 분류되는 유입 키워드의 주문 상품은 모두 ‘신발’ 카테고리에 속합니다. ‘신발’ 유입 키워드는 유입수가 5건 미만이기에 100%라 해도 용인할 수 있었습니다. 그래프를 보면, ‘상의’, ‘아우터’, ‘양말&액세서리’, ‘원피스’, ‘하의’의 경우 유입 키워드의 대카테고리와 주문 상품의 대카테고리가 일치합니다.
다시 말해, ‘하의’ 키워드 광고 클릭하여 유입한 방문의 경우 대부분 ‘하의’ 카테고리에 속한 상품을 주문했습니다.
경쟁사와 자사브랜드 성격을 가진 유입 키워드의 경우, 비교적 주문 상품의 카테고리가 고릅니다. 다른 유입 키워드에 비하여 어느 한 쪽에 치중되어있다기보다, 여러가지 상품이 고루 눈에 띕니다.
이번에는 유입 키워드별 전체 주문 상품의 주문당 매출액의 합을 100%으로 볼 때, 주문 상품의 카테고리를 구분해봅니다. 주문당 매출액은 매출액을 주문수로 나눈 값입니다.
주문당 매출액의 경우에도 앞서 보았던 주문 그래프와 양상이 크게 다르지 않습니다.
‘상의’, ‘아우터’, ‘원피스’, ‘하의’의 경우 유입 키워드의 대카테고리와 주문당매출액의 주문상품의 대카테고리가 대부분 일치합니다. ‘자사 브랜드’와 ‘경쟁사’ 성격을 가진 유입 키워드의 경우 다른 유입 키워드에 비해 상대적으로 고른 분포를 보입니다. 다만, ‘양말&액세서리’ 유입 키워드의 경우, 다소 양상이 달라진 것이 눈에 띄는데요. ‘양말&액세서리’ 주문 상품의 경우 ‘원피스’, ‘하의’ 등 다른 카테고리에 비해 상품단가가 상대적으로 낮기에 ‘주문당 매출액’ 분포에서는 ‘주문수’ 분포에 비해 영향력이 낮았습니다.
보다보니, 유입 키워드와 주문 상품의 대카테고리와 중카테고리가 모두 일치하는 경우, 가장 높은 연관을 보이는 카테고리가 궁금했습니다. 예를 들어, ‘여성청자켓’ 유입 키워드는 [ 아우터 – 재킷 ] 으로 분류했는데요, ‘여성청자켓’으로 유입하여, 대카테고리와 중카테고리까지 일치하는 ‘청자켓’을 상품을 구매한 경우입니다.
유입 키워드와 주문 상품의 카테고리가 모두 일치하는 경우에 한하여,
주문수와 주문 금액, 주문수량, 주문당 매출액을 확인해보았습니다.
대카테고리 기준으로는 ‘아우터’와 ‘상의’, ‘원피스’ 순으로 일치하는 주문수가 많았습니다. 금액과 수량, 주문당매출액도 유사한 랭크를 보입니다. 중카테고리 기준으로는 대카테고리 ‘아우터’에 속하는 ‘재킷’에서 주문수와 주문금액, 수량, 주문당매출액이 모두 높았습니다.
이번에는 일치하지 않는 경우를 살펴봅니다.
유입 키워드와 주문 상품의 카테고리가 모두 일치하지 않는 경우에 한하여, 주문수와 주문 금액, 주문수량, 주문당 매출액을 확인해보았습니다.
주문 상품의 대카테고리를 기준으로 살펴보았을 때, 대카테고리 ‘원피스’, ‘하의’, ‘상의’ 에서 주문수와 주문금액, 수량, 주문당 매출액이 상위에 자리합니다. ‘원피스’와 ‘팬츠’, ‘블라우스/셔츠’, ‘티셔츠’는 유입 키워드 성격과 무관하더라도 구매하는 경우가 많다는 것인데요. 가방이나 양말과는 다르게 기본 아이템으로 분류되는 상의, 하의, 원피스. 삼총사이기에 결과가 놀라운 편은 아닙니다. ‘원피스’가 대카테고리와 중카테고리에서 높은 수치를 기록했는데요.
- 원피스 : 원피스 | 점프슈트
- 상의 : 티셔츠 | 니트 | 블라우스/셔츠
- 하의 : 팬츠 | 데님 | 슬랙스 | 스커트 | 반바지
‘원피스’의 경우, 위와 같이 ‘하의’나 ‘상의’에 비해 중카테고리가 단순하여 하나의 중카테고리에 집중된 것도 있겠습니다만, 이를 보니 또 여러가지의 질문이 떠오릅니다.
- ‘원피스’와는 상관없는 키워드로 들어와도 ‘원피스’를 많이 주문한다면, 추천할 정보가 없는 첫 방문자에게는 일단 ‘원피스’를 제시/추천하면 정말 효과가 좋을까?
- ‘원피스’를 그냥 ‘원피스’로 분류하지 말고, ‘원피스’별로 ‘데님원피스’, ‘쉬폰원피스’, ‘검은색 원피스’, ‘도트무늬원피스’ 등과 같이 소재나 색상, 무늬에 따라 분류하여 살펴보면 어떤 결과가 나올까?
확인해본 내용들을 다시 살펴보자면,
– 대부분 유입 키워드에 해당하는 카테고리의 상품을 구매한다.
– ‘원피스’ 키워드 광고 클릭 방문자는 정말 ‘원피스’를 산다? 산다!
– 자사 브랜드, 경쟁사 키워드 등 특정 제품을 지칭하지 않는 키워드로 유입한 경우, 상대적으로 구매 상품의 카테고리가 다양하다.
– ‘원피스’, ‘상의’, ‘하의’ 카테고리는 해당 카테고리와 관련 없는 광고로 유입해도 구매하는 경우가 많다.
또 한 번, 데이터 분석 체력을 기른다는 마음으로 이 글을 작성하고 있습니다. 대단한 것은 아니지만 글의 제목이기도 한 ”원피스’ 키워드 광고 클릭 방문자는 정말 ‘원피스’를 살까?’ 질문의 답을 구하기 위해 나름의 작업을 해보았습니다. 몇가지 아쉬운 점이 있었습니다. 서로 다른 카테고리의 동시 구매 상품 데이터와 한 방문자가 같은 상품을 2개 이상 주문하거나, 3개 이상 주문하는 것은 고려하지 않았다는 것입니다. Content 와 Customer 분석까지 결합하여 데이터를 확인할 수 있었으면 좀 더 풍부한 분석을 할 수 있었을 거란 아쉬움이 있습니다. 또 한 가지 아쉬운 점은 시간 흐름, 추세 데이터가 함께 고려되지 않은 것인데요, 이 것은 두 달 뒤에 A몰의 3개월치 데이터를 통해 또 한 번 시도해보고 이번 작업과의 결과를 비교해보는 것으로 보완해보려 합니다.
그렇지만, 마냥 아쉽기만 한 것은 아닙니다. 아쉬운 점은 항상 깨달음을 가지고 오지요. 얻은 점, 깨달은 점도 있습니다. 위의 과정에서 두드러지게 표현하지는 않았지만, 작업을 하다 보면 크고 작은 고민과 의사결정을 반복하게 됩니다. 첫번째는 ‘같은 속성의 다른 표기법’ 입니다. 처음에는 조금 당황스러웠지만 이제는 익숙합니다.
- ‘슬렉스’와 ‘슬랙스’
- ‘재킷’과 ‘자켓’
실제로 경험하기 전까지는 ‘음~ 슬랙스 단어 포함하는 것은 모두 슬랙스로 분류해야지~’로 단순하게 생각하게 됩니다. ‘슬랙스’에는 ‘슬랙스’와 ‘슬렉스’, (영문 상품명을 제공하는 경우라면) 어쩌면 ‘Slacks’까지도 포함해야 합니다. 단순하게 처리하게 되면 꼭 빈틈이 생기더라고요.
두번째는 ‘속성이 겹칠 때의 의사결정’입니다. A몰 사례를 작업하며 제가 했던 고민들입니다.
- ‘패딩 베스트’는 ‘패딩’일까? ‘베스트’일까?
- ‘재킷’과 ‘점퍼’는 무엇이 다른가?
- ‘청배기팬츠’는 ‘하의 > 데님’ 카테고리로 분류해야 하는가? ‘하의 > 팬츠’ 카테고리로 분류해야 하는가?
데이터를 처리하려면 반드시 결정을 내려야 합니다. 일관성만 지키자는 생각으로 결정을 내리고 작업을 진행했습니다. ‘패딩 베스트’는 ‘베스트'(조끼)로 분류했고, ‘재킷’같기도 하고 ‘점퍼’ 같기도 한 상품과 ‘청배기팬츠’는 실제 A몰의 상품 분류에 따라 설정했습니다. 데이터 엔지니어가 가장 많은 시간을 쏟는 일은 데이터 전처리(데이터 클렌징)라고 하더니, 정말 “맞다 맞어~” 소리가 절로 나오며 고개를 끄덕이게 됩니다. 제가 한 것은 정말 소소한 작업임에도 불구하고요. 하하.
흥미로운 질문과 심도있는 과정과 결과로 계속 찾아가겠습니다.
다음 번에는 좀 더 친해진, 새학년 중반기 짝꿍으로 만나뵙겠습니다 🙂