[출처] 구글애널리틱스 데이터에 대해 알아야 할 3가지 | 작성자 wisetracker
(http://wisetracker.blog.me/220390705902)
데이터를 다루는 업무에 종사하시는 분들은 구글 애널릭티스(이하 GA)를 알고 계실 것입니다.
GA는 구글에서 제공하는 로그분석 서비스로 스크립트 기반의 PC Web, Mobile Web 분석을 지원하였고,
2012년에는 분석 SDK를 제공하면서 웹에 이어 앱까지 분석을 지원하고 있습니다.
GA는 무료이면서도 커스텀 리포트, 다차원 세그먼트 등등 유료 툴 못지않은 기능으로
전세계 마켓쉐어 1위를 차지하고 있으며, 국내에서도 많은 기업이 적용하여 활용하고 있습니다.
하지만 GA를 사용해도 타 유료 툴과 이원화 해서 사용하는 경우가 많은 편인데요,
이는 크게 3가지 이유가 있습니다.
1. 데이터 샘플링
GA는 SaaS 방식으로 무료로 서비스를 제공하는 대신 데이터 소유권은 구글에게 있습니다.
즉, 구글은 시장 점유율 1위인 만큼 상상하기 힘든 다수의 데이터를 쌓을 수 있는 시스템을 갖춰야 하므로,
모든 고객의 데이터를 무제한으로 수집하는 것은 어렵습니다.
그렇기 때문에 GA는 무료 범위 내에서 처리 가능한 데이터의 제한을 둘 수 밖에 없는데요,
그 기준은 아래와 같습니다.
1) 데이터 저장 기간은 25개월
2) 분석 대상의 트래픽이 높으면 샘플링 되어 처리
– 월 1,000만 hit 초과 시
– 일 20만 Visit 이상
– 리포트 조회기간 내 Visit이 50만 이상 되는 경우
– 행동흐름 리포트는 10만 Visit 이상일 경우
※ GA Premium은 월 10억 hit 분석 지원 (연 15만 달러)
( source : https://support.google.com/analytics/answer/1042498?hl=ko )
2. 데이터 조회 속도
마케터는 규모있는 이벤트, 프로모션을 진행 후 빠르게 결과를 확인해서 실시간으로 대응하고 싶어 합니다.
그러나 GA는 데이터 가공/처리 후 리포트로 보기까지 약 24~48시간이 소요됩니다.
실시간 리포트를 제공하고 있지만, 광고 데이터(트래픽 소스)는 웹 프로파일에서 방문수만 제공하고 있어,
앱을 위한 캠페인 성과는 실시간으로 확인이 불가능합니다.
( source : https://support.google.com/analytics/answer/1042498?hl=ko )
3. 데이터 신뢰도
3번째 이유는 GA를 이원화해서 사용하는 대표적인 이유라고 볼 수 있습니다.
GA는 기본적으로 Support 방식이 도움말(Help Center)로 지원하여 개별적인 고객지원은 받기 힘듭니다.
그래서 초기 구축(implementation) 및 데이터 검증(validation) 작업이 굉장히 중요하며,
garbage data가 쌓이는지 확인해야 하는데 여기서 가장 큰 문제는 원천 데이터(raw data)레벨의
데이터 검증이 불가능 합니다.
웹 또는 앱에 적용한 이벤트를 일으킴과 동시에 DB에 raw data가 정상 수집되는지 확인을 해야 하는데,
GA는 다음 날 가공된 리포트 데이터를 보고 판단해야 하니 검증에 한계가 있을 수 밖에 없습니다.
최근에 자사 사이트가 구축되서 GA 스크립트를 심었는데, 알 수 없는 출처의 트래픽이 쌓이는 것을
해결하기 위해 검색해보니 스팸 레퍼러 대응법 & 스팸 레퍼러 리스트를 공유하는 아티클을 발견했고,
많은 GA 사용자의 호응을 얻었던 것을 본 적 있습니다.
( source : http://viget.com/advance/removing-referral-spam-from-google-analytics )
이러한 정보를 인지하지 못하고 추가 셋업을 하지 않았다면 로봇(web crawers)이나 스팸 레퍼러에 의해 garbage data가 쌓이는 것을 잘못 해석하여 사용자가 증가하고 있다고 판단할 수도 있습니다.
분석 전문가 아비나쉬 카우식(Avinash Kaushik)님이 작성하신 책 ‘실전 웹사이트 분석 A to Z’ 내용 중 툴을 도입하는 프로세스의 첫 단계로 ‘최적의 인력을 배치한다’고 말하고 있습니다.
사내에 GA를 능숙하게 다루는 전문인력을 구성하고 있다면 GA는 최적의 도구가 될 수 있겠지만,
그렇지 않다면 전수 데이터를 분석하고 데이터 검증까지 지원하는 보완 가능한 서비스를 찾는 것도 방법이 될 수 있습니다.
작성자. 와이즈트래커 김명재
http://www.facebook.com/wisetracker