AIR에서 Elasticsearch를 사용하기 위한 데이터 구성은 어떻게 할까?
이번 포스팅에서는 AIR(매체통합리포트)에서 Elasticsearch를 사용하기 위해 필요한 데이터 구성에 대해 소개하려고 합니다. AIR(매체통합리포트)는 Elasticsearch로 조회한 데이터로 차트와 데이터 그리드 영역을 그리도록 구성되어 있습니다.
이번 포스팅에서는 AIR(매체통합리포트)에서 Elasticsearch를 사용하기 위해 필요한 데이터 구성에 대해 소개하려고 합니다. AIR(매체통합리포트)는 Elasticsearch로 조회한 데이터로 차트와 데이터 그리드 영역을 그리도록 구성되어 있습니다.
BigQuery를 이용한 데이터 처리 프로세스에 대해서 살펴본 것에 이어, Growth Platform에서의 매체별 API는 어떻게 제공되는지 그 과정을 공유합니다. 네이버, 카카오, 구글의 광고 매체 데이터는 REST API를 통해 가져옵니다. 광고 매체의 API 서버에 Growth Platform의 매체 데이터를 생성하기 위한 데이터를 요청하고 응답받아 BigQuery에 적재합니다. REST API는 Representational State Transfer의 약자로 인터넷 상의 컴퓨터 시스템 간 상호 운용성을 제공하는 방법 중 하나로, 웹의 장점을 최대한 활용할 수 있는 아키텍쳐입니다.
CAPTCHA(완전 자동화된 사람과 컴퓨터 판별, 캡차)는 현재의 컴퓨터 (인공지능) 기술로는 인식이 어렵도록 작성한 문제를 내고, 답안을 제출 받도록 하여 자동화된 기계 프로그램을 무력화 하는 기술입니다.
ETL은 데이터를 추출(E), 변환(T), 적재(L) 순으로 데이터를 처리하는 프로세스입니다. ELT는 데이터를 추출(E), 로드(L) 및 변환(T)을 하는 프로세스를 의미하며, 위에 언급한 ETL의 T와 L의 위치가 바뀐 개념으로 생각하시면 됩니다.
세그먼트 설정을 완료하면 타깃 오디언스(Target Audience)를 생성하게 됩니다. 오디언스(Audience) 란? 온라인 마케팅에서는 고객 및 잠재적 고객으로서 마케팅 메시지를 듣게 될 특정 대상들을 뜻합니다. 마케팅 실행의 대상이고 템플릿에 의한 결과물로 볼 수 있습니다.
빅쿼리에서 정제 테이블을 생성하는데 정제 테이블에서 바로 조회하지 않고 엘라스틱서치 서버에 데이터를 옮겨서 사용하는 이유에 대해서 질문을 가지실 수 있습니다. 엘라스틱서치에 데이터를 저장하는 가장 큰 이유는 “비용”과 “검색 속도”가 있습니다.
사용자가 사용할만한 세그먼트를 미리 정의하여 ‘트레이트’ 라는 이름으로 분류하고 생성해야, 이후 세그먼트 생성 시 간편하게 사용할 수 있습니다. user, land(페이지 이동간 정보), event(특정 전환) 와 같은 원천 데이터에서 트레이트를 가공 및 생성하여 사용합니다.
SEO(Search Engine Optimization)란 “검색 엔진 최적화”를 의미하는데요, 검색 엔진 결과를 통해 웹사이트 트래픽의 질과 양을 늘리고 브랜드 노출을 늘리는 방법입니다. 나아가 사람들이 무엇을 검색하는지, 찾고 있는 답변, 소비하는 콘텐츠 유형을 이해할 수 있습니다.
데이터들은 원천 데이터의 생산 주체가 누구인가에 따라 자사/1사(1st party) 데이터와 3사(3rd party) 데이터로 나눕니다. 3사 데이터를 획득하는 방법 중 하나인 크롤링에 대해 알아보고, 자동화 툴 인 selenium을 이용한 크롤러를 만드는 예제를 알려드리겠습니다.
UTM으로 유입된 딥링크(Deep Link) 성과 분석에 대해 공유하고자 합니다. 딥링크는 특정 주소 혹은 값을 입력하면 앱이 실행되거나 특정 화면으로 이동시키는 기능을 수행합니다. 즉, 딥링크가 사용되면 광고에 반응한 이용자는 앱이 바로 실행되어 특정 화면으로 바로 이동하게 됩니다.