비즈스프링 쇼츠 광고시스템 기술적 관점으로 살펴보기 (3)
비즈스프링의 애드몬스터 쇼츠 광고시스템의 기술적 측면, 특히 광고 성과의 정제 및 집계 과정을 다루며, Elasticsearch, Redis, Kafka Streams, MariaDB ColumnStore 등의 기술을 활용한 광고 소재 선별부터 리포트 데이터 생성까지의 전체 프로세스를 설명합니다.
비즈스프링의 애드몬스터 쇼츠 광고시스템의 기술적 측면, 특히 광고 성과의 정제 및 집계 과정을 다루며, Elasticsearch, Redis, Kafka Streams, MariaDB ColumnStore 등의 기술을 활용한 광고 소재 선별부터 리포트 데이터 생성까지의 전체 프로세스를 설명합니다.
오픈 소스 라이센스는 소프트웨어의 자유로운 사용과 개발자의 권리 보호 사이의 균형을 맞추는 중요한 도구로, 상업적 이익과 오픈 소스 철학 사이의 갈등이 발생할 수 있습니다. 따라서 개발자는 GPL, LGPL, Apache, BSD, MIT 등 다양한 라이센스의 특성과 조건을 정확히 이해하고 프로젝트에 적합한 라이센스를 선택해야 합니다.
Elasticsearch를 기반으로 RAG 구현을 위한 벡터 데이터베이스를 구성하는 방법을 소개하며, 도커를 통한 Elasticsearch 설치부터 파이썬 클라이언트를 이용한 인덱스 생성, 문서 저장 및 검색 예시까지 단계별로 설명합니다.
Elasticsearch의 ILM(Index Lifecycle Management) 정책을 활용하여 데이터 보관 기간 및 관리 방안을 자동화함으로써 효율적인 클러스터 운영과 리소스 최적화를 실현할 수 있습니다.
근래 데이터 흐름의 변화로, 대량의 데이터를 빠르게 읽어오고 표현하기 위해 매체통합 리포트 조회 시, Logstash가 아닌 Elasticsearch Bulk API를 이용하여 더욱 더 간단하게 Elasticsearch에 데이터를 저장할 수 있도록 변경하였습니다. 이에 대해 알아봅니다.
이번 포스팅은 AIR에서 Elasticsearch를 사용하여 리포트 생성하는 방법을 소개하려 합니다. AIR의 기본 리포트는 필터, 차트, 데이터 테이블 세 가지의 구성으로 되어있습니다. 이 구성을 통해 하나의 리포트가 생성되며, 사용되는 데이터들은 API를 사용하여 전달받고 있습니다.
쿼리를 생성하기 전 AJAX를 이용하여 API를 통해 데이터 요청부터 진행하게 됩니다. AJAX란 JavaScript를 사용한 비동기 통신으로 클라이언트와 서버간에 XML 데이터를 주고받는 기술입니다. 클라이언트에서 서버로 데이터를 요청하고 그에 대한 결과를 돌려받을 수 있습니다.
이번 포스팅에서는 AIR(매체통합리포트)에서 Elasticsearch를 사용하기 위해 필요한 데이터 구성에 대해 소개하려고 합니다. AIR(매체통합리포트)는 Elasticsearch로 조회한 데이터로 차트와 데이터 그리드 영역을 그리도록 구성되어 있습니다.
빅쿼리에서 정제 테이블을 생성하는데 정제 테이블에서 바로 조회하지 않고 엘라스틱서치 서버에 데이터를 옮겨서 사용하는 이유에 대해서 질문을 가지실 수 있습니다. 엘라스틱서치에 데이터를 저장하는 가장 큰 이유는 “비용”과 “검색 속도”가 있습니다.
AIR에서 제공하는 수많은 리포트들은 어떤 과정으로 화면에 그려지고 있는지 궁금하지 않으신가요? AIR의 신속한 리포팅이 가능한 이유는 바로 Elasticsearch로 데이터를 빠르게 검색 및 집계하기 때문입니다. Elasticsearch를 사용하여 진행하는 과정에 대해 알아봅시다.