RAG를 통한 LLM 정확도 향상(2)
벡터 데이터베이스(ChromaDB)를 활용하여 RAG 파이프라인을 구현하는 방법을 설명하며, 문서를 임베딩 벡터로 저장하고 유사도 기반 검색을 수행하는 과정을 코드와 함께 상세히 다룹니다.
벡터 데이터베이스(ChromaDB)를 활용하여 RAG 파이프라인을 구현하는 방법을 설명하며, 문서를 임베딩 벡터로 저장하고 유사도 기반 검색을 수행하는 과정을 코드와 함께 상세히 다룹니다.
텔레그램은 보안과 속도에 주안점을 둔 클라우드-기반 모바일과 데스크톱 Message App으로 전세계 인구 중 약 10억 정도가 사용하는 것으로 확인됩니다. 텔레그램 특징 중 “개방성”은 누구나 무료 활용 가능한 오픈 API로 이를 활용하여 간단한 시스템 모니터링을 구축할 수 있습니다.
비즈스프링은 고객사에서 운영하는 광고매체들의 성과 데이터를 통합하고, GA4 분석 데이터와 매칭 및 결합한 후, 데이터를 고객사의 저장소에 적재할 수 있도록 데이터 엔지니어링 서비스를 제공하고 있습니다. 자사 저장소에 저장하기에 다양한 방면으로 활용 가능한 환경을 만들 수 있습니다.
근래 데이터 흐름의 변화로, 대량의 데이터를 빠르게 읽어오고 표현하기 위해 매체통합 리포트 조회 시, Logstash가 아닌 Elasticsearch Bulk API를 이용하여 더욱 더 간단하게 Elasticsearch에 데이터를 저장할 수 있도록 변경하였습니다. 이에 대해 알아봅니다.
ETL은 데이터를 추출(E), 변환(T), 적재(L) 순으로 데이터를 처리하는 프로세스입니다. ELT는 데이터를 추출(E), 로드(L) 및 변환(T)을 하는 프로세스를 의미하며, 위에 언급한 ETL의 T와 L의 위치가 바뀐 개념으로 생각하시면 됩니다.
다들 즐거운 연말 보내셨나요? 😀 참으로 다사다난했던 2022년을 떠나보내며, 한 해 동안 비즈스프링과 함께해 주신 여러분들과 함께 2022년의 비즈스프링 콘텐츠를 결산하며 주요 이슈들을 돌아보고자 합니다. 조회 수가 많았던 콘텐츠들을 살펴보며 시장에서는 어떠한 키워드에 관심을 기울이고 있는지, 또 어떠한 내용들을 준비하고 있는지를 살펴보고, 비즈스프링과 함께 무엇을 준비할 수 있는지를 알아보도록 하겠습니다.… 더 보기 »비즈스프링 콘텐츠로 돌아보는 2022년 이슈
세그먼트 설정을 완료하면 타깃 오디언스(Target Audience)를 생성하게 됩니다. 오디언스(Audience) 란? 온라인 마케팅에서는 고객 및 잠재적 고객으로서 마케팅 메시지를 듣게 될 특정 대상들을 뜻합니다. 마케팅 실행의 대상이고 템플릿에 의한 결과물로 볼 수 있습니다.
빅쿼리에서 정제 테이블을 생성하는데 정제 테이블에서 바로 조회하지 않고 엘라스틱서치 서버에 데이터를 옮겨서 사용하는 이유에 대해서 질문을 가지실 수 있습니다. 엘라스틱서치에 데이터를 저장하는 가장 큰 이유는 “비용”과 “검색 속도”가 있습니다.
사용자가 사용할만한 세그먼트를 미리 정의하여 ‘트레이트’ 라는 이름으로 분류하고 생성해야, 이후 세그먼트 생성 시 간편하게 사용할 수 있습니다. user, land(페이지 이동간 정보), event(특정 전환) 와 같은 원천 데이터에서 트레이트를 가공 및 생성하여 사용합니다.
실시간으로 수집된 데이터를 확인할 수 있게 해주는 파이프 라인 도구 “Logstash”에 대해 알아보겠습니다. 그 전에 먼저 ELK에 대해 정리하겠습니다. ELK는 Elasticsearch, Logstash 및 Kibana 의 오픈 소스 프로젝트의 앞 글자를 가져와 만든 단어입니다.