DATA 속에서 기회를 찾길 바래
-
실무 데이터 분석에서 자주 쓰는 기술 통계: 평균값, 최빈값, 중앙값 완벽 이해하기
데이터 분석 업무를 하다 보면 보고서 작성이나 지표 모니터링을 위해 기술 통계를 자주 사용하게 됩니다. 그 중에서도 가장 기초적이고 자주 쓰이는 지표가 바로 **평균값(Mean), 중앙값(Median), 최빈값(Mode)**입니다. 이번 글에서는 실제 데이터를 바탕으로, 각 지표가 어떤 상황에 유용한지 그리고 SQL 쿼리를 어떻게 작성해야 하는지를 예시와 함께 상세히 설명하겠습니다. 📂 분석 데이터 소개: 유저 구매 내역 테이블 예시…
-
📊 GA4 BigQuery에서 자주 사용되지만 실수하기 쉬운 함수들
GA4 데이터를 BigQuery에서 분석하다 보면 자주 사용하게 되는 함수들이 있습니다. 하지만 아무리 자주 쓰는 함수라도, 조금만 방심하면 오류가 발생하거나 잘못된 결과를 만들어낼 수 있습니다. 이 글에서는 실무에서 자주 활용되면서도 쉽게 실수할 수 있는 함수들을 소개하고, 잘못된 사용 예와 올바른 사용 예를 비교하며 설명해 드리겠습니다. 1. UNNEST() – 배열 펼치기에서 별칭 누락 실수 GA4 이벤트 데이터에는…
-
데이터 분석가 이직을 위한 필수 코딩 테스트 가이드
데이터 분석가가 이직할 때 피할 수 없는 관문 중 하나가 바로 SQL 코딩 테스트입니다. 경력직 중급 데이터 분석가들이 자주 접하는 고급 SQL 중급 테스트 문제 3가지와 접근법을 알려드릴게요. 문제 1: 사용자의 연속 방문일 수 분석 문제: 사용자의 방문 이력이 담긴 테이블(visit_history)이 있습니다. 각 사용자의 최장 연속 방문일 수를 계산하여 사용자 ID와 함께 조회하세요. 테이블 예시…
-
인과 추론(Causal Inference)이란 무엇인가?
데이터 분석을 하다 보면 어떤 요인이 다른 요인에 영향을 미치는지 정확하게 알고 싶을 때가 있습니다. 이런 분석을 ‘인과 추론(Causal Inference)’이라고 합니다. 인과 추론은 단순히 두 사건이 함께 나타나는 상관관계를 넘어서서, 원인이 되는 요인이 실제로 결과에 직접 영향을 미치는지를 명확히 밝히고자 하는 방법입니다. 인과 추론이 중요한 이유는 정책 수립이나 비즈니스 의사결정 과정에서 잘못된 결론을 내리지 않도록…
-
마케터를 위한 BigQuery 입문: 기초부터 실무 예시까지
1. BigQuery란? 2. 왜 마케터가 BigQuery를 써야 할까? 3. BigQuery 시작하기 4. 기본 SQL 문법 정리 5. 실무 예시: GA4 데이터 분석 6. BigQuery에서 자주 쓰는 함수 7. 비용과 주의사항
-
브레이즈(Braze)를 활용한 푸시 & 인앱 메시지 분석 완벽 가이드
브레이즈(Braze)를 활용한 푸시 & 인앱 메시지 분석 완벽 가이드 푸시와 인앱 메시지의 사용 목적과 타이밍 브레이즈(Braze)를 통해 제공하는 푸시 메시지와 인앱 메시지는 각각 사용자의 행동과 상황에 따라 적절하게 사용해야 최대의 효과를 얻을 수 있습니다. 1. 푸시 메시지 (Push Message) 2. 인앱 메시지 (In-App Message) 메시지 발송 이후 운영 방법 푸시와 인앱 메시지 발송 이후에는 반드시…
-
실무 데이터 분석을 위한 필수 파이썬 라이브러리 TOP 5
파이썬은 데이터 분석 분야에서 가장 널리 사용되는 프로그래밍 언어입니다. 이번 포스팅에서는 실무에서 반드시 알아야 할 핵심 파이썬 라이브러리 5가지를 소개하고, 각각의 특징, 활용 상황, 분석 방법과 예제 코드를 상세히 설명합니다. 1. Pandas 특징: 활용 상황 및 분석 방법: 예시 코드: 2. NumPy 특징: 활용 상황 및 분석 방법: 예시 코드: 3. Matplotlib 특징: 활용 상황…
-
빅쿼리(BigQuery)를 사용할 때 사소하지만 꼭 챙겨야 할 부분들
빅쿼리를 자주 사용하는 분들이라도 의외로 놓치는 부분들이 있습니다. 사소하지만 작업 효율성, 비용, 데이터 정확성 측면에서 매우 중요하기 때문에 이번 글에서는 놓치기 쉬운 부분들을 친절하게 하나씩 짚어 드리겠습니다! 1. 날짜 조건 꼭 추가하기 왜 꼭 해야 하나요? 빅쿼리는 기본적으로 쿼리하는 데이터의 양에 따라 비용이 발생합니다. 날짜 조건을 명확히 설정하지 않으면 불필요한 데이터까지 스캔하게 되어 불필요한 비용이…
-
Bigquery로 살펴보는 GA 동질 집단 분석
동질 집단 분석(Cohort Analysis)이란? 동질 집단 분석(Cohort Analysis)이란 특정 기간 동안 공통된 특성을 가진 사용자 그룹(동질 집단)을 정의하고, 시간에 따른 이들의 행동 변화를 분석하는 방법입니다. 예를 들어, 같은 날 앱을 설치한 사용자들, 같은 캠페인을 통해 유입된 사용자들, 같은 시기에 구매를 진행한 사용자 등을 하나의 동질 집단으로 분류하고 이들의 시간 경과에 따른 행동 변화(예: 재방문율, 재구매율,…
-
GA4 BigQuery 데이터를 활용한 코호트 분석 방법 총정리
1. 코호트 분석이란? 코호트 분석(Cohort Analysis)은 특정한 공통점을 가진 사용자 그룹(코호트)을 시간의 흐름에 따라 관찰하고, 그 그룹의 행동 변화를 분석하는 방법입니다. 주로 사용자의 첫 방문 날짜, 회원 가입 날짜, 최초 구매일 등 특정 시점을 기준으로 그룹을 나누고, 이후 사용자의 행동 패턴(유지율, 재방문율, 재구매율 등)을 측정하는데 사용됩니다. 예를 들어, 1월에 가입한 사용자들과 2월에 가입한 사용자들의 서비스…
-
GA4 Bigquery 리텐션 분석
리텐션 분석이란? 리텐션(Retention)은 특정 시점에 유입된 사용자가 일정 시간이 지난 후에도 다시 서비스나 사이트를 방문하는 비율을 나타내는 지표입니다. 리텐션 분석은 서비스의 지속 가능성, 사용자 경험의 질, 마케팅 전략의 효과성을 측정하는 핵심 지표로 활용됩니다. 즉, 얼마나 많은 사용자가 서비스를 재방문하는지 파악하여 고객의 충성도와 서비스의 매력을 평가할 수 있습니다. 리텐션 분석이 중요한 이유 GA4 BigQuery 데이터를 활용한…
-
빅쿼리 윈도우 함수 LEAD와 LAG
GA4 데이터를 사용하여 특정 페이지를 기준으로 사용자가 이전에 방문했던 페이지와 다음으로 이동한 페이지를 분석할 때는 BigQuery의 윈도우 함수(Window function)인 LEAD()와 LAG()를 사용하면 편리합니다. ✅ 1. 데이터 준비 (user_pageviews CTE) ✅ 2. 순서 및 이전/다음 페이지 지정 (ordered_pageviews CTE) 윈도우 함수 설명 ✅ 3. 특정 페이지 기준으로 데이터 필터링 ✅ 4. 최종 결과 확인 이 쿼리를…
추천 예약이 있으신가요?