[카테고리:] Bigquery 함수
-
GA4 BigQuery를 분석할 때 쿼리 성능 저하를 일으키는 4가지 사례와 해결 방법
데이터브릭스(Databricks) 환경에서 GA4 BigQuery 데이터를 분석할 때, 쿼리 성능이 예상보다 느려지는 경우가 종종 발생합니다. 특히, 위젯을 활용한 변수 입력 방식이 성능 저하를 유발하는 경우를 직접 경험했습니다. 본 글에서는 데이터브릭스에서 쿼리 성능을 낮추는 대표적인 방식 4가지를 설명하고, 이를 해결하는 방법을 제시하겠습니다. 1. 데이터브릭스 위젯을 이용한 변수 입력 문제점 데이터브릭스의 dbutils.widgets 기능을 사용하여 변수를 설정한 후, 쿼리에서…
-
BigQuery 중급 가이드: 데이터 분석을 위한 필수 문법 정리
데이터 분석을 하다 보면 GA4의 BigQuery를 활용해야 하는 경우가 많습니다. BigQuery는 SQL 기반의 강력한 데이터 웨어하우스이지만, 기본적인 SQL 문법을 넘어서 BigQuery만의 특화된 기능을 익히는 것이 중요합니다. 이번 글에서는 중급자들이 반드시 알아야 할 BigQuery의 주요 문법과 활용법을 자세히 설명하겠습니다. 1. WITH 절을 활용한 CTE (Common Table Expressions) CTE(Common Table Expressions)는 복잡한 쿼리를 가독성 높게 작성할 수…
-
SQL에서 배열 다루기: 중복 제거와 활용법
SQL에서 데이터를 다룰 때, 하나의 컬럼에 여러 개의 값을 저장해야 하는 경우가 있습니다. 특히 JSON 데이터나 이벤트 로그 데이터를 다룰 때 배열(Array)을 사용하면 데이터를 효율적으로 관리할 수 있는데요. 하지만 배열을 사용할 때 중복된 값이 발생할 수 있어 이를 처리하는 방법이 필요합니다. 이번 포스팅에서는 SQL에서 배열을 다루는 이유, 중복 제거 방법, 그리고 배열 관련 SQL 함수들을…
-
GA4 BigQuery 데이터 분석: event_params vs user_properties 차이점 완벽 정리
1. GA4 BigQuery에서 이벤트 데이터의 구조 GA4의 데이터를 BigQuery에서 분석하다 보면 event_params와 user_properties라는 두 개의 중요한 배열 필드를 자주 마주하게 됩니다. 이 두 필드는 GA4의 이벤트 기반 데이터에서 핵심적인 역할을 하지만, 각각 다르게 동작하기 때문에 차이를 정확히 이해하는 것이 중요합니다. 이번 글에서는 event_params와 user_properties가 무엇인지, 어떤 데이터를 담고 있으며, 어떤 점이 다른지 상세하게 설명하겠습니다. 2.…
-
GA4 Bigquery UNNEST 활용 방식 3가지
GA4 데이터를 BigQuery에서 분석할 때, 반복 필드(repeated fields)와 일반 필드를 함께 조회하는 작업은 흔합니다. 특히 event_params에서 특정 키의 값을 추출하면서 다른 필드와 함께 분석하려면 UNNEST를 적절히 사용해야 합니다. 이번 글에서는 dimension3과 traffic_source.manual_source를 함께 조회하는 3가지 다른 방식의 쿼리를 소개합니다. 1. FROM 절에서 UNNEST 사용 예제 쿼리 설명 이 방법은 간단하고 직관적이어서 가장 널리 사용됩니다. 2.…
-
BigQuery 날짜형식 변환
BigQuery에서는 날짜와 시간을 다룰 때 다양한 함수들을 제공합니다. 날짜 형식을 변환하면서 해당 단위에 맞는 활성 사용자 수를 계산하는 SQL 쿼리 작성 방법을 단계별로 설명하겠습니다. 이 포스팅에서는 event_date 필드가 날짜 형식(DATE)이라고 가정하겠습니다. 1. 날짜 형식: 년월일 (YYYY-MM-DD) 활성 사용자 수를 날짜 단위로 집계하려면 날짜 필드를 그대로 사용하면 됩니다. SELECT event_date AS day, COUNT(DISTINCT user_id) AS active_usersFROM…
-
STRING_AGG 함수
STRING_AGG는 BigQuery에서 여러 행의 문자열을 하나의 문자열로 결합하는 데 사용되는 함수입니다. 특히, 데이터베이스에서 그룹화된 데이터를 하나의 문자열로 표현해야 할 때 유용합니다. 1. STRING_AGG 함수란? 2. STRING_AGG를 사용하는 이유 3. STRING_AGG의 사용 예시 예제 1: 고객 이름을 한 줄로 결합하기 고객 데이터를 관리하는 테이블이 있을 때, 특정 그룹의 고객 이름을 하나의 문자열로 요약할 수 있습니다. 데이터…
-
BigQuery의 UNNEST 함수란?
BigQuery에서 배열 데이터는 단일 필드 안에 여러 값을 포함할 수 있는 데이터 구조입니다. 이 배열을 그대로 두면 분석에 어려움이 있을 수 있으므로, 배열의 각 요소를 분리해 행(row) 형태로 변환해야 합니다. 이때 사용하는 함수가 바로 UNNEST 입니다. UNNEST를 사용하면 배열 데이터를 테이블처럼 다룰 수 있어 보다 효율적인 데이터 분석이 가능합니다. 📌 UNNEST 함수의 기본 사용 방법…