2023년 6월 30일부로 구글에서는 google analytics 3 UA 서비스가 모두 종료되었는데요. 7월 1일부터 운영되는 GA4에는 기존 GA3와는 많은 다른 변화가 생겨서 머리가 복잡하실겁니다. 물론 스크립트 설치는 기존과는 큰 차이가 없지만 기존의 데이터 수집 방식이 달라져서 데이터가 크게 변화했다던지, GA3에는 있었지만 GA4에는 없어진 부분이라던지 바뀐 부분이 많으실 겁니다. GA3와 GA4의 차이를 간략하게 비교해 보겠습니다.
GA3, GA4 구조적 차이점
(1) 데이터 모델의 차이
사실 마케터들이나 데이터를 분석하시는 분들 입장에서 가장 크게 생각하는 것은 데이터 방식일 텐데요.
GA3의 데이터 방식은 페이지뷰(Hit) 기반으로 데이터를 수집했던 세션 중심의 데이터 모델인 반면, GA4는 다양한 유형의 개별 이벤트 히트에 기반한 이벤트 중심의 데이터 모델로 바뀌었습니다.
또한 향상된 측정이라고 해서 스크롤, 사이트 검색, 유튜브 조회, 파일 다운로드 등 일부 이벤트 데이터 또한 별도의 코드 추가 없이 한 번의 클릭만으로 측정이 가능하도록 새로운 기능이 생겼습니다.
(2) 탐색(GA3에서는 맞춤 보고서)
기존 UA에서는 표 형식의 맞춤 보고서만 가능했다면 GA4에서는 분석 목적에 따라 표, 세그먼트 분석, 사용자 전체 기간 보고서, 유입경로 탐색 분석, 경로탐색분석, 동질 집단 탐색 분석, 사용자 전체 기간 보고서 등 총 7개의 다양한 유형의 보고서를 활용할 수 있는 장점이 있습니다.
(3) 구글 빅쿼리 연동
대규모 데이터 세트에 대한 쿼리를 신속하게 처리할 수 있는 클라우드 데이터 웨어하우스인 구글 빅쿼리의 연동을 통해 ga4속성에서 수집된 Raw 데이터를 수집해서 보관, 추출 가능하는 기능이 무료로 제공된다고 하네요(실제로 사용해 보니 무료는 아니니 지양합니다.. 그냥 API 쓰세요)
여기까지 간단하게 GA3에서 GA4로 바뀌면서 개선되거나 변경된 내용들을 다뤄봤는데요.
저는 여기서 더 Deep 하게 들어가지 않고 제가 사용하고 있는 API에 대해 알려드리려고 해요.
GA3, GA4 API 차이
API를 간략하게 설명을 하자면 두 소프트웨어 구성 요소가 서로 통신할 수 있게 하는 메커니즘입니다.
쉽게 이야기하자면 구글, 네이버, 카카오의 데이터베이스에 저장한 데이터를 API를 통해 직접 접근해 추출하는 방식을 뜻합니다.
그래서 각 매체의 대시보드에 들어가서 추출하기를 하지 않아도 API를 통해 데이터를 가공 처리해서 WEB 프론트에 보일 수도 있고 직접 코딩을 통해 추출할 수 있죠.
일단 결론부터 말씀드리자면 저는 리눅스 서버에서 API 데이터를 통해 매일 아침 오전 8~9시 사이에 20개 이상의 계정 데이터를 받고 있습니다.
완벽한 100% 자동화는 아니지만(GCP 서버로 접근할 때 timeout이 걸릴 수 있어요) 생각보다 많이 안정적인 상태입니다. 물론 GA360은 내년까지 운영하고 있어 같이 데이터를 받고 있어요.
자 그러면 이 이야기를 한 이유는, 보통 API를 사용하시는 분들은 마케팅 대행업체의 개발자분들일 겁니다.
그리고 계정은 광고주 계정이겠죠? 그런데 광고주는 계정을 대행사에게 주기보다는 계정을 추가해 주는 형식으로 주지만, GCP의 서비스 계정을 추가해 준다면 더욱 쉽게 API를 사용할 수 있겠지만, 보통의 경우 VIEW(read권한)만 주는 경우가 많습니다.
이럴 경우는 GCP에서 접근인증을 앱 애플리케이션 인증을 받아서 인증형식을 진행해야 하는데요(PHP의 경우는 앱 애플리케이션인증을 사용할 수 있지만 데스크톱 방식은 사용이 불가능하고, 파이썬의 경우는 그 반대입니다.)
저 같은 경우는 PHP를 이용한 API 사용이었기 때문에 앱 애플리케이션 인증을 통한 인증방식을 사용하였는데요.
토큰 인증을 통해서 보통 3600분을 사용하면 만료되는 토큰을 사용하였습니다.
물론 다른 방식도 있겠지만 현재 구글이 릴리즈한 GA4 API은 베타버전이라 아직까지 다른 기발한 방법은 없어 보이네요. (물론 정식버전이 나오면 새로 구축을 해야 하겠지만 보통 베타버전도 사용할 수 있도록 내버려 두니 걱정 안 하셔도 됩니다.)
아 그리고 이 인증방식은 GA 뿐만 아니라 구글 애즈(ads)에서도 동일하게 사용하고 있어서 인증에 대한 관리나 유지보수는 현재 걱정 없이 동작되고 있으니 추천드리는 방식입니다.
GA4 탐색
GA3의 ‘맞춤 보고서’와 비슷한 기능인 ‘탐색’이 예전 맞춤보고서보다 좀 더 개선된 기능이라고 위에서 설명해 드렸는데요.
하지만 API를 사용하시는 분들, 그리고 탐색 기능에 초점을 두고 업무를 진행하시는 분들이 참고하셔야 할 부분이 있습니다.
(1) 하이퍼 알고리즘
직역하자면 ‘초사실주의’라는 뜻으로, 이러한 뜻을 가진 알고리즘 기반을 통해 ‘탐색’기능의 데이터를 대시보드상에 보여주게 되는데요.
좀 더 풀어서 말하자면 과거의 데이터 기반으로 하이퍼 알고리즘을 통해 탐색 메뉴에 데이터를 보여주는 방식이 GA4에 적용되고 있습니다.
이러한 기능을 통해 이전 ‘맞춤 보고서’와 확연하게 속도면에서 많이 개선된 부분이 있는데요. 속도면에서의 장점은 있지만 데이터 정확도에서는 조금 단점이 보입니다.
예를 들어 어제자의 데이터를 오늘 검색했을 때와, 5일 후에 검색했을 때에 다른 경우도 있죠. 이 이유는 하이퍼알고리즘이 예측 및 가정하는 부분이 있기 때문에 오차가 있기 때문이죠.
그리고 예전 GA3와는 다르게 데이터 수집을 그 전날 다 하는 게 아니고 최대 7일간을 거쳐서 계속 데이터를 수집한다고 합니다.
이 문제점들은 API로 데이터를 추출하거나 빅쿼리로 데이터를 수집 추출한 데이터와 탐색 데이터가 차이가 있어 문제가 발생하게 되는데요.
이제는 GA4 데이터로 주간 데이터를 정리할 때에 정확도가 많이 떨어진다고 볼 수 있겠습니다.
하지만 데이터가 많지 않을 때는 큰 차이가 없겠지만, 하루 데이터 양이 많을 때 문제가 발생하니 개인적으로 사용하시는 분들은 걱정 안 하셔도 될 것 같습니다.
GA4 넘어가면서 어려웠는데 도움 받았습니다 내용 추가적으로 보여주세요!
GA4근데 아직 이슈가 좀 많은거 같은데 보고서 문제 많았는데 하이퍼알고리즘 알려주셔서 감사합니다
Informative comparison of GA4 and Google Analytics 4. This really helps in choosing the right tool for analytics. Appreciate it.
제목을 보면 GA4와 이전 버전인 구글 애널리틱스와의 비교 분석인 것 같네요. 새로운 GA4의 기능과 성능이 궁금하군요. 어떤점이 개선되었는지 비교 분석한 글을 읽어보면 유익할 것 같아요. 블로거 분의 분석 기대돼요! 👀📊
제목을 보니 GA4(Google Analytics 4)에 대한 비교 분석이군요. Google Analytics의 새로운 버전에 대한 정보는 늘 유용하죠. 어떤 기능이 추가되었는지, 어떤 점이 개선되었는지 알아보는 건 중요합니다. 기사를 읽는 동안 즐거운 시간 보내시길 바라요! 😊
GA4 비교 분석이 잘 정리되어 있습니다.
GA4 비교 분석 글이 매우 흥미롭습니다. 다양한 기능과 특징이 잘 정리되어 있어 많은 도움이 됩니다.