디지털 분석에서 데이터 거버넌스의 중요성
게시 됨: 2023-04-17디지털 분석에서 조직은 데이터를 수집, 해석 및 보고하는 데 상당한 시간을 소비합니다. 가장 중요한 목표는 데이터를 경쟁 우위로 활용하는 것입니다. 데이터를 사용하여 디지털 광고 효과를 개선하거나 디지털 제품을 개선할 수 있습니다. 그러나 데이터를 활용하기 전에 올바른 데이터가 있는지 확인해야 합니다. 부정확한 데이터를 기반으로 결정을 내리는 것은 데이터 없이 결정을 내리는 것보다 낫지 않습니다. 우수한 데이터 거버넌스의 중요성을 간과하기 쉽습니다. 데이터 거버넌스는 종종 우선 순위를 낮출 수 있는 힘든 작업으로 간주되지만 이는 실수입니다. 이 게시물에서는 디지털 분석의 장기적인 성공에 필수적인 몇 가지 데이터 거버넌스 기능을 간략하게 설명합니다.
데이터 거버넌스는 초기 구현 그 이상입니다.
우수한 디지털 분석 데이터를 확보하는 가장 좋은 방법은 제대로 구현하는 것입니다. 조직이 디지털 분석 이벤트 및 속성을 계획하고 구현하는 데 소비하는 시간은 신뢰할 수 있는 데이터를 확보하는 데 필수적입니다. 데이터 품질을 확인하기 위해 초기 구현 중에 여러 품질 보증 및 테스트 수준이 종종 발생합니다. 그러나 초기 구현 후 많은 조직에서 디지털 분석 데이터 품질이 저하된다는 사실을 알게 되었습니다. 데이터 품질 저하는 종종 더 많은 데이터 거버넌스가 필요하기 때문에 발생합니다. 초기 배포는 조직 내에서 중요할 수 있지만 데이터 거버넌스는 덜 매력적입니다. 구현 및 데이터 거버넌스가 우수한 데이터 품질이라는 동일한 목표를 가지고 있지만 많은 조직은 후자보다 전자에 더 중점을 둡니다.
조직에서 데이터 거버넌스를 잘 수행하지 못하는 이유 중 하나는 사용하는 디지털 분석 제품이 데이터 거버넌스 기능에 충분히 투자하지 않았기 때문입니다. 시장에 나와 있는 많은 주요 디지털 분석 제품에는 기본적인 데이터 거버넌스 기능이 없습니다. 이러한 거버넌스 기능의 부족은 데이터 거버넌스가 디지털 분석 프로그램과 관련된 모든 것을 뒷받침하기 때문에 안타까운 일입니다.
구현 솔루션 설계
디지털 분석 구현에서 수집하는 데이터를 이해하는 것이 중요합니다. 조직에서 수집하기로 선택한 이벤트와 속성을 식별하고 전달하는 것만으로도 충분합니다. 불행히도 많은 디지털 분석 공급업체는 스프레드시트를 사용하여 분석 솔루션에 있는 내용을 공유합니다. 스프레드시트의 추적 구현 솔루션에는 다음과 같은 단점이 있습니다.
- 정보는 디지털 분석 제품 및 보고서와 분리됩니다.
- 솔루션 설계의 여러 버전이 조직 전체에 퍼져 있어 어떤 버전이 현재 버전인지 파악하기 어려울 수 있습니다.
- 스프레드시트는 각 솔루션 디자인 요소의 상태를 알려줄 수 없습니다(예: 현재 데이터를 수집하고 있습니까?).
항상 최신 정보를 볼 수 있도록 디지털 분석 제품 인터페이스에 모든 솔루션 정보를 직접 포함하는 것이 좋습니다.

또한 여러 사람이 동시에 가능하면 솔루션 설계를 반복할 수 있는 경우에도 유용합니다. 이상적으로는 GitHub를 사용하는 경우처럼 "브랜치"를 통해 솔루션 설계 반복을 관리할 수 있습니다.

데이터 스키마 검증
데이터 거버넌스의 또 다른 중요한 측면은 데이터 스키마 유효성 검사입니다. 스키마 유효성 검사의 한 구성 요소는 수집 중인 데이터가 예상한 데이터인지 확인하는 자동화된 확인입니다. 이는 디지털 분석 팀 구성원이 종종 바쁘고 새 이벤트나 속성이 구현에 전송되는 시기를 사전에 모니터링할 시간이 없기 때문에 중요합니다. 예기치 않은 이벤트 추적은 솔루션 설계를 인식하는 디지털 분석 제품에서 더 잘 처리됩니다. 자동화를 통해 디지털 분석 제품은 예상치 못한 이벤트나 속성이 발견되면 팀에 경고할 수 있습니다. 이러한 예기치 않은 항목은 검토될 때까지 검역되므로 생산 데이터를 오염시키지 않습니다.

데이터 스키마 유효성 검사의 또 다른 기능은 수집된 데이터 값이 예상 형식과 일치하는지 확인하는 기능입니다. 예를 들어 숫자를 의미하지만 텍스트 문자열이 전달되는 데이터 속성이 있는 경우 자동으로 플래그가 지정되어야 합니다. 따라야 하는 특정 우편 번호 형식이 있는 경우 데이터가 일관되도록 각 값을 확인해야 합니다. 데이터 스키마 유효성 검사와 관련하여 "1온스의 예방은 1파운드의 치료 가치가 있습니다!"

개체 관리
조직의 사람들이 디지털 분석 제품을 사용할 때 어떤 분석 구성 요소가 올바른지 아닌지 파악하기 어려울 수 있습니다. 종종 사용자는 시도하기 위해 새로운 코호트, 메트릭 등을 생성하지만 구현 소유자가 이를 확인하지 않았습니다.
개체 관리는 디지털 분석 개체를 구현 내에서 "공식"으로 표시하는 프로세스입니다. 아래와 같이 적절한 자격 증명을 가진 누군가가 해당 개체를 승인했음을 나타내기 위해 개체에 일부 표시기(예: 파란색 체크)를 할당할 수 있습니다. 공식 개체는 신뢰할 수 있고 올바른 것으로 간주될 수 있습니다.

개체 관리는 디지털 분석 구성 요소를 선택할 때 추측을 없애고 여러 사용자가 보고서와 대시보드에 비공식 개체를 퍼뜨리는 것을 방지합니다.
개체 중복 제거
개체 중복 제거는 개체 관리와 밀접하게 관련되어 있습니다. 디지털 분석의 가장 성가신 측면 중 하나는 동일한 분석 개체의 여러 버전이 확산된다는 것입니다. 이러한 개체는 계산된 메트릭, 코호트 등일 수 있습니다. 개체 관리가 이를 최소화하는 데 도움이 될 수 있지만 분석 사용자가 다양한 버전의 분석 개체를 생성할 수 있는 경우가 많습니다. 이러한 서로 다른 버전은 여러 보고서 또는 대시보드와 연결될 수 있습니다. 이 문제는 분석 개체의 정의 또는 공식에서 결함이 발견될 때 악화됩니다. 한 곳에서 수정하는 대신 조직은 서로 다른 모든 버전을 찾아 각각 개별적으로 수정해야 합니다. 이는 거버넌스의 악몽이 될 수 있습니다!
고급 분석 제품(예: Amplitude!)은 이 중복 제거 문제를 직접 해결했습니다. 중복 제거를 방지하는 가장 좋은 방법은 사용자가 중복 객체를 생성하지 못하도록 하는 것입니다. 아래와 같이 사용자가 정확한 복제본을 만들려고 하면 디지털 분석 제품에서 저장을 금지합니다.

개체 사용
디지털 분석을 구현하는 조직은 종종 다양한 이벤트와 속성을 구현합니다. 모든 팀에는 수집하려는 추가 데이터가 있습니다. 데이터 요소가 많은 경우 가장 많이 사용되거나 가장 적게 사용되는 데이터 요소를 이해하기 어려울 수 있습니다. 많은 디지털 분석 제품은 개체 사용을 난독화하여 상황을 악화시킵니다. 일부 디지털 분석 제품에서 어떤 개체가 어디에서 누구에 의해 사용되는지 이해하려면 관리자가 CSV를 통해 사용 데이터를 다운로드하고 보고서를 생성해야 합니다.
최신 디지털 분석 제품을 사용하면 다음과 같이 모든 디지털 분석 이벤트 또는 속성이 사용되는 위치를 쉽게 이해할 수 있습니다.


이 정보는 또한 이벤트나 속성을 사용하여 특정 사람과 개체를 보려면 보다 자세한 수준에서 표시되어야 합니다.

이 정보를 마음대로 사용하면 구현 관리자와 관리자가 다음을 수행할 수 있습니다.
- 분석 사용자가 참여하는 이벤트 및 속성 보기
- 일부 이벤트 및 속성이 사용 부족으로 인해 추가 교육이 필요한지 확인합니다.
- 더 이상 필요하지 않은 이벤트 및 속성 제거 고려
분석 이벤트 이해
디지털 분석 구현의 일반적인 문제는 일반 최종 사용자가 각 분석 이벤트의 의미를 완전히 확신하지 못한다는 것입니다. 개발자는 이해할 수 없는 이벤트 이름(예: form_reaction)을 만드는 것으로 유명합니다. 많은 분석 사용자는 구현 프로세스에 관여하지 않으며 분석 이벤트의 이름이 지정된 방법과 이유에 대한 배경 정보가 없습니다. 따라서 최종 사용자가 분석을 위해 올바른 이벤트를 사용하도록 돕기 위해 관리자 또는 관리자가 할 수 있는 모든 작업은 대단히 감사합니다.
이를 해결하는 한 가지 방법은 데이터 사전을 만드는 것입니다. 여기에서 사용자는 각 분석 이벤트에 대해 알아보고 웹사이트 또는 모바일 앱의 위치를 확인할 수 있습니다. 데이터 사전은 문서 또는 Confluence나 Miro와 같은 공유 공간에 저장할 수 있습니다.
Amplitude에서는 구현과 해당 이벤트 및 속성에 대한 정보를 전달하는 두 가지 흥미로운 방법을 제공합니다. 하나는 노트북 기능을 통한 것입니다. Amplitude 노트북은 텍스트, 이미지, 비디오, 분석 보고서 등을 추가할 수 있는 자유 형식 캔버스입니다. 노트북은 구현을 문서화하고 분석 이벤트 및 속성에 대한 컨텍스트를 공유하기에 좋은 장소입니다.

Amplitude가 관리자가 구현 이벤트에 대한 정보를 공유하는 데 도움이 되는 다른 방법은 이벤트 스크린샷을 이용하는 것입니다. 관리자는 Amplitude의 데이터 모듈에서 이벤트에 스크린샷을 첨부할 수 있습니다. 분석 이벤트가 설정된 위치의 스크린샷을 각 이벤트에 첨부하면 최종 사용자가 보고서 생성 중에 다양한 이벤트를 스크롤할 때 해당 스크린샷을 볼 수 있습니다. 이 스크린샷은 최종 사용자가 분석을 위해 올바른 이벤트를 사용할 수 있도록 신뢰를 구축하는 데 도움이 됩니다.

데이터 변환
아무리 노력해도 디지털 분석 제품에 잘못된 데이터가 전송되는 경우가 있습니다. 개발자는 잘못된 데이터 전송을 트리거하는 웹사이트 또는 앱을 변경할 수 있습니다. 고객이 양식 필드에 잘못된 정보를 입력할 수 있습니다. 사용자는 페이지를 새로 고치고 중복 데이터를 만들 수 있습니다. 발생 방식에 관계없이 부정확한 데이터가 수집됩니다. 앞의 스키마 유효성 검사 항목 중 일부는 잘못된 데이터를 완화하는 데 도움이 될 수 있습니다. 그래도 디지털 분석 제품은 필요한 경우 데이터를 수정/업데이트/변환할 수 있어야 합니다.
일부 디지털 분석 제품은 데이터 변환 방법을 제공하지 않으며 데이터 웨어하우스를 변경해야 합니다. 최종 사용자가 데이터가 잘못된 디지털 분석 제품 인터페이스를 사용할 수 있으므로 이는 도움이 되지 않습니다. 관리자는 필요한 경우 데이터를 변환할 수 있는 옵션이 있어야 합니다. 디지털 분석 공급자에서 다음과 같은 데이터 변환 기능을 찾아야 합니다.
값 수정
관리자는 필요한 경우 특정 속성 값을 변경할 수 있어야 합니다. 예를 들어 원하는 명명 규칙 없이 분석 제품에 전송된 마케팅 캠페인 코드를 상상해 보십시오. 관리자는 최종 사용자가 보고서 및 대시보드를 사용할 때 올바른 값을 볼 수 있도록 이러한 값을 수정할 수 있어야 합니다.

일회성 값 변경 외에도 관리자는 많은 값을 한 번에 수정하는 규칙을 만들 수 있어야 합니다. 이러한 규칙은 공식이나 함수를 사용하여 영향을 받는 모든 속성 값에 변경 사항을 적용할 수 있습니다.

데이터 난독화
또 다른 원하는 데이터 변환 기능은 잘못된 데이터를 숨기거나 난독화하는 기능입니다. 때때로 데이터의 일부를 수정해야 하고 사용자에게 숨기고 싶을 때가 있습니다. 실수로 프로덕션으로 전송된 테스트 데이터를 예로 들 수 있습니다. 이 데이터는 삭제되지 않지만 모든 사용자에게 숨겨집니다.

데이터 삭제
극단적인 경우에는 완전히 제거하고 싶은 분석 데이터가 있을 것입니다. 따라서 디지털 분석 제품을 사용하면 데이터의 특정 부분을 선택하고 제거할 수 있어야 합니다.

자동화된 데이터 테스트
또 다른 중요한 데이터 거버넌스 도구는 자동화된 테스트입니다. 분석 코드가 제대로 작동하는지 확인하기 위해 웹사이트나 앱을 확인하는 제품이 시장에 나와 있습니다. 또한 이러한 제품은 고객처럼 행동하도록 구성하고 분석 추적이 설계된 대로 작동하는지 확인할 수 있습니다. 이 분야에서 인기 있는 제품으로는 Observepoint와 QA2L이 있습니다. 이러한 제품의 고급 기능을 설명하려면 전체 블로그 게시물이 필요하므로 제품을 확인하고 디지털 분석 스택에 추가하는 것이 좋습니다.
사용자 데이터 프라이버시 준수
데이터 거버넌스의 또 다른 측면은 사용자 개인 정보 삭제 요청을 존중하는 것입니다. GDPR 및 CCPA와 같은 개인 정보 보호 규정은 소비자가 요청 시 수집된 데이터를 삭제하도록 요청할 수 있는 기능을 제공합니다. 따라서 디지털 분석 팀이 현지 규정에 따라 이러한 요청에 응답하고 조치를 취하는 것이 중요합니다.
요약
보시다시피 데이터 거버넌스와 관련하여 눈에 보이는 것보다 훨씬 더 많은 것이 있습니다. 디지털 분석 데이터가 정확한지 확인하려면 엄청난 양의 능동적 작업이 필요합니다. 다양한 디지털 분석 공급자는 데이터 거버넌스에 다양한 수준의 지원을 제공합니다. 모든 분석은 품질 데이터에 의존하기 때문에 벤더가 제공하는 데이터 거버넌스 기능을 고려해야 합니다.
