Значение управления данными в цифровой аналитике

Опубликовано: 2023-04-17

В цифровой аналитике организации тратят много времени на сбор, интерпретацию и отчетность по данным. Главной целью является использование данных в качестве конкурентного преимущества. Вы можете использовать данные для повышения эффективности цифровой рекламы или улучшения цифровых продуктов. Но прежде чем вы сможете использовать свои данные, вы должны быть уверены, что у вас есть правильные данные. Принятие решений на основе неточных данных ненамного лучше, чем принятие решений на основе отсутствия данных. Легко игнорировать важность эффективного управления данными. Управление данными часто рассматривается как трудоемкая задача, приоритетность которой может быть снижена, но это ошибка. В этом посте я расскажу о некоторых функциях управления данными, необходимых для долгосрочного успеха цифровой аналитики.

Управление данными выходит за рамки первоначальной реализации

Лучший способ иметь хорошие данные цифровой аналитики — это хорошая реализация. Часы, которые организации тратят на планирование и реализацию событий и свойств цифровой аналитики, необходимы для получения надежных данных. Во время начальной реализации часто возникает несколько уровней обеспечения качества и тестирования для проверки качества данных. Но после первоначального внедрения многие организации обнаруживают, что качество их данных цифровой аналитики ухудшается. Ухудшение качества данных часто связано с необходимостью более эффективного управления данными. В то время как первоначальное развертывание может быть высокопрофильным в организации, управление данными менее привлекательно. Несмотря на то, что внедрение и управление данными преследуют одни и те же цели обеспечения хорошего качества данных, многие организации уделяют больше внимания первому, чем второму.

Одна из причин, по которой организации плохо справляются с управлением данными, заключается в том, что продукты цифровой аналитики, которые они используют, недостаточно вложены в функции управления данными. Многие ведущие продукты цифровой аналитики на рынке не имеют базовых функций управления данными. Это отсутствие функций управления является позором, потому что управление данными лежит в основе всего, что связано с программой цифровой аналитики.

Проект решения по внедрению

Очень важно понимать, какие данные вы собираете при внедрении цифровой аналитики. Простое выявление и сообщение о событиях и свойствах, которые ваша организация решила собирать, является ставкой на столе. К сожалению, многие поставщики цифровой аналитики используют электронные таблицы, чтобы делиться тем, что находится в аналитическом решении. Отслеживание решений по внедрению в электронных таблицах имеет следующие недостатки:

  • Информация отделена от продукта цифровой аналитики и отчетов
  • Несколько версий дизайна решения могут распространяться по организации, что затрудняет определение текущей версии.
  • Электронные таблицы не могут сообщить вам статус каждого элемента дизайна решения (например, собирает ли он данные в данный момент?)

Желательно иметь всю информацию о решениях непосредственно в интерфейсе продукта цифровой аналитики, чтобы вы всегда могли просматривать самую актуальную информацию:

События

Также полезно, если несколько человек могут повторять проект решения, возможно, даже одновременно. В идеале вы можете управлять итерациями проектирования решения через «ветви», как если бы вы использовали GitHub:

Ветвь

Проверка схемы данных

Еще одним важным аспектом управления данными является проверка схемы данных. Одним из компонентов проверки схемы является автоматическая проверка, которая гарантирует, что собираемые данные соответствуют ожидаемым. Это важно, потому что члены команды цифровой аналитики часто заняты и не имеют времени, чтобы заранее отслеживать, когда новые события или свойства отправляются в реализацию. Отслеживание непредвиденных событий лучше обрабатывается продуктом цифровой аналитики, который знает структуру решения. Автоматизация позволяет продукту цифровой аналитики оповещать команду при обнаружении непредвиденных событий или свойств. Эти непредвиденные элементы помещаются на карантин до тех пор, пока они не будут проверены, чтобы они не портили производственные данные:

Непредвиденный

Еще одной функцией проверки схемы данных является возможность проверки соответствия собранных значений данных ожидаемому формату. Например, если у вас есть свойство данных, которое должно быть числом, но которому передается текстовая строка, оно должно быть помечено автоматически. Если у вас есть определенный формат почтового индекса, которому необходимо следовать, каждое значение должно быть проверено, чтобы данные были непротиворечивыми. Что касается проверки схемы данных, «унция профилактики стоит фунта лечения!»

Схема собственности

Назначение объекта

Когда люди в вашей организации используют ваш продукт цифровой аналитики, может быть сложно понять, какие компоненты аналитики верны, а какие нет. Часто пользователи создают новые когорты, метрики и т. д., чтобы попробовать что-то новое, но владелец реализации еще не проверил их.

Назначение объектов — это процесс пометки объектов цифровой аналитики как «официальных» в рамках реализации. Как показано ниже, объектам может быть назначен некоторый индикатор (например, синяя галочка), указывающий на то, что кто-то с соответствующими учетными данными санкционировал объект. Официальным объектам можно доверять и считать их правильными.

Официация

Назначение объектов избавляет от догадок при выборе компонентов цифровой аналитики и помогает избежать распространения неофициальных объектов разными пользователями по отчетам и информационным панелям.

Дедупликация объектов

Дедупликация объектов косвенно связана с назначением объектов. Одним из самых раздражающих аспектов цифровой аналитики является распространение множества версий одних и тех же объектов аналитики. Этими объектами могут быть вычисляемые метрики, когорты и т. д. Хотя назначение объектов может помочь свести это к минимуму, пользователи аналитики часто все еще могут создавать многочисленные версии объектов аналитики. Эти разные версии могут быть связаны с несколькими отчетами или информационными панелями. Эта проблема усугубляется, когда в определении или формуле объекта аналитики обнаруживается изъян. Вместо того, чтобы исправлять все в одном месте, организации должны найти все разные версии и исправлять каждую по отдельности, что может стать кошмаром для управления!

Продукты расширенной аналитики (такие как Amplitude!) напрямую решают эту проблему дедупликации. Лучший способ избежать дедупликации — запретить пользователям создавать повторяющиеся объекты. Как показано ниже, если пользователь попытается создать точную копию, продукт цифровой аналитики запретит ему ее сохранение.

Дедупликация

Использование объекта

Организации, внедряющие цифровую аналитику, часто реализуют множество различных событий и свойств. У каждой команды есть дополнительные данные, которые они хотят собрать. Когда у вас много точек данных, может быть сложно понять, какие элементы данных используются больше или меньше всего. Многие продукты цифровой аналитики усугубляют ситуацию, запутывая использование объектов. В некоторых продуктах цифровой аналитики для понимания того, какие объекты используются, где и кем, администраторы должны загружать данные об использовании через CSV и создавать отчеты.

Современные продукты цифровой аналитики позволяют легко понять, где используется каждое событие или свойство цифровой аналитики, как показано здесь:

СобытиеИспользование

Эта информация также должна быть видна на более подробном уровне для просмотра конкретных людей и объектов, использующих событие или свойство:

FullEventUsage

Имея в своем распоряжении эту информацию, администраторы и менеджеры по внедрению могут:

  • Просмотрите, с какими событиями и свойствами взаимодействуют пользователи аналитики
  • Определите, могут ли некоторые события и свойства требовать дополнительного обучения из-за отсутствия использования
  • Рассмотрите возможность удаления событий и свойств, которые больше не нужны.

Понимание событий аналитики

Распространенной проблемой при внедрении цифровой аналитики является то, что случайные конечные пользователи не совсем уверены, что означает каждое событие аналитики. Разработчики печально известны созданием непонятных имен событий (например, form_reaction). Многие пользователи аналитики не вовлечены в процесс внедрения и не знают предыстории того, как и почему были названы события аналитики. Поэтому все, что могут сделать администраторы или менеджеры, чтобы помочь конечным пользователям убедиться, что они используют правильное событие для своего анализа, высоко ценится.

Один из способов решить эту проблему — создать словарь данных. Здесь пользователи могут узнать о каждом событии аналитики и увидеть, где оно находится на веб-сайте или в мобильном приложении. Словари данных можно хранить в документе или в общем пространстве, таком как Confluence или Miro.

В Amplitude мы предлагаем два интересных способа передачи информации о вашей реализации, ее событиях и свойствах. Один из них — через нашу функцию «Записная книжка». Блокноты Amplitude — это холсты произвольной формы, куда вы можете добавлять текст, изображения, видео, аналитические отчеты и т. д. Блокноты — отличное место для документирования вашей реализации и обмена контекстом событий и свойств аналитики.

Блокнот

Другой способ, с помощью которого Amplitude помогает администраторам обмениваться информацией о событиях реализации, — это скриншоты событий. Администраторы могут прикреплять скриншоты к событиям в модуле данных Amplitude. Прикрепление снимка экрана, на котором установлено событие аналитики, к каждому событию, позволит конечным пользователям видеть этот снимок экрана при прокрутке различных событий во время создания отчета. Эти снимки экрана помогают конечным пользователям обрести уверенность в использовании правильного события для анализа.

Скриншот события

Преобразование данных

Как бы вы ни старались, будут случаи, когда на ваш продукт цифровой аналитики отправляются неверные данные. Разработчики могут изменить веб-сайт или приложение, которые вызывают отправку неверных данных. Клиенты могли вводить неверную информацию в поля формы. Пользователи могли обновлять страницы и создавать дубликаты данных. Независимо от того, как это происходит, собираются неточные данные. Некоторые из предыдущих элементов проверки схемы могут помочь смягчить неверные данные. Тем не менее, ваш продукт цифровой аналитики должен иметь возможность изменять/обновлять/преобразовывать данные при необходимости.

Некоторые продукты цифровой аналитики не позволяют преобразовывать данные и требуют внесения изменений в хранилища данных. Это бесполезно, поскольку конечные пользователи могут использовать интерфейс продукта цифровой аналитики, если данные неверны. Администраторы должны иметь возможность преобразовывать данные при необходимости. Вам следует искать следующие функции преобразования данных в вашем поставщике цифровой аналитики.

Изменение значения

Администраторы должны иметь возможность изменять определенные значения свойств, если это необходимо. Например, представьте код маркетинговой кампании, отправленный в аналитический продукт без желаемого соглашения об именах. Администраторы должны иметь возможность изменять эти значения, чтобы конечные пользователи видели правильное значение при использовании отчетов и информационных панелей.

Преобразование значений

В дополнение к разовым изменениям значений администраторы должны иметь возможность создавать правила, изменяющие сразу несколько значений. Эти правила могут использовать формулы или функции для применения изменений ко всем затронутым значениям свойств.

Правила преобразования

Обфускация данных

Еще одна желательная функция преобразования данных — возможность скрывать или запутывать неверные данные. Иногда часть данных нужно исправить, и вы хотите скрыть их от пользователей. Примером могут быть тестовые данные, случайно отправленные в рабочую среду. Эти данные не удаляются, а скрываются от всех пользователей.

DropFilter

Удаление данных

В крайних случаях у вас будут данные аналитики, которые вы захотите полностью удалить. Поэтому ваш продукт цифровой аналитики должен позволять вам выбирать определенные части данных и удалять их.

Блочный фильтр

Автоматизированное тестирование данных

Еще одним важным инструментом управления данными является автоматизированное тестирование. На рынке доступны продукты, которые проверяют ваш веб-сайт или приложение, чтобы убедиться, что код аналитики работает правильно. Эти продукты также можно настроить так, чтобы они действовали как клиенты и проверяли, работает ли ваше аналитическое отслеживание так, как задумано. Популярные продукты в этой области включают Observepoint и QA2L. Чтобы объяснить расширенные функциональные возможности этих продуктов, потребуется целый пост в блоге, поэтому я рекомендую вам ознакомиться с ними и подумать о том, чтобы добавить их в свой стек цифровой аналитики.

Соблюдение конфиденциальности данных пользователей

Еще одним аспектом управления данными является выполнение запросов пользователей на удаление конфиденциальных данных. Правила конфиденциальности, такие как GDPR и CCPA, предоставляют потребителям возможность запросить удаление собранных о них данных по запросу. Поэтому очень важно, чтобы группы цифровой аналитики реагировали на эти запросы и принимали меры в соответствии с местными нормативными актами.

Краткое содержание

Как видите, в отношении управления данными существует гораздо больше, чем кажется на первый взгляд. Обеспечение точности ваших данных цифровой аналитики требует огромного объема проактивной работы. Различные поставщики цифровой аналитики предлагают различные уровни помощи в управлении данными. Поскольку все виды анализа зависят от качественных данных, необходимо учитывать возможности управления данными, предоставляемые вашим поставщиком.