A importância da governança de dados na análise digital

Publicados: 2023-04-17

Na análise digital, as organizações gastam um tempo significativo coletando, interpretando e relatando dados. O objetivo geral é alavancar os dados como uma vantagem competitiva. Você pode usar dados para melhorar a eficácia da publicidade digital ou melhorar os produtos digitais. Mas antes de poder aproveitar seus dados, você precisa ter certeza de que possui os dados corretos. Tomar decisões com base em dados imprecisos não é muito melhor do que tomar decisões sem dados. É fácil ignorar a importância da boa governança de dados. A governança de dados costuma ser vista como uma tarefa trabalhosa que pode ser despriorizada, mas isso é um erro. Nesta postagem, descreverei alguns recursos de governança de dados essenciais para o sucesso de longo prazo na análise digital.

A governança de dados vai além da implementação inicial

A melhor maneira de ter bons dados de análise digital é ter uma boa implementação. As horas que as organizações gastam planejando e implementando eventos e propriedades de análise digital são essenciais para ter dados confiáveis. Vários níveis de garantia de qualidade e teste geralmente ocorrem durante a implementação inicial para verificar a qualidade dos dados. Porém, após a implementação inicial, muitas organizações descobrem que a qualidade dos dados de análise digital diminui. A degradação da qualidade dos dados geralmente ocorre devido à necessidade de mais governança de dados. Embora as implantações iniciais possam ser de alto nível dentro da organização, a governança de dados é menos glamorosa. Embora a implementação e a governança de dados tenham os mesmos objetivos de boa qualidade de dados, muitas organizações se concentram mais no primeiro do que no segundo.

Uma das razões pelas quais as organizações não fazem um bom trabalho com a governança de dados é que os produtos de análise digital que usam não investiram o suficiente em recursos de governança de dados. Muitos produtos de análise digital líderes no mercado carecem de recursos básicos de governança de dados. Essa falta de recursos de governança é uma pena porque a governança de dados sustenta tudo relacionado ao programa de análise digital.

Projeto de solução de implementação

Compreender quais dados você coleta em sua implementação de análise digital é essencial. Simplesmente identificar e comunicar os eventos e propriedades que sua organização escolheu coletar é uma aposta de mesa. Infelizmente, muitos fornecedores de análise digital usam planilhas para compartilhar o que está na solução de análise. O rastreamento de soluções de implementação em planilhas tem as seguintes desvantagens:

  • As informações são separadas do produto de análise digital e dos relatórios
  • Várias versões do design da solução podem se espalhar pela organização, dificultando saber qual é a versão atual
  • As planilhas não podem informar o status de cada elemento de design da solução (por exemplo, está coletando dados no momento?)

Ter todas as informações da solução diretamente na interface do produto de análise digital é preferível para que você possa sempre visualizar as informações mais atualizadas:

Eventos

Também é benéfico se várias pessoas puderem interagir no design da solução, possivelmente até simultaneamente. Idealmente, você pode gerenciar iterações de design de solução por meio de “branches” como faria se estivesse usando o GitHub:

Filial

Validação do esquema de dados

Outro aspecto crítico da governança de dados é a validação do esquema de dados. Um componente da validação do esquema é a verificação automatizada, que garante que os dados coletados sejam os esperados. Isso é importante porque os membros da equipe de análise digital geralmente estão ocupados e não têm tempo para monitorar proativamente quando novos eventos ou propriedades estão sendo enviados para a implementação. O rastreamento de eventos inesperados é mais bem tratado pelo produto de análise digital, que está ciente do design da solução. A automação permite que o produto de análise digital alerte a equipe se eventos ou propriedades inesperadas forem encontradas. Esses itens inesperados são colocados em quarentena até serem revisados ​​para que não contaminem os dados de produção:

Inesperado

Outro recurso da validação do esquema de dados é a capacidade de verificar se os valores de dados coletados correspondem ao formato esperado. Por exemplo, se você tiver uma propriedade de dados que deve ser um número, mas está recebendo uma string de texto, isso deve ser sinalizado automaticamente. Se você tiver um formato de código postal específico que deve ser seguido, cada valor deve ser verificado para que os dados sejam consistentes. Em relação à validação do esquema de dados, “um grama de prevenção vale um quilo de cura!”

Esquema de propriedade

oficiação de objeto

Quando as pessoas em sua organização estão usando seu produto de análise digital, pode ser um desafio saber quais componentes de análise estão corretos e quais não estão. Frequentemente, os usuários criam novas coortes, métricas etc. para testar as coisas, mas o proprietário da implementação não as verificou.

A oficiação de objeto é o processo de marcar objetos de análise digital como “oficiais” dentro da implementação. Conforme mostrado abaixo, alguns indicadores podem ser atribuídos aos objetos (por exemplo, cheque azul) para indicar que alguém com as credenciais apropriadas sancionou o objeto. Objetos oficiais podem ser confiáveis ​​e considerados corretos.

ofício

A oficiação de objetos elimina as suposições na seleção de componentes de análise digital e ajuda a evitar que diferentes usuários espalhem objetos não oficiais em relatórios e painéis.

desduplicação de objetos

A desduplicação de objetos está tangencialmente relacionada à oficiação de objetos. Um dos aspectos mais irritantes da análise digital é a proliferação de várias versões dos mesmos objetos analíticos. Esses objetos podem ser métricas calculadas, coortes etc. Embora a oficiação de objetos possa ajudar a minimizar isso, muitas vezes ainda é possível para os usuários analíticos criar várias versões de objetos analíticos. Essas diferentes versões podem ser associadas a vários relatórios ou painéis. Esse problema é agravado quando uma falha é encontrada na definição ou fórmula do objeto analítico. Em vez de corrigi-lo em um só lugar, as organizações devem encontrar todas as versões diferentes e corrigir cada uma separadamente, o que pode ser um pesadelo de governança!

Os produtos de análise avançada (como o Amplitude!) abordaram diretamente esse problema de desduplicação. A melhor maneira de evitar a desduplicação é impedir que os usuários criem objetos duplicados. Conforme mostrado abaixo, se um usuário tentar criar uma duplicata exata, o produto de análise digital o impedirá de salvá-la.

De-duplicado

Uso de objetos

As organizações que implementam análises digitais geralmente implementam muitos eventos e propriedades diferentes. Cada equipe tem dados adicionais que deseja coletar. Quando você tem muitos pontos de dados, pode ser complicado entender quais elementos de dados são mais ou menos usados. Muitos produtos de análise digital pioram a situação ofuscando o uso de objetos. Em alguns produtos de análise digital, entender quais objetos são usados, onde e por quem exige que os administradores baixem dados de uso via CSV e criem relatórios.

Os produtos modernos de análise digital facilitam a compreensão de onde cada evento ou propriedade de análise digital é usado, conforme mostrado aqui:

Uso do evento

Essas informações também devem estar visíveis em um nível mais detalhado para visualizar as pessoas e objetos específicos que usam o evento ou propriedade:

FullEventUsage

Ter essas informações à sua disposição permite aos administradores e gerentes de implementação:

  • Veja com quais eventos e propriedades os usuários de análise estão envolvidos
  • Determine se alguns eventos e propriedades podem exigir treinamento adicional devido à falta de uso
  • Considere remover eventos e propriedades que não são mais necessários

Noções básicas sobre eventos analíticos

Um problema comum nas implementações de análise digital é que os usuários finais casuais não têm certeza do significado de cada evento de análise. Os desenvolvedores são notórios por criar nomes de eventos ininteligíveis (por exemplo, form_reaction). Muitos usuários analíticos não estão envolvidos no processo de implementação e não sabem como e por que os eventos analíticos foram nomeados. Portanto, qualquer coisa que os administradores ou gerentes possam fazer para ajudar os usuários finais a garantir que eles usem o evento correto para sua análise é muito apreciada.

Uma maneira de resolver isso é criar um dicionário de dados. É aqui que os usuários podem aprender sobre cada evento de análise e ver onde ele está no site ou aplicativo móvel. Os dicionários de dados podem ser armazenados em um documento ou em um espaço compartilhado como Confluence ou Miro.

Na Amplitude, oferecemos duas formas interessantes de comunicar informações sobre sua implementação e seus eventos e propriedades. Uma delas é através do nosso recurso Notebook. Amplitude Notebooks são telas de forma livre onde você pode adicionar texto, imagens, vídeo, relatórios analíticos, etc. Notebooks são um ótimo lugar para documentar sua implementação e compartilhar contexto sobre eventos e propriedades analíticas.

Caderno

A outra maneira pela qual o Amplitude ajuda os administradores a compartilhar informações sobre eventos de implementação é por meio de capturas de tela de eventos. Os administradores podem anexar capturas de tela aos eventos no módulo de dados do Amplitude. Anexar uma captura de tela de onde o evento de análise está definido para cada evento permitirá que os usuários finais vejam essa captura de tela enquanto percorrem os vários eventos durante a criação do relatório. Essas capturas de tela ajudam os usuários finais a criar confiança para usar o evento correto para suas análises.

Captura de tela do evento

transformação de dados

Não importa o quanto você tente, haverá momentos em que dados incorretos serão enviados ao seu produto de análise digital. Os desenvolvedores podem alterar um site ou aplicativo que aciona o envio de dados errados. Os clientes podem inserir informações incorretas nos campos do formulário. Os usuários podem atualizar páginas e criar dados duplicados. Independentemente de como isso aconteça, dados imprecisos são coletados. Alguns dos itens de validação de esquema anteriores podem ajudar a atenuar dados inválidos. Ainda assim, seu produto de análise digital deve ser capaz de modificar/atualizar/transformar dados, se necessário.

Alguns produtos de análise digital não fornecem uma maneira de transformar dados e exigem que você faça alterações nos data warehouses. Isso não é útil, pois os usuários finais podem usar a interface do produto de análise digital onde os dados estão incorretos. Os administradores devem ter a opção de transformar os dados, se necessário. Você deve procurar os seguintes recursos de transformação de dados em seu provedor de análise digital.

Modificação de valor

Os administradores devem ter a capacidade de alterar valores de propriedade específicos, se necessário. Por exemplo, imagine um código de campanha de marketing enviado ao produto analítico sem a convenção de nomenclatura desejada. Os administradores devem poder modificar esses valores para que os usuários finais vejam o valor correto ao usar relatórios e painéis.

Transformar valores

Além das alterações pontuais de valor, os administradores devem ser capazes de criar regras que modifiquem muitos valores de uma só vez. Essas regras podem usar fórmulas ou funções para aplicar alterações a todos os valores de propriedade afetados.

Regras de Transformação

Ofuscação de dados

Outro recurso de transformação de dados desejado é a capacidade de ocultar ou ofuscar dados incorretos. Às vezes, partes dos dados precisam ser corrigidas e você deseja ocultá-las dos usuários. Um exemplo pode ser dados de teste que foram acidentalmente enviados para produção. Esses dados não são excluídos, mas ocultos de todos os usuários.

DropFilter

Exclusão de dados

Em casos extremos, você terá dados analíticos que deseja remover completamente. Portanto, seu produto de análise digital deve permitir que você selecione porções específicas de dados e remova-as.

Bloquear Filtro

Teste de dados automatizado

Outra ferramenta crítica de governança de dados é o teste automatizado. Existem produtos disponíveis no mercado que verificam seu site ou aplicativo para garantir que o código analítico esteja funcionando corretamente. Esses produtos também podem ser configurados para agir como clientes e verificar se seu rastreamento analítico funciona conforme projetado. Produtos populares nesta área incluem Observepoint e QA2L. Levaria uma postagem de blog inteira para explicar a funcionalidade avançada desses produtos, então eu encorajo você a dar uma olhada e considerar adicioná-los à sua pilha de análise digital.

Conformidade com a privacidade dos dados do usuário

Outro aspecto da governança de dados é honrar as solicitações de exclusão de privacidade do usuário. Regulamentações de privacidade como GDPR e CCPA fornecem aos consumidores a capacidade de solicitar que os dados coletados sobre eles sejam excluídos mediante solicitação. Portanto, é fundamental que as equipes de análise digital respondam e tomem medidas em relação a essas solicitações, conforme determinado pelos regulamentos governamentais locais.

Resumo

Como você pode ver, há muito mais do que aparenta em relação à governança de dados. Garantir que seus dados de análise digital sejam precisos requer uma enorme quantidade de trabalho proativo. Diferentes provedores de análise digital oferecem níveis variados de assistência na governança de dados. Como todas as análises dependem de dados de qualidade, os recursos de governança de dados fornecidos pelo seu fornecedor devem ser considerados.