La importancia del gobierno de datos en el análisis digital
Publicado: 2023-04-17En el análisis digital, las organizaciones dedican mucho tiempo a recopilar, interpretar e informar sobre los datos. El objetivo general es aprovechar los datos como una ventaja competitiva. Puede utilizar los datos para mejorar la eficacia de la publicidad digital o mejorar los productos digitales. Pero antes de que pueda aprovechar sus datos, debe asegurarse de tener los datos correctos. Tomar decisiones basadas en datos inexactos no es mucho mejor que tomar decisiones sin datos. Es fácil ignorar la importancia de un buen gobierno de datos. El gobierno de datos a menudo se ve como una tarea laboriosa que puede perder prioridad, pero eso es un error. En esta publicación, describiré algunas características de gobierno de datos esenciales para el éxito a largo plazo en el análisis digital.
El gobierno de datos va más allá de la implementación inicial
La mejor manera de tener buenos datos de análisis digital es tener una buena implementación. Las horas que las organizaciones pasan planificando e implementando eventos y propiedades de análisis digital son esenciales para tener datos confiables. Durante la implementación inicial, a menudo ocurren varios niveles de prueba y control de calidad para verificar la calidad de los datos. Pero después de la implementación inicial, muchas organizaciones descubren que la calidad de sus datos de análisis digital se degrada. La degradación de la calidad de los datos a menudo se debe a la necesidad de una mayor gobernanza de los datos. Si bien las implementaciones iniciales pueden ser de alto perfil dentro de la organización, el gobierno de datos es menos glamoroso. Aunque la implementación y el gobierno de datos tienen los mismos objetivos de buena calidad de datos, muchas organizaciones se centran más en la primera que en la segunda.
Una de las razones por las que las organizaciones no hacen un buen trabajo con el gobierno de datos es que los productos de análisis digital que utilizan no han invertido lo suficiente en funciones de gobierno de datos. Muchos productos de análisis digital líderes en el mercado carecen de funciones básicas de gobierno de datos. Esta falta de funciones de gobernanza es una pena porque la gobernanza de datos sustenta todo lo relacionado con el programa de análisis digital.
Diseño de solución de implementación
Comprender qué datos recopila en su implementación de análisis digital es esencial. Simplemente identificar y comunicar los eventos y las propiedades que su organización ha elegido recopilar es lo que está en juego. Lamentablemente, muchos proveedores de análisis digital utilizan hojas de cálculo para compartir el contenido de la solución de análisis. El seguimiento de soluciones de implementación en hojas de cálculo tiene las siguientes desventajas:
- La información se separa del producto de análisis digital y los informes.
- Varias versiones del diseño de la solución pueden distribuirse en toda la organización, lo que dificulta saber cuál es la versión actual
- Las hojas de cálculo no pueden decirle el estado de cada elemento de diseño de la solución (p. ej., ¿está recopilando datos actualmente?)
Es preferible tener toda la información de la solución directamente en la interfaz del producto de análisis digital para que siempre pueda ver la información más actualizada:

También es beneficioso si varias personas pueden iterar en el diseño de la solución, posiblemente incluso simultáneamente. Idealmente, puede administrar las iteraciones de diseño de la solución a través de "ramas" como lo haría si usara GitHub:

Validación del esquema de datos
Otro aspecto crítico del gobierno de datos es la validación del esquema de datos. Un componente de la validación del esquema es la verificación automatizada, que garantiza que los datos que se recopilan son los esperados. Esto es importante porque los miembros del equipo de análisis digital a menudo están ocupados y no tienen tiempo para monitorear de manera proactiva cuándo se envían nuevos eventos o propiedades a la implementación. El seguimiento de eventos inesperados se maneja mejor con el producto de análisis digital, que conoce el diseño de la solución. La automatización permite que el producto de análisis digital alerte al equipo si se encuentran eventos o propiedades inesperados. Estos elementos inesperados se ponen en cuarentena hasta que se revisan para que no contaminen los datos de producción:

Otra característica de la validación del esquema de datos es la capacidad de verificar que los valores de datos recopilados coincidan con el formato esperado. Por ejemplo, si tiene una propiedad de datos que pretende ser un número pero se le pasa una cadena de texto, eso debería marcarse automáticamente. Si tiene un formato de código postal específico que debe seguirse, cada valor debe verificarse para que los datos sean consistentes. Con respecto a la validación del esquema de datos, "¡una onza de prevención vale una libra de cura!"

objeto de oficio
Cuando las personas de su organización usan su producto de análisis digital, puede ser un desafío saber qué componentes de análisis son correctos y cuáles no. A menudo, los usuarios crean nuevas cohortes, métricas, etc., para probar cosas, pero el propietario de la implementación no las ha verificado.
La oficiación de objetos es el proceso de marcar objetos de análisis digital como "oficiales" dentro de la implementación. Como se muestra a continuación, a los objetos se les puede asignar algún indicador (por ejemplo, una marca azul) para indicar que alguien con las credenciales apropiadas ha sancionado el objeto. Se puede confiar en los objetos oficiados y asumir que son correctos.

La oficiación de objetos elimina las conjeturas a la hora de seleccionar componentes de análisis digital y ayuda a evitar que diferentes usuarios difundan objetos no oficiales en informes y paneles.
Deduplicación de objetos
La deduplicación de objetos está tangencialmente relacionada con la oficiación de objetos. Uno de los aspectos más molestos del análisis digital es la proliferación de múltiples versiones de los mismos objetos de análisis. Estos objetos pueden ser métricas calculadas, cohortes, etc. Si bien la oficiación de objetos puede ayudar a minimizar esto, a menudo aún es posible que los usuarios de análisis creen numerosas versiones de objetos de análisis. Estas diferentes versiones se pueden asociar con múltiples informes o tableros. Este problema se exacerba cuando se encuentra una falla en la definición o fórmula del objeto de análisis. En lugar de arreglarlo en un solo lugar, las organizaciones deben encontrar todas las versiones diferentes y arreglar cada una por separado, ¡lo que puede ser una pesadilla de gobernanza!
Los productos de análisis avanzados (¡como Amplitude!) han abordado este problema de deduplicación directamente. La mejor manera de evitar la deduplicación es evitar que los usuarios creen objetos duplicados. Como se muestra a continuación, si un usuario intenta crear un duplicado exacto, el producto de análisis digital le prohibirá guardarlo.

uso de objetos
Las organizaciones que implementan el análisis digital a menudo implementan muchos eventos y propiedades diferentes. Cada equipo tiene datos adicionales que desea recopilar. Cuando tiene muchos puntos de datos, puede ser abrumador comprender qué elementos de datos se usan más o menos. Muchos productos de análisis digital empeoran la situación al ofuscar el uso de objetos. En algunos productos de análisis digital, comprender qué objetos se usan, dónde y por quién requiere que los administradores descarguen los datos de uso a través de CSV y creen informes.

Los productos de análisis digital modernos facilitan la comprensión de dónde se utiliza cada evento o propiedad de análisis digital, como se muestra aquí:

Esta información también debe estar visible a un nivel más detallado para ver las personas y los objetos específicos que utilizan el evento o la propiedad:

Tener esta información a su disposición permite a los administradores y gerentes de implementación:
- Ver con qué análisis de eventos y propiedades interactúan los usuarios
- Determinar si algunos eventos y propiedades pueden requerir capacitación adicional debido a la falta de uso
- Considere eliminar eventos y propiedades que ya no son necesarios
Comprender los eventos de análisis
Un problema común en las implementaciones de análisis digital es que los usuarios finales ocasionales no están completamente seguros de lo que significa cada evento de análisis. Los desarrolladores son conocidos por crear nombres de eventos ininteligibles (por ejemplo, form_reaction). Muchos usuarios de análisis no están involucrados en el proceso de implementación y no tienen antecedentes sobre cómo y por qué se nombraron los eventos de análisis. Por lo tanto, cualquier cosa que los administradores o gerentes puedan hacer para ayudar a los usuarios finales a garantizar que usen el evento correcto para su análisis es muy apreciada.
Una forma de abordar esto es crear un diccionario de datos. Aquí es donde los usuarios pueden obtener información sobre cada evento de análisis y ver dónde se encuentra en el sitio web o la aplicación móvil. Los diccionarios de datos se pueden almacenar en un documento o en un espacio compartido como Confluence o Miro.
En Amplitude, ofrecemos dos formas interesantes de comunicar información sobre su implementación y sus eventos y propiedades. Una es a través de nuestra función Notebook. Los cuadernos de Amplitude son lienzos de forma libre donde puede agregar texto, imágenes, videos, informes analíticos, etc. Los cuadernos son un excelente lugar para documentar su implementación y compartir contexto en torno a eventos y propiedades de análisis.

La otra forma en que Amplitude ayuda a los administradores a compartir información sobre eventos de implementación es a través de capturas de pantalla de eventos. Los administradores pueden adjuntar capturas de pantalla a los eventos en el módulo de datos de Amplitude. Adjuntar una captura de pantalla de dónde se establece el evento de análisis para cada evento permitirá a los usuarios finales ver esa captura de pantalla mientras se desplazan por los diversos eventos durante la creación del informe. Estas capturas de pantalla ayudan a los usuarios finales a generar confianza para usar el evento correcto para sus análisis.

Transformación de datos
No importa cuánto lo intente, habrá ocasiones en las que se envíen datos incorrectos a su producto de análisis digital. Los desarrolladores pueden cambiar un sitio web o una aplicación que active el envío de datos incorrectos. Los clientes podrían ingresar información incorrecta en los campos del formulario. Los usuarios podían actualizar las páginas y crear datos duplicados. Independientemente de cómo suceda, se recopilan datos inexactos. Algunos de los elementos de validación del esquema anteriores pueden ayudar a mitigar los datos incorrectos. Aún así, su producto de análisis digital debería poder modificar/actualizar/transformar datos si es necesario.
Algunos productos de análisis digital no proporcionan una forma de transformar los datos y requieren que realice cambios en los almacenes de datos. Esto no es útil ya que los usuarios finales pueden usar la interfaz del producto de análisis digital donde los datos son incorrectos. Los administradores deben tener la opción de transformar los datos si es necesario. Debe buscar las siguientes funciones de transformación de datos en su proveedor de análisis digital.
Modificación de valor
Los administradores deben tener la capacidad de cambiar valores de propiedad específicos si es necesario. Por ejemplo, imagine un código de campaña de marketing enviado al producto de análisis sin la convención de nomenclatura deseada. Los administradores deberían poder modificar estos valores para que los usuarios finales vean el valor correcto al usar informes y paneles.

Además de los cambios de valores únicos, los administradores deberían poder crear reglas que modifiquen muchos valores a la vez. Estas reglas pueden usar fórmulas o funciones para aplicar cambios a todos los valores de propiedad afectados.

Ofuscación de datos
Otra característica deseada de transformación de datos es la capacidad de ocultar u ofuscar datos incorrectos. A veces es necesario corregir partes de los datos y desea ocultarlos a los usuarios. Un ejemplo podría ser los datos de prueba que se enviaron accidentalmente a producción. Estos datos no se eliminan, sino que se ocultan para todos los usuarios.

Eliminación de datos
En casos extremos, tendrá datos de análisis que desea eliminar por completo. Por lo tanto, su producto de análisis digital debería permitirle seleccionar porciones específicas de datos y eliminarlas.

Pruebas de datos automatizadas
Otra herramienta crítica de gobierno de datos son las pruebas automatizadas. Hay productos disponibles en el mercado que verificarán su sitio web o aplicación para asegurarse de que el código de análisis funcione correctamente. Estos productos también se pueden configurar para que actúen como clientes y verifiquen que su seguimiento analítico funcione según lo diseñado. Los productos populares en esta área incluyen Observepoint y QA2L. Se necesitaría una publicación de blog completa para explicar la funcionalidad avanzada de estos productos, por lo que lo animo a que los revise y considere agregarlos a su pila de análisis digital.
Cumplimiento de la privacidad de los datos del usuario
Otro aspecto del gobierno de datos es cumplir con las solicitudes de eliminación de privacidad de los usuarios. Las regulaciones de privacidad como GDPR y CCPA brindan a los consumidores la capacidad de solicitar que los datos recopilados sobre ellos se eliminen a pedido. Por lo tanto, es fundamental que los equipos de análisis digital respondan y tomen medidas sobre estas solicitudes según lo dicten las reglamentaciones vigentes locales.
Resumen
Como puede ver, hay mucho más de lo que parece con respecto al gobierno de datos. Asegurarse de que sus datos de análisis digital sean precisos requiere una enorme cantidad de trabajo proactivo. Diferentes proveedores de análisis digital ofrecen diferentes niveles de asistencia en el gobierno de datos. Debido a que todos los análisis dependen de datos de calidad, las capacidades de gobierno de datos proporcionadas por su proveedor son algo a considerar.
