¿Qué es una pila de datos moderna para el crecimiento?
Publicado: 2022-02-16El término "pila de datos moderna" ha despertado mucho interés en los últimos 18 meses, y la mayor parte de la charla se relaciona con el contexto de la analítica y cómo un conjunto de herramientas y tecnologías modernas pueden ayudar a mejorar la técnica de la analítica.
La pila de datos moderna más ampliamente aceptada para análisis comprende herramientas de datos que abarcan las siguientes cuatro categorías:
- Recopilación de datos a través de ELT: se utiliza para extraer datos de bases de datos y herramientas de terceros
- Almacenamiento de datos: se utiliza para almacenar una copia de los datos
- Transformación de datos: se utiliza para transformar los datos y crear modelos para el análisis.
- Inteligencia empresarial: se utiliza para crear informes utilizando modelos de datos listos para el análisis
Sin embargo, esta pila solo satisface parcialmente las necesidades de los equipos de productos y crecimiento, ya que ignora lo siguiente:
- Recopilación de datos de eventos de fuentes de datos primarias o propias (sitios web y aplicaciones)
- Almacenamiento de estos datos en un almacén de datos en la nube
- Analizar estos datos para comprender el comportamiento del usuario e identificar puntos de fricción.
- Activar los datos en herramientas posteriores para crear experiencias de cliente personalizadas
Por lo tanto, como una extensión de la pila de datos moderna para análisis, una pila de datos moderna para el crecimiento incluye herramientas que permiten a los equipos hacer lo anterior.
El objetivo de esta guía es ofrecer un desglose completo de la pila de datos que permite a los equipos de comercialización (GTM) tomar el control de sus flujos de trabajo y hacer más sin depender de los datos y los equipos de ingeniería.
Recopilación de datos de eventos: CDI frente a CDP
La recopilación de datos de eventos o datos de comportamiento es el primer paso para adoptar una pila de datos moderna para el crecimiento y hacerlo bien es fundamental, ya que todo lo demás a partir de aquí depende de que los datos limpios y precisos estén disponibles en las herramientas utilizadas por la gente de GTM.
Las herramientas de recopilación de datos de comportamiento especialmente diseñadas se clasifican en dos categorías estrechamente relacionadas con capacidades superpuestas: infraestructura de datos del cliente (CDI) y plataforma de datos del cliente (CDP).
La falta de adopción del término CDI es la razón por la que algunos proveedores de CDI se refieren a su producto como CDP sin ofrecer capacidades de CDP. Además, cada vez más proveedores de herramientas de automatización de marketing utilizan el término CDP para describir una característica no central de su producto, lo que aumenta la confusión sobre qué es realmente un CDP.
CDI es esencialmente una solución independiente, mientras que CDP es una solución integrada que incluye capacidades de CDI. Permítanme explicar las diferencias en los términos más simples posibles.
Infraestructura de datos del cliente
El propósito de un CDI es recopilar datos de comportamiento o datos de eventos de fuentes de datos primarias o propias (sus sitios web y aplicaciones) y sincronizar los datos con soluciones de almacenamiento de datos, así como con herramientas de terceros utilizadas para el análisis basado en eventos y activación.
Los equipos de productos y crecimiento generalmente consumen datos de comportamiento en una herramienta de análisis de productos para comprender el comportamiento del usuario y en herramientas de participación para crear experiencias personalizadas basadas en datos: el trabajo de un CDI es hacer que los datos correctos estén disponibles en estas herramientas.
Además, los CDI también ofrecen funciones de control y calidad de datos para garantizar que los datos recopilados no solo sean precisos sino también los esperados.
Si desea profundizar en los CDI, le recomiendo que consulte esta guía que escribí recientemente.
plataforma de datos de clientes
Como se mencionó anteriormente, CDP es una solución integrada y se puede entender mejor a través de la siguiente fórmula:
CDP = La resolución de identidad, la capacidad de crear audiencias utilizando una interfaz visual de arrastrar y soltar (sin escribir SQL) y la capacidad de sincronizar datos con herramientas de terceros son las capacidades principales de un CDP. Además de estos, los CDP también almacenan una copia de los datos en su propio almacén de datos y hacen que los datos estén disponibles para consumo futuro.
CDP es esencialmente una capa sobre CDI para activar o tomar medidas sobre los datos.
Además, los CDP e incluso algunos CDI ofrecen la capacidad de recopilar datos de herramientas de terceros. Sin embargo, esta no es una de sus principales ofertas: las herramientas ELT como Fivetran, Airbyte y Meltano están especialmente diseñadas y son las más adecuadas para recopilar y almacenar datos de herramientas de terceros en un almacén de datos.
Datos de eventos de almacenamiento
Un almacén de datos es esencialmente una base de datos diseñada para análisis y se utiliza para almacenar datos de todas las fuentes de datos posibles: aplicaciones propias, herramientas de terceros y bases de datos de producción.
Independientemente de la tecnología que utilice para recopilar datos de eventos, almacenar una copia de sus datos en un almacén de datos como Snowflake, BigQuery o Firebolt es una buena práctica con varios beneficios.
Además del beneficio obvio de poseer sus datos, tener acceso a datos sin procesar en un almacén le permite hacer más con los datos, desde transformar y combinar datos de eventos con datos de otras fuentes hasta enriquecer los datos antes de analizarlos o activarlos.
Además, el almacenamiento de sus datos le permitirá invertir en casos de uso avanzados, como modelos predictivos para reducir la rotación o un motor de recomendación para potenciar las ventas adicionales. Es más fácil aprovechar sus datos si están alojados en su almacén, en lugar de encerrados en el almacén de un proveedor externo, donde es posible que deba pagar una tarifa para acceder a los datos históricos.
Incluso si no necesita los datos hoy, vale la pena almacenar una copia de sus datos en un almacén de datos, especialmente cuando los almacenes se han vuelto tan asequibles y se pueden activar en cuestión de horas sin un conocimiento técnico profundo.
Una vez que haya terminado de recopilar y almacenar datos, es hora de analizar y activar los datos. Si se ejecutan bien, estas dos etapas de la canalización de datos pueden marcar una diferencia significativa en la trayectoria de crecimiento de su empresa.
Análisis de datos de eventos
Una herramienta de análisis de productos es una herramienta de análisis especialmente diseñada para analizar datos de eventos y comprender cómo interactúan los usuarios con su producto.
El análisis de clientes y el análisis de comportamiento también son términos para describir las herramientas de análisis de productos, ya que le permiten analizar el comportamiento de los usuarios al visualizar cómo se mueven los usuarios a través del recorrido del cliente.
Las herramientas de análisis de productos se dirigen principalmente a equipos de productos y crecimiento donde:
- Los equipos de productos pueden Los equipos de crecimiento pueden Análisis de datos de eventos como un embudo
Los datos que impulsan las herramientas de análisis de productos vienen en forma de datos de eventos de su sitio web y aplicaciones: fuentes de datos propias.
También puede enviar datos de eventos desde aplicaciones externas, pero debe ser intencional al respecto, de lo contrario, su herramienta de análisis de productos se saturará con demasiados eventos. Los datos de eventos excesivos pueden causar rápidamente problemas de calidad de los datos, una de las principales causas de la falta de confianza en los datos.

Diferentes formas de mover datos a una herramienta de análisis de productos Con la rápida adopción del almacén de datos, las empresas están descubriendo los beneficios de hacer del almacén de datos la fuente de datos para las herramientas de análisis de productos.

Si ya está almacenando datos en un almacén de datos y tiene recursos dedicados para administrar el almacén, entonces es una buena idea sincronizar los datos del almacén con su herramienta de análisis de productos. Elimina la necesidad de mantener una tubería de datos separada y le permite modelar y enriquecer los datos en el almacén antes de enviarlos aguas abajo.
Otro beneficio notable de este enfoque es que las empresas que usan una herramienta de BI como Looker, Mode o Preset junto con una herramienta de análisis de productos no experimentarán ninguna inconsistencia de datos entre los dos, ya que el almacén será la fuente de ambas herramientas.
Activación de datos de eventos
La activación de datos es el proceso combinado de hacer que los datos estén disponibles en las herramientas utilizadas para crear experiencias basadas en datos y crear esas experiencias personalizadas en los puntos de contacto del cliente.
En otras palabras, los datos se activan o se actúa sobre ellos cuando las interacciones con los clientes son contextuales, oportunas y relevantes como resultado de estar alimentados por datos. Activación de datos
El análisis de datos y la recopilación de conocimientos solo es bueno si puede tomar medidas sobre esos conocimientos activando los datos en las herramientas que utiliza para interactuar con clientes potenciales y clientes. Al activar los datos de manera eficiente, puede ir más allá de mirar los tableros y puede utilizar los datos de manera significativa.
Brindar experiencias superiores se basa en que cada interacción con el cliente a través de los puntos de contacto esté impulsada por datos de comportamiento. Esto es posible cuando los datos están disponibles en las herramientas posteriores donde los datos se activan para impulsar esas interacciones, desde correos electrónicos salientes y conversaciones de soporte hasta anuncios y experiencias en la aplicación.
En ausencia de datos en esas herramientas, no hay mucho que pueda hacer además de crear experiencias lineales en las que cada usuario experimente los mismos mensajes, correos electrónicos y anuncios, independientemente de las acciones que hayan realizado dentro de su producto o las interacciones que hayan tenido. con tu marca
Veamos las diversas tecnologías disponibles para mover datos de comportamiento a herramientas posteriores donde los datos finalmente se activan:
- CDI para sincronizar datos de eventos sin procesar
- CDP para sincronizar datos sin procesar, así como datos modelados visualmente
- ETL inverso para sincronizar datos modelados usando SQL en un almacén de datos
- Integraciones de destino por herramientas de análisis de productos para sincronizar los datos ya disponibles en las herramientas de análisis de productos
Todos los anteriores son medios para el mismo fin: permitir que los equipos construyan experiencias personalizadas basadas en datos en las herramientas que usan en su día a día.
Los CDI y los CDP ya están cubiertos anteriormente, así que pasemos a las otras dos tecnologías que puede usar para hacer que los datos estén disponibles en las herramientas de activación posteriores.

Diferentes formas de mover datos a herramientas donde se lleva a cabo la activación de datos ETL inversa
La rápida adopción de los almacenes de datos en la nube ha dado lugar a Reverse ETL, un nuevo paradigma en la integración de datos que le permite activar los datos que ya están en el almacén de datos sincronizándolos con herramientas de terceros. Este proceso y la tecnología subyacente que lo hace posible también se denomina análisis operativo.
Las empresas con equipos de datos dedicados están invirtiendo mucho en la consolidación de datos de clientes de varias fuentes en el almacén de datos . Las herramientas ETL inversas como Hightouch, Grouparoo y Census permiten a los equipos de datos crear modelos de datos utilizando SQL sobre los datos almacenados en el almacén (o traer sus modelos existentes mediante la integración de herramientas como dbt) y sincronizar esos modelos con herramientas de terceros posteriores.
Sin embargo, implementar y mantener una herramienta ETL inversa requiere un equipo de datos interno o al menos un ingeniero de datos dedicado, algo para lo que muchas empresas no tienen los recursos o ni siquiera la necesidad.
Integraciones de destinos por análisis de productos
Las herramientas de análisis de productos como Amplitude, Heap y Mixpanel admiten una variedad de herramientas como destinos de datos, lo que le permite crear y sincronizar cohortes de usuarios con herramientas posteriores donde se activan los datos. Estas integraciones evolucionan constantemente con diferentes herramientas que ofrecen diferentes capacidades.

Las diferentes formas de mover datos con fines de análisis y activación. Vale la pena mencionar que Amplitude ha ido un paso más allá y ha empaquetado su capacidad para sincronizar audiencias con herramientas de terceros a través de Amplitude Recommend. Hay algunos beneficios notables en este enfoque:
- En lugar de crear cohortes en una herramienta de análisis de productos para analizar los datos y luego crear las mismas audiencias en la herramienta CDP, CDI o ETL inversa, todo se puede hacer en un sistema integrado.
- Las integraciones bidireccionales con las herramientas de participación le permiten analizar las métricas de su campaña directamente dentro de la herramienta de análisis de productos, lo que le permite medir el impacto real de sus campañas de participación.
Las empresas con recursos limitados de ingeniería de datos pueden obtener un valor significativo de estas soluciones integradas que permiten que los equipos de productos y crecimiento se muevan rápidamente sin depender de los equipos de datos.
Las empresas más grandes también pueden beneficiarse de este enfoque debido a la disponibilidad limitada de recursos de ingeniería de datos y una acumulación masiva de solicitudes de datos de varios equipos.
Aproveche una pila de datos moderna para el crecimiento y el compromiso
Mantener una pila de datos moderna para el crecimiento no es necesariamente la responsabilidad de un equipo de crecimiento, pero saber cómo se recopilan, almacenan y mueven los datos hace que sea mucho más fácil para los profesionales del crecimiento obtener información de los datos y actuar en consecuencia con esa información de manera efectiva.
Además, si bien las personas de crecimiento y producto son las que utilizan la mayor parte de las herramientas de esta pila, los beneficios de una pila de datos moderna se pueden experimentar en toda la organización, desde la generación de demanda y el desarrollo de ventas hasta el soporte y el éxito del cliente.
Brindar a los equipos acceso a las herramientas que les permiten ser más productivos también les permite mejorar sus habilidades y hacer un trabajo más significativo, los dos componentes más importantes que ayudan a atraer y retener a los mejores talentos.
¿Listo para llevar sus datos más allá con una pila de datos moderna para el crecimiento? Obtenga más información sobre el poder de los datos bien mantenidos para impulsar el compromiso y la retención de maestros.
