Qu'est-ce qu'une pile de données moderne pour la croissance ?
Publié: 2022-02-16Le terme "pile de données moderne" a suscité beaucoup d'intérêt au cours des 18 derniers mois, la plupart des discussions étant dans le contexte de l'analyse et de la manière dont un ensemble d'outils et de technologies modernes peut aider à améliorer le métier d'analyse.
La pile de données moderne la plus largement acceptée pour l'analyse comprend des outils de données couvrant les quatre catégories suivantes :
- Collecte de données via ELT : Utilisé pour extraire des données de bases de données et d'outils tiers
- Entreposage de données : utilisé pour stocker une copie des données
- Transformation des données : utilisé pour transformer les données et créer des modèles d'analyse
- Business intelligence : utilisé pour créer des rapports à l'aide de modèles de données prêts pour l'analyse
Cependant, cette pile ne répond que partiellement aux besoins des équipes de produit et de croissance car elle ignore les éléments suivants :
- Collecte de données d'événement à partir de sources de données primaires ou de première partie (sites Web et applications)
- Stocker ces données dans un entrepôt de données cloud
- Analyser ces données pour comprendre le comportement des utilisateurs et identifier les points de friction
- Activer les données dans les outils en aval pour créer des expériences client personnalisées
Par conséquent, en tant qu'extension de la pile de données moderne pour l'analyse, une pile de données moderne pour la croissance comprend des outils qui permettent aux équipes de faire ce qui précède.
L'objectif de ce guide est d'offrir une ventilation complète de la pile de données qui permet aux équipes de mise sur le marché (GTM) de prendre le contrôle de leurs flux de travail et d'en faire plus sans compter sur les équipes de données et d'ingénierie.
Collecte de données d'événement : CDI versus CDP
La collecte de données d'événement ou de données comportementales est la première étape vers l'adoption d'une pile de données moderne pour la croissance et il est essentiel de bien faire les choses car tout le reste à partir de maintenant dépend de la mise à disposition de données propres et précises dans les outils utilisés par les gens de GTM.
Les outils de collecte de données comportementales spécialement conçus relèvent de deux catégories étroitement liées avec des capacités qui se chevauchent : l'infrastructure de données client (CDI) et la plate-forme de données client (CDP).
Le manque d'adoption du terme CDI est la raison pour laquelle certains fournisseurs de CDI désignent leur produit comme un CDP sans réellement offrir de fonctionnalités CDP. De plus, de plus en plus de fournisseurs d'outils d'automatisation du marketing utilisent le terme CDP pour décrire une fonctionnalité non essentielle de leur produit, ajoutant à la confusion quant à ce qu'est réellement un CDP.
CDI est essentiellement une solution autonome tandis que CDP est une solution groupée qui inclut des fonctionnalités CDI. Permettez-moi d'expliquer les différences dans les termes les plus simples possibles.
Infrastructure de données client
Le but d'un CDI est de collecter des données comportementales ou des données d'événements à partir de sources de données primaires ou de première partie - vos sites Web et applications - et de synchroniser les données avec des solutions d'entreposage de données ainsi qu'avec des outils tiers utilisés pour l'analyse basée sur les événements et Activation.
Les équipes de produits et de croissance consomment généralement des données comportementales dans un outil d'analyse de produits pour comprendre le comportement des utilisateurs et dans des outils d'engagement pour créer des expériences personnalisées et basées sur les données. Le travail d'un CDI consiste à rendre les bonnes données disponibles dans ces outils.
De plus, les CDI offrent également des fonctionnalités de qualité et de gouvernance des données pour garantir que les données collectées sont non seulement exactes mais aussi conformes aux attentes.
Si vous souhaitez approfondir les CDI, je vous recommande de consulter ce guide que j'ai écrit récemment.
Plateforme de données clients
Comme mentionné ci-dessus, CDP est une solution groupée et peut être mieux compris via la formule suivante :
CDP = La résolution d'identité, la possibilité de créer des audiences à l'aide d'une interface visuelle par glisser-déposer (sans écrire de code SQL) et la possibilité de synchroniser des données avec des outils tiers sont les principales fonctionnalités d'un CDP. En plus de cela, les CDP stockent également une copie des données dans leur propre entrepôt de données et rendent les données disponibles pour une consommation future.
CDP est essentiellement une couche au-dessus de CDI pour activer ou agir sur les données.
De plus, les CDP et même certains CDI offrent la possibilité de collecter des données à partir d'outils tiers. Cependant, il ne s'agit pas de leur offre de base - les outils ELT tels que Fivetran, Airbyte et Meltano sont spécialement conçus et mieux adaptés pour collecter et stocker des données à partir d'outils tiers dans un entrepôt de données.
Données d'événements d'entreposage
Un entrepôt de données est essentiellement une base de données conçue pour l'analyse et est utilisée pour stocker des données provenant de toutes les sources de données possibles : applications propriétaires, outils tiers, ainsi que bases de données de production.
Quelle que soit la technologie que vous utilisez pour collecter les données d'événement, le stockage d'une copie de vos données dans un entrepôt de données tel que Snowflake, BigQuery ou Firebolt est une bonne pratique présentant plusieurs avantages.
Outre l'avantage évident de posséder vos données, l'accès aux données brutes dans un entrepôt vous permet d'en faire plus avec les données, de la transformation et de la combinaison des données d'événement avec des données provenant d'autres sources à l'enrichissement des données avant de les analyser ou de les activer.
De plus, l'entreposage de vos données vous permettra d'investir dans des cas d'utilisation avancés tels que des modèles prédictifs pour réduire le taux de désabonnement ou un moteur de recommandation pour alimenter les ventes incitatives. Il est plus facile d'exploiter vos données si elles sont hébergées dans votre entrepôt, plutôt que enfermées dans l'entrepôt d'un fournisseur tiers, où vous devrez peut-être payer des frais pour accéder aux données historiques.
Même si vous n'avez pas besoin des données aujourd'hui, cela vaut toujours la peine de stocker une copie de vos données dans un entrepôt de données, en particulier lorsque les entrepôts sont devenus si abordables et peuvent être créés en quelques heures sans connaissances techniques approfondies.
Une fois que vous avez terminé de collecter et de stocker des données, il est temps d'analyser et d'activer les données. Si elles sont bien exécutées, ces deux étapes du pipeline de données peuvent faire une différence significative dans la trajectoire de croissance de votre entreprise.
Analyse des données d'événement
Un outil d'analyse de produit est un outil d'analyse spécialement conçu pour analyser les données d'événement et comprendre comment les utilisateurs interagissent avec votre produit.
L'analyse client et l'analyse comportementale sont également des termes pour décrire les outils d'analyse de produit car ils vous permettent d'analyser le comportement des utilisateurs en visualisant comment les utilisateurs se déplacent dans le parcours client.
Les outils d'analyse de produits s'adressent principalement aux équipes de produits et de croissance où :
- Les équipes produit sont en mesure d' Les équipes de croissance sont en mesure d' Analyser les données d'événement sous forme d'entonnoir
Les données qui alimentent les outils d'analyse de produits se présentent sous la forme de données d'événements provenant de votre site Web et de vos applications, des sources de données propriétaires.
Vous pouvez également envoyer des données d'événements à partir d'applications externes, mais vous devez être intentionnel à ce sujet, sinon votre outil d'analyse de produits sera gonflé avec trop d'événements. Des données d'événement excessives peuvent rapidement entraîner des problèmes de qualité des données, l'une des principales causes du manque de confiance dans les données.

Différentes façons de déplacer des données vers un outil d'analyse de produits Avec l'adoption rapide de l'entrepôt de données, les entreprises découvrent les avantages de faire de l'entrepôt de données la source de données pour les outils d'analyse de produits.

Si vous stockez déjà des données dans un entrepôt de données et que vous disposez de ressources dédiées pour gérer l'entrepôt, la synchronisation des données de l'entrepôt avec votre outil d'analyse de produits est une bonne idée. Il élimine le besoin de maintenir un pipeline de données séparé et vous permet de modéliser et d'enrichir les données dans l'entrepôt avant de les envoyer en aval.
Un autre avantage notable de cette approche est que les entreprises utilisant un outil de BI comme Looker, Mode ou Preset avec un outil d'analyse de produits ne connaîtront aucune incohérence de données entre les deux puisque l'entrepôt sera la source des deux outils.
Activation des données d'événement
L'activation des données est le processus combiné de mise à disposition des données dans les outils utilisés pour créer des expériences basées sur les données et de création de ces expériences personnalisées à travers les points de contact avec les clients.
En d'autres termes, les données sont activées ou exploitées lorsque les interactions avec les clients sont contextuelles, opportunes et pertinentes du fait qu'elles sont alimentées par les données. Activation des données
L'analyse des données et la collecte d'informations ne sont utiles que si vous pouvez agir sur ces informations en activant les données dans les outils que vous utilisez pour interagir avec les prospects et les clients. En activant efficacement les données, vous pouvez aller au-delà de l'examen des tableaux de bord et utiliser les données de manière significative.
Offrir des expériences supérieures repose sur chaque interaction client à travers les points de contact pour être alimentée par des données comportementales. Cela est rendu possible lorsque les données sont mises à disposition dans les outils en aval où les données sont activées pour alimenter ces interactions, des e-mails sortants et des conversations d'assistance aux publicités et aux expériences dans l'application.
En l'absence de données dans ces outils, vous ne pouvez pas faire grand-chose d'autre que créer des expériences linéaires où chaque utilisateur reçoit les mêmes messages, e-mails et publicités, quelles que soient les actions qu'il a effectuées dans votre produit ou les interactions qu'il a eues. avec votre marque.
Examinons les différentes technologies disponibles pour déplacer les données comportementales vers des outils en aval où les données sont finalement activées :
- CDI pour synchroniser les données d'événement brutes
- CDP pour synchroniser les données brutes ainsi que les données modélisées visuellement
- ETL inversé pour synchroniser les données modélisées à l'aide de SQL dans un entrepôt de données
- Intégrations de destination par les outils d'analyse de produits pour synchroniser les données déjà disponibles dans les outils d'analyse de produits
Tous les éléments ci-dessus sont des moyens d'atteindre le même objectif : permettre aux équipes de créer des expériences personnalisées et basées sur les données dans les outils qu'elles utilisent au quotidien.
Les CDI et les CDP sont déjà couverts ci-dessus, alors passons aux deux autres technologies que vous pouvez utiliser pour rendre les données disponibles dans les outils d'activation en aval.

Différentes façons de déplacer des données vers des outils où l'activation des données a lieu ETL inversé
L'adoption rapide des entrepôts de données cloud a donné naissance à l'ETL inversé, un nouveau paradigme d'intégration de données qui vous permet d'activer les données qui se trouvent déjà dans l'entrepôt de données en les synchronisant avec des outils tiers. Ce processus et la technologie sous-jacente qui le rend possible sont également appelés analyses opérationnelles.
Les entreprises disposant d'équipes dédiées aux données investissent massivement dans la consolidation des données clients provenant de diverses sources dans l'entrepôt de données . Les outils ETL inversés tels que Hightouch, Grouparoo et Census permettent aux équipes de données de créer des modèles de données à l'aide de SQL au-dessus des données stockées dans l'entrepôt (ou d'apporter leurs modèles existants en intégrant des outils tels que dbt) et de synchroniser ces modèles avec des outils tiers en aval.
Cependant, la mise en œuvre et la maintenance d'un outil ETL inversé nécessitent une équipe de données interne ou au moins un ingénieur de données dédié, ce dont de nombreuses entreprises n'ont pas les ressources ni même le besoin.
Intégrations de destinations par analyse de produit
Les outils d'analyse de produits comme Amplitude, Heap et Mixpanel prennent en charge une gamme d'outils en tant que destinations de données, vous permettant de créer et de synchroniser des cohortes d'utilisateurs avec des outils en aval où les données sont activées. Ces intégrations évoluent constamment avec différents outils offrant des capacités variables.

Les différentes façons de déplacer des données à des fins d'analyse et d'activation Il convient de mentionner qu'Amplitude est allée plus loin et a intégré sa capacité à synchroniser les audiences avec des outils tiers via Amplitude Recommend. Cette approche présente des avantages notables :
- Au lieu de créer des cohortes dans un outil d'analyse de produits pour analyser les données, puis de créer les mêmes audiences dans l'outil CDP, CDI ou Reverse ETL, tout peut être fait dans un seul système intégré.
- Les intégrations bidirectionnelles avec des outils d'engagement vous permettent d'analyser les mesures de votre campagne directement dans l'outil d'analyse de produit, vous permettant de mesurer l'impact réel de vos campagnes d'engagement
Les entreprises disposant de ressources d'ingénierie de données limitées peuvent tirer une valeur significative de ces solutions intégrées qui permettent aux équipes de produits et de croissance d'évoluer rapidement sans dépendre des équipes de données.
Les grandes entreprises peuvent également bénéficier de cette approche en raison de la disponibilité limitée des ressources d'ingénierie des données et d'un arriéré massif de demandes de données provenant de diverses équipes.
Tirez parti d'une pile de données moderne pour la croissance et l'engagement
Maintenir une pile de données moderne pour la croissance n'est pas nécessairement la responsabilité d'une équipe de croissance, mais savoir comment les données sont collectées, stockées et déplacées permet aux professionnels de la croissance de tirer beaucoup plus facilement des informations à partir des données et d'agir efficacement sur ces informations.
De plus, alors que les personnes chargées de la croissance et des produits sont celles qui utilisent la majeure partie des outils de cette pile, les avantages d'une pile de données moderne peuvent être ressentis dans toute une organisation, de la génération de la demande et du développement des ventes à l'assistance et à la réussite des clients.
Donner aux équipes l'accès aux outils qui leur permettent d'être plus productives leur permet également de se perfectionner et de faire un travail plus significatif, les deux éléments les plus importants qui aident à attirer et à retenir les meilleurs talents.
Prêt à emmener vos données plus loin avec une pile de données moderne pour la croissance ? En savoir plus sur la puissance des données bien entretenues pour stimuler l'engagement et maîtriser la rétention.
