Que sont les types de données et pourquoi sont-ils importants ?

Publié: 2022-03-03

Le type de données est un attribut associé à une donnée qui indique à un système informatique comment interpréter sa valeur. La compréhension des types de données garantit que les données sont collectées dans le format préféré et que la valeur de chaque propriété est celle attendue.

N'oubliez pas que les types de données ne doivent pas être confondus avec les deux types de données appelés ensemble données client : données d'entité et données d'événement.

Une bonne compréhension des types de données est nécessaire pour définir correctement les propriétés d'événement et les propriétés d'entité. Un plan de suivi bien défini doit contenir le type de données de chaque propriété pour garantir l'exactitude des données et éviter la perte de données.

Avant de passer à l'importance des types de données, examinons certains des types de données courants.

Types de données courants

Entier (entier)

Il s'agit du type de données numériques le plus couramment utilisé pour stocker des nombres sans composante fractionnaire (-707, 0, 707).

Virgule flottante (flotteur)

Il s'agit également d'un type de données numériques utilisé pour stocker des nombres qui peuvent avoir une composante fractionnaire comme le font les valeurs monétaires (707.07, 0.7, 707.00).

Veuillez noter que le nombre est souvent utilisé comme type de données qui inclut à la fois les types int et float.

Caractère (char)

Il est utilisé pour stocker une seule lettre, un chiffre, un signe de ponctuation, un symbole ou un espace vide.

Chaîne (chaîne ou texte)

Il s'agit d'une séquence de caractères et du type de données le plus couramment utilisé pour stocker du texte. De plus, une chaîne peut également inclure des chiffres et des symboles, mais elle est toujours traitée comme du texte.

Un numéro de téléphone est généralement stocké sous forme de chaîne (+1-999-666-3333) mais peut également être stocké sous forme de nombre entier (9996663333).

Booléen (bool)

Il représente les valeurs true et false. Lorsque vous travaillez avec le type de données booléen, il est utile de garder à l'esprit que parfois une valeur booléenne est également représentée par 0 (pour faux) et 1 (pour vrai).

Type énuméré (enum)

Il contient un petit ensemble de valeurs uniques prédéfinies (également appelées éléments ou énumérateurs) qui peuvent être comparées et affectées à une variable de type de données énumérées.

Les valeurs d'un type énuméré peuvent être textuelles ou numériques. En fait, le type de données booléen est une énumération prédéfinie des valeurs true et false.

Par exemple, si le rock et le jazz sont les énumérateurs, un genre variable de type énuméré peut être affecté à l'une ou l'autre des deux valeurs, mais pas aux deux.

En supposant qu'on vous demande de renseigner vos préférences sur une application musicale et qu'on vous demande de choisir l'un des deux genres via un menu déroulant, le genre variable stockera soit du rock, soit du jazz.

Avec le type énuméré, les valeurs peuvent être stockées et récupérées sous forme d'indices numériques (0, 1, 2) ou de chaînes.

Déployer

Aussi connu sous le nom de liste, un tableau est un type de données qui stocke un certain nombre d'éléments dans un ordre spécifique, généralement tous du même type.

Puisqu'un tableau stocke plusieurs éléments ou valeurs, la structure des données stockées par un tableau est appelée structure de données de tableau.

Chaque élément d'un tableau peut être récupéré à l'aide d'un index entier (0, 1, 2,…), et le nombre total d'éléments dans un tableau représente la longueur d'un tableau.

Par exemple, une variable tableau genre peut stocker un ou plusieurs éléments rock, jazz et blues. Les indices des trois valeurs sont 0 (rock), 1 (jazz) et 2 (blues), et la longueur du tableau est 3 (puisqu'il contient trois éléments).

En continuant sur l'exemple de l'application musicale, si on vous demande de choisir un ou plusieurs des trois genres et que vous aimez les trois (bravo), le genre variable stockera les trois éléments (rock, jazz, blues) .

Date

N'a besoin d'aucune explication; stocke généralement une date au format AAAA-MM-JJ (syntaxe ISO 8601).

Temps

Stocke une heure au format hh:mm:ss. Outre l'heure de la journée, il peut également être utilisé pour stocker le temps écoulé ou l'intervalle de temps entre deux événements qui peut être supérieur à 24 heures. Par exemple, le temps écoulé depuis qu'un événement a eu lieu peut être supérieur à 72 heures (72:00:59).

Dateheure

Stocke une valeur contenant à la fois la date et l'heure au format AAAA-MM-JJ hh:mm:ss.

Horodatage

Généralement représenté en heure Unix, un horodatage représente le nombre de secondes qui se sont écoulées depuis minuit (00:00:00 UTC), le 1er janvier 1970.

Il est généralement utilisé par les systèmes informatiques pour enregistrer la date et l'heure précises d'un événement, jusqu'au nombre de secondes, dans un format qui n'est pas affecté par les fuseaux horaires. Par conséquent, contrairement à la date et à l'heure, l'horodatage reste le même quelle que soit votre situation géographique.

Si vous y réfléchissez, chacun de nous porte un horodatage - entrez la date et l'heure de votre naissance ici pour voir les vôtres.

Exemple et récapitulatif

Différents langages de programmation offrent divers autres types de données à des fins diverses, cependant, les types de données les plus couramment utilisés que vous devez connaître pour devenir axé sur les données ont été couverts.

Une bonne façon de penser aux types de données est lorsque vous rencontrez un formulaire ou une enquête.

En regardant un formulaire d'inscription standard, vous devez garder à l'esprit que chaque champ accepte des valeurs d'un type de données particulier.

Un champ de texte stocke l'entrée sous forme de chaîne, tandis qu'un champ numérique accepte généralement un nombre entier.

Les noms et les adresses e-mail sont toujours du type chaîne, tandis que les nombres peuvent être stockés sous forme numérique ou sous forme de chaîne, car une chaîne est un ensemble de caractères comprenant des chiffres.

Dans les champs à option unique ou à options multiples, où l'on doit choisir parmi des options prédéfinies, les types de données énumérés et les tableaux entrent en jeu.

Formulaire d'inscription aux types de données

Dans le formulaire d'inscription Facebook ci-dessus, le champ Anniversaire comporte 3 sous-champs, chacun de type énuméré vous demandant de choisir une option pour le jour, le mois et l'année respectivement.

De même, le champ Sexe vous demande de choisir parmi les deux choix prédéfinis ou d'en ajouter un personnalisé, dont l'entrée est stockée sous forme de chaîne.

Les chaînes comme les mots de passe sont toujours hachées ou cryptées (ou du moins devraient l'être).

Voyons maintenant l'importance des types de données.

Importance des types de données

Vous vous demandez peut-être pourquoi il est important de connaître tous ces types de données alors que vous vous souciez principalement de comprendre comment exploiter les données client. Il n'y a qu'une seule raison principale : collecter des données propres et cohérentes.

Votre connaissance des types de données vous sera utile à deux étapes de vos efforts de collecte de données, comme décrit ci-dessous.

Instrumentation

Le processus de suivi des données comportementales à partir de sources de données principales et de synchronisation des données avec un système de stockage interne ou externe est appelé instrumentation.

La première étape du processus d'instrumentation consiste à créer un plan de suivi des données. Tout ce que vous devez savoir sur un plan de suivi est couvert dans ce guide.

Lors du choix des événements à suivre et des propriétés à collecter (à la fois les propriétés d'événement et d'entité), la spécification du type de données de chaque propriété dans le plan de suivi rend le processus d'instrumentation beaucoup plus efficace et laisse peu de place à l'erreur.

Ceci est particulièrement utile pour les ingénieurs chargés de la mise en œuvre. En s'assurant que chaque propriété est envoyée avec le type de données correct, l'incohérence des données peut être évitée.

Enquêtes

En tant que professionnel axé sur les données, il est probable que vous collecterez des données auprès de vos clients via des enquêtes tout au long du parcours client, de l'intégration au désabonnement.

Les questions que vous posez dans une enquête peuvent être ouvertes (texte ou nombre) ou être accompagnées de choix prédéfinis comme une liste déroulante (enum), des cases à cocher (tableau), des boutons radio (booléen) ou même un curseur (selon) .

Pour stocker les données des enquêtes (dans une base de données ou un système tiers), vous devez spécifier un nom de propriété (industry_name, job_role, cancel_reason, is_satisfied, etc.) et son type de données (string, number, boolean, etc. ) pour chaque champ de votre enquête. Le nom de la propriété stocke la valeur entrée et le type de données valide que la valeur est celle attendue.

Cela permet d'obtenir des données cohérentes et facilite l'analyse et l'activation des données. Il est bon de garder à l'esprit que les questions ouvertes rendent l'analyse plus difficile car vous ne pouvez pas agréger les réponses à moins de transformer les données en analysant chaque réponse et en extrayant le texte qui correspond à une règle.

Avec des choix prédéfinis, l'analyse est simple et n'est pas affectée même si vous modifiez les choix ultérieurement (reportez-vous aux types de données enum et tableau).

Mise en pratique des types de données

L'application de vos connaissances sur les types de données ne se limite pas à la collecte de données ou à l'instrumentation ; d'autres activités telles que la gestion des données, l'intégration des données et le développement d'applications internes (à l'aide d'outils sans code ou à faible code) devraient également devenir beaucoup plus faciles maintenant que vous comprenez les différents types de données.


Découvrez comment vous pouvez aller plus loin avec les données en créant une pile de données moderne pour la croissance et en utilisant les données pour favoriser la rétention. Ou consultez vos types de données dans Amplitude .

L'analyse des produits pour les nuls