¿Qué son los tipos de datos y por qué son importantes?
Publicado: 2022-03-03El tipo de datos es un atributo asociado con un dato que le dice a un sistema informático cómo interpretar su valor. Comprender los tipos de datos garantiza que los datos se recopilen en el formato preferido y que el valor de cada propiedad sea el esperado.
Tenga en cuenta que los tipos de datos no deben confundirse con los dos tipos de datos a los que se hace referencia en conjunto como datos de clientes: datos de entidades y datos de eventos.
Se requiere una buena comprensión de los tipos de datos para definir correctamente las propiedades de los eventos y las propiedades de las entidades. Un plan de seguimiento bien definido debe contener el tipo de datos de cada propiedad para garantizar la precisión de los datos y evitar la pérdida de datos.
Antes de saltar a la importancia de los tipos de datos, echemos un vistazo a algunos de los tipos de datos comunes.
Tipos de datos comunes
entero (int)
Es el tipo de dato numérico más común usado para almacenar números sin un componente fraccionario (-707, 0, 707).
Punto flotante (flotante)
También es un tipo de datos numérico que se utiliza para almacenar números que pueden tener un componente fraccionario como los valores monetarios (707,07, 0,7, 707,00).
Tenga en cuenta que el número se usa a menudo como un tipo de datos que incluye tipos int y float.
Carácter (caracter)
Se utiliza para almacenar una sola letra, dígito, signo de puntuación, símbolo o espacio en blanco.
Cadena (cadena o texto)
Es una secuencia de caracteres y el tipo de datos más utilizado para almacenar texto. Además, una cadena también puede incluir dígitos y símbolos; sin embargo, siempre se trata como texto.
Un número de teléfono generalmente se almacena como una cadena (+1-999-666-3333), pero también se puede almacenar como un número entero (9996663333).
Booleano (bool)
Representa los valores verdadero y falso. Cuando se trabaja con el tipo de datos booleano, es útil tener en cuenta que, a veces, un valor booleano también se representa como 0 (falso) y 1 (verdadero).
Tipo enumerado (enum)
Contiene un pequeño conjunto de valores únicos predefinidos (también conocidos como elementos o enumeradores) que se pueden comparar y asignar a una variable de tipo de datos enumerados.
Los valores de un tipo enumerado pueden estar basados en texto o ser numéricos. De hecho, el tipo de datos booleano es una enumeración predefinida de los valores verdadero y falso.
Por ejemplo, si el rock y el jazz son los enumeradores, a un género variable de tipo enumerado se le puede asignar cualquiera de los dos valores, pero no ambos.
Suponiendo que se le pida que complete sus preferencias en una aplicación de música y que elija uno de los dos géneros a través de un menú desplegable, el género variable almacenará rock o jazz.
Con el tipo enumerado, los valores se pueden almacenar y recuperar como índices numéricos (0, 1, 2) o cadenas.
Formación
También conocida como lista, una matriz es un tipo de datos que almacena una cantidad de elementos en un orden específico, generalmente todos del mismo tipo.
Dado que una matriz almacena múltiples elementos o valores, la estructura de los datos almacenados por una matriz se denomina estructura de datos de matriz.
Cada elemento de una matriz se puede recuperar usando un índice entero (0, 1, 2,...), y el número total de elementos en una matriz representa la longitud de una matriz.
Por ejemplo, un género variable de matriz puede almacenar uno o más de los elementos rock, jazz y blues. Los índices de los tres valores son 0 (rock), 1 (jazz) y 2 (blues), y la longitud de la matriz es 3 (ya que contiene tres elementos).
Continuando con el ejemplo de la aplicación de música, si se le pide que elija uno o más de los tres géneros y le gustan los tres (salud por eso), el género variable almacenará los tres elementos (rock, jazz, blues) .
Fecha
No necesita explicación; normalmente almacena una fecha en el formato AAAA-MM-DD (sintaxis ISO 8601).
Tiempo
Almacena una hora en formato hh:mm:ss. Además de la hora del día, también se puede utilizar para almacenar el tiempo transcurrido o el intervalo de tiempo entre dos eventos que puede ser de más de 24 horas. Por ejemplo, el tiempo transcurrido desde que se produjo un evento podría ser de más de 72 horas (72:00:59).
Fecha y hora
Almacena un valor que contiene la fecha y la hora juntas en el formato AAAA-MM-DD hh:mm:ss.
marca de tiempo
Típicamente representada en tiempo Unix, una marca de tiempo representa la cantidad de segundos que han transcurrido desde la medianoche (00:00:00 UTC) del 1 de enero de 1970.
Por lo general, los sistemas informáticos lo utilizan para registrar la fecha y la hora precisas de un evento, hasta la cantidad de segundos, en un formato que no se ve afectado por las zonas horarias. Por lo tanto, a diferencia de la fecha y hora, la marca de tiempo sigue siendo la misma independientemente de su ubicación geográfica.
Si lo piensa, cada uno de nosotros lleva una marca de tiempo: ingrese la fecha y la hora de su nacimiento aquí para ver la suya.

Ejemplo y resumen
Diferentes lenguajes de programación ofrecen varios otros tipos de datos para una variedad de propósitos, sin embargo, se han cubierto los tipos de datos más utilizados que necesita saber para convertirse en dirigido por datos.
Una buena manera de pensar en los tipos de datos es cuando te encuentras con cualquier formulario o encuesta.
Al mirar un formulario de registro estándar, debe tener en cuenta que cada campo acepta valores de un tipo de datos en particular.
Un campo de texto almacena la entrada como una cadena, mientras que un campo numérico generalmente acepta un número entero.
Los nombres y las direcciones de correo electrónico son siempre del tipo cadena, mientras que los números se pueden almacenar como un tipo numérico o como una cadena, ya que una cadena es un conjunto de caracteres que incluye dígitos.
En campos de opción única o de opción múltiple, donde uno tiene que seleccionar entre opciones predefinidas, los tipos de datos enumerados y las matrices entran en juego.

En el formulario de registro de Facebook anterior, el campo Cumpleaños tiene 3 subcampos, cada uno de tipo enumerado que le pide que elija una opción para el día, el mes y el año, respectivamente.
De manera similar, el campo Género quiere que elija entre las dos opciones predefinidas o agregue una personalizada, cuya entrada se almacena como cadena.
Las cadenas como las contraseñas siempre están codificadas o cifradas (o al menos deberían estarlo).
Ahora veamos la importancia de los tipos de datos.
Importancia de los tipos de datos
Quizás se pregunte por qué es importante conocer todos estos tipos de datos cuando lo que más le preocupa es comprender cómo aprovechar los datos de los clientes. Solo hay una razón principal: recopilar datos limpios y consistentes.
Su conocimiento de los tipos de datos será útil en dos etapas de sus esfuerzos de recopilación de datos, como se describe a continuación.
Instrumentación
El proceso de rastrear datos de comportamiento de fuentes de datos primarias y sincronizar los datos con un sistema de almacenamiento interno o externo se conoce como instrumentación.
El primer paso en el proceso de instrumentación es crear un plan de seguimiento de datos. Todo lo que necesita saber sobre un plan de seguimiento está cubierto en esta guía.
Al decidir qué eventos rastrear y qué propiedades recopilar (tanto las propiedades del evento como las de la entidad), especificar el tipo de datos de cada propiedad en el plan de seguimiento hace que el proceso de instrumentación sea mucho más eficiente y deja poco margen de error.
Esto es particularmente útil para los ingenieros encargados de la implementación. Al asegurarse de que cada propiedad se envíe con el tipo de datos correcto, se puede evitar la inconsistencia de los datos.
Encuestas
Como profesional orientado a los datos, es probable que recopile datos de sus clientes a través de encuestas a lo largo del viaje del cliente, desde la incorporación hasta la rotación.
Las preguntas que haga en una encuesta pueden ser abiertas (texto o número) o venir con opciones predefinidas como una lista desplegable (enumeración), casillas de verificación (matriz), botones de opción (booleano) o incluso un control deslizante (depende) .
Para almacenar los datos de las encuestas (en una base de datos o en un sistema de terceros), debe especificar un nombre de propiedad (industry_name, job_role, cancel_reason, is_satisfied, etc.) y su tipo de datos (cadena, número, booleano, etc.) ) para cada campo de su encuesta. El nombre de la propiedad almacena el valor ingresado y el tipo de datos valida que el valor es el esperado.
Si lo hace, los datos serán coherentes y será más fácil analizarlos y activarlos. Es bueno tener en cuenta que las preguntas abiertas hacen que el análisis sea más complicado, ya que no puede agregar las respuestas a menos que transforme los datos analizando cada respuesta y extrayendo el texto que coincide con una regla.
Con opciones predefinidas, el análisis es sencillo y no se ve afectado incluso si cambia las opciones en una etapa posterior (consulte los tipos de datos de enumeración y matriz).
Poner en práctica los tipos de datos
La aplicación de su conocimiento sobre los tipos de datos no se limita a la recopilación o instrumentación de datos; otras actividades, como la gestión de datos, la integración de datos y el desarrollo de aplicaciones internas (utilizando herramientas sin código o de bajo código) también deberían ser mucho más fáciles ahora que comprende los diversos tipos de datos.
Aprenda cómo puede ir más allá con los datos mediante la creación de una pila de datos moderna para el crecimiento y el uso de datos para impulsar la retención. O vea sus tipos de datos en Amplitud .
