Was sind Datentypen und warum sind sie wichtig?

Veröffentlicht: 2022-03-03

Der Datentyp ist ein Attribut, das einem Datenelement zugeordnet ist und einem Computersystem mitteilt, wie sein Wert zu interpretieren ist. Das Verständnis von Datentypen stellt sicher, dass Daten im bevorzugten Format erfasst werden und der Wert jeder Eigenschaft wie erwartet ist.

Bitte beachten Sie, dass Datentypen nicht mit den beiden Datentypen verwechselt werden dürfen, die zusammen als Kundendaten bezeichnet werden – Entitätsdaten und Ereignisdaten.

Ein gutes Verständnis von Datentypen ist erforderlich, um Ereigniseigenschaften und Entitätseigenschaften richtig zu definieren. Ein gut definierter Tracking-Plan muss den Datentyp jeder Eigenschaft enthalten, um die Datengenauigkeit sicherzustellen und Datenverlust zu vermeiden.

Bevor wir uns mit der Bedeutung von Datentypen befassen, werfen wir einen Blick auf einige der gängigen Datentypen.

Gängige Datentypen

Ganzzahl (int)

Dies ist der am häufigsten verwendete numerische Datentyp zum Speichern von Zahlen ohne Bruchkomponente (-707, 0, 707).

Fließkomma (Float)

Es ist auch ein numerischer Datentyp, der zum Speichern von Zahlen verwendet wird, die eine Bruchkomponente haben können, wie dies bei Geldwerten der Fall ist (707,07, 0,7, 707,00).

Bitte beachten Sie, dass Zahl oft als Datentyp verwendet wird, der sowohl Int- als auch Float-Typen enthält.

Zeichen (char)

Es wird verwendet, um einen einzelnen Buchstaben, eine Ziffer, ein Satzzeichen, ein Symbol oder ein Leerzeichen zu speichern.

String (Str oder Text)

Es ist eine Folge von Zeichen und der am häufigsten verwendete Datentyp zum Speichern von Text. Zusätzlich kann ein String auch Ziffern und Symbole enthalten, wird aber immer als Text behandelt.

Eine Telefonnummer wird normalerweise als Zeichenfolge (+1-999-666-3333) gespeichert, kann aber auch als ganze Zahl (9996663333) gespeichert werden.

Boolesch (bool)

Es repräsentiert die Werte true und false. Bei der Arbeit mit dem booleschen Datentyp ist es hilfreich, daran zu denken, dass manchmal ein boolescher Wert auch als 0 (für falsch) und 1 (für wahr) dargestellt wird.

Aufzählungstyp (enum)

Es enthält einen kleinen Satz vordefinierter eindeutiger Werte (auch als Elemente oder Enumeratoren bezeichnet), die verglichen und einer Variablen des Datentyps „Enumeration“ zugewiesen werden können.

Die Werte eines Aufzählungstyps können textbasiert oder numerisch sein. Tatsächlich ist der boolesche Datentyp eine vordefinierte Aufzählung der Werte true und false.

Wenn beispielsweise Rock und Jazz die Enumeratoren sind, kann einer Aufzählungstypvariable genre einer der beiden Werte zugewiesen werden, aber nicht beiden.

Angenommen, Sie werden aufgefordert, Ihre Einstellungen in einer Musik-App einzugeben und über ein Dropdown-Menü eines der beiden Genres auszuwählen, speichert das variable Genre entweder Rock oder Jazz.

Beim Aufzählungstyp können Werte als numerische Indizes (0, 1, 2) oder Zeichenfolgen gespeichert und abgerufen werden.

Array

Ein Array, auch als Liste bekannt, ist ein Datentyp, der eine Reihe von Elementen in einer bestimmten Reihenfolge speichert, normalerweise alle vom gleichen Typ.

Da ein Array mehrere Elemente oder Werte speichert, wird die von einem Array gespeicherte Datenstruktur als Array-Datenstruktur bezeichnet.

Jedes Element eines Arrays kann mit einem ganzzahligen Index (0, 1, 2, …) abgerufen werden, und die Gesamtzahl der Elemente in einem Array repräsentiert die Länge eines Arrays.

Beispielsweise kann ein Array-Variablengenre eines oder mehrere der Elemente Rock, Jazz und Blues speichern. Die Indizes der drei Werte sind 0 (Rock), 1 (Jazz) und 2 (Blues), und die Länge des Arrays ist 3 (da es drei Elemente enthält).

Um das Beispiel der Musik-App fortzusetzen: Wenn Sie aufgefordert werden, eines oder mehrere der drei Genres auszuwählen, und Sie zufällig alle drei mögen (Prost darauf), speichert das variable Genre alle drei Elemente (Rock, Jazz, Blues). .

Datum

Benötigt keine Erklärung; speichert normalerweise ein Datum im Format YYYY-MM-DD (ISO 8601-Syntax).

Zeit

Speichert eine Uhrzeit im Format hh:mm:ss. Neben der Uhrzeit kann hier auch die verstrichene Zeit oder der Zeitabstand zwischen zwei Ereignissen gespeichert werden, der mehr als 24 Stunden betragen kann. Beispielsweise könnte die seit dem Eintreten eines Ereignisses verstrichene Zeit mehr als 72 Stunden (72:00:59) betragen.

Terminzeit

Speichert einen Wert, der Datum und Uhrzeit zusammen im Format YYYY-MM-DD hh:mm:ss enthält.

Zeitstempel

Ein Zeitstempel wird normalerweise in Unix-Zeit dargestellt und stellt die Anzahl der Sekunden dar, die seit Mitternacht (00:00:00 UTC) am 1. Januar 1970 vergangen sind.

Es wird normalerweise von Computersystemen verwendet, um das genaue Datum und die genaue Uhrzeit eines Ereignisses bis auf die Anzahl von Sekunden in einem Format zu protokollieren, das von Zeitzonen nicht beeinflusst wird. Daher bleibt der Zeitstempel im Gegensatz zu datetime unabhängig von Ihrem geografischen Standort gleich.

Wenn Sie darüber nachdenken, trägt jeder von uns einen Zeitstempel – geben Sie hier das Datum und die Uhrzeit Ihrer Geburt ein, um Ihre eigene zu sehen.

Beispiel und Zusammenfassung

Verschiedene Programmiersprachen bieten verschiedene andere Datentypen für eine Vielzahl von Zwecken, aber die am häufigsten verwendeten Datentypen, die Sie kennen müssen, um datengesteuert zu werden, wurden abgedeckt.

Eine gute Möglichkeit, über Datentypen nachzudenken, ist, wenn Sie auf ein Formular oder eine Umfrage stoßen.

Wenn Sie sich ein Standardregistrierungsformular ansehen, sollten Sie bedenken, dass jedes Feld Werte eines bestimmten Datentyps akzeptiert.

Ein Textfeld speichert die Eingabe als Zeichenfolge, während ein Zahlenfeld normalerweise eine Ganzzahl akzeptiert.

Namen und E-Mail-Adressen sind immer vom Typ Zeichenfolge, während Zahlen als numerischer Typ oder als Zeichenfolge gespeichert werden können, da eine Zeichenfolge eine Menge von Zeichen einschließlich Ziffern ist.

In Einzeloptions- oder Mehrfachoptionsfeldern, bei denen aus vordefinierten Optionen ausgewählt werden muss, kommen Datentypen, Aufzählungstypen und Arrays ins Spiel.

Datentypen Anmeldeformular

Im Facebook-Anmeldeformular oben hat das Feld „Geburtstag“ 3 Unterfelder, die jeweils vom Typ Aufzählung sind und Sie auffordern, jeweils eine Option für Tag, Monat und Jahr auszuwählen.

In ähnlicher Weise fordert Sie das Feld Geschlecht auf, aus den beiden vordefinierten Optionen auszuwählen oder eine benutzerdefinierte hinzuzufügen, deren Eingabe als Zeichenfolge gespeichert wird.

Zeichenfolgen wie Passwörter werden immer gehasht oder verschlüsselt (oder sollten es zumindest sein).

Sehen wir uns nun die Bedeutung von Datentypen an.

Bedeutung von Datentypen

Sie fragen sich vielleicht, warum es wichtig ist, all diese Datentypen zu kennen, wenn Sie sich hauptsächlich damit befassen, wie Sie Kundendaten nutzen können. Es gibt nur einen Hauptgrund: saubere und konsistente Daten zu sammeln.

Ihr Wissen über Datentypen wird sich in zwei Phasen Ihrer Datenerfassungsbemühungen als nützlich erweisen, wie unten beschrieben.

Instrumentierung

Der Prozess des Verfolgens von Verhaltensdaten aus primären Datenquellen und das Synchronisieren der Daten mit einem internen oder externen Speichersystem wird als Instrumentierung bezeichnet.

Der erste Schritt im Instrumentierungsprozess besteht darin, einen Datenverfolgungsplan zu erstellen. Alles, was Sie über einen Nachverfolgungsplan wissen müssen, wird in diesem Leitfaden behandelt.

Bei der Entscheidung, welche Ereignisse nachverfolgt und welche Eigenschaften erfasst werden sollen (sowohl Ereignis- als auch Entitätseigenschaften), macht die Angabe des Datentyps jeder Eigenschaft im Nachverfolgungsplan den Instrumentierungsprozess viel effizienter und lässt wenig Spielraum für Fehler.

Dies ist besonders hilfreich für Ingenieure, die mit der Umsetzung beauftragt sind. Indem sichergestellt wird, dass jede Eigenschaft mit dem richtigen Datentyp gesendet wird, können Dateninkonsistenzen vermieden werden.

Umfragen

Als datenorientierter Profi sammeln Sie wahrscheinlich Daten von Ihren Kunden über Umfragen während der gesamten Customer Journey – vom Onboarding bis zur Abwanderung.

Die Fragen, die Sie in einer Umfrage stellen, können offen sein (Text oder Zahl) oder mit vordefinierten Auswahlmöglichkeiten wie einer Dropdown-Liste (Enum), Kontrollkästchen (Array), Optionsfeldern (boolesch) oder sogar einem Schieberegler (abhängig) kommen. .

Um die Daten aus Umfragen (in einer Datenbank oder einem Drittsystem) zu speichern, müssen Sie einen Eigenschaftsnamen (Branchenname, Job_Rolle, Absagegrund, ist_zufrieden usw.) und seinen Datentyp (Zeichenfolge, Zahl, Boolean usw.) angeben. ) für jedes Feld in Ihrer Umfrage. Der Eigenschaftsname speichert den eingegebenen Wert und der Datentyp bestätigt, dass der Wert wie erwartet ist.

Dies führt zu konsistenten Daten und erleichtert die Analyse und Aktivierung der Daten. Denken Sie daran, dass offene Fragen eine schwierigere Analyse ermöglichen, da Sie die Antworten nicht aggregieren können, es sei denn, Sie transformieren die Daten, indem Sie jede Antwort analysieren und den Text extrahieren, der einer Regel entspricht.

Mit vordefinierten Auswahlmöglichkeiten ist die Analyse unkompliziert und wird nicht beeinträchtigt, selbst wenn Sie die Auswahl zu einem späteren Zeitpunkt ändern (siehe Enum- und Array-Datentypen).

Datentypen in die Praxis umsetzen

Die Anwendung Ihres Wissens über Datentypen ist nicht auf die Datenerfassung oder Instrumentierung beschränkt; andere Aktivitäten wie Datenverwaltung, Datenintegration und interne Anwendungsentwicklung (unter Verwendung von No-Code- oder Low-Code-Tools) sollten jetzt, da Sie die verschiedenen Datentypen verstehen, ebenfalls viel einfacher werden.


Erfahren Sie, wie Sie mit Daten noch weiter gehen können, indem Sie einen modernen Datenstapel für Wachstum aufbauen und Daten zur Steigerung der Kundenbindung nutzen. Oder sehen Sie sich Ihre Datentypen in Amplitude an .

Produktanalytik für Dummies