Что такое типы данных и почему они важны?
Опубликовано: 2022-03-03Тип данных — это атрибут, связанный с частью данных, который сообщает компьютерной системе, как интерпретировать его значение. Понимание типов данных гарантирует, что данные собираются в предпочтительном формате, а значение каждого свойства соответствует ожидаемому.
Имейте в виду, что типы данных не следует путать с двумя типами данных, которые вместе называются данными о клиентах, — данными сущностей и данными о событиях.
Для правильного определения свойств событий и свойств сущностей требуется хорошее понимание типов данных. Четко определенный план отслеживания должен содержать тип данных каждого свойства, чтобы обеспечить точность данных и предотвратить их потерю.
Прежде чем перейти к важности типов данных, давайте рассмотрим некоторые распространенные типы данных.
Общие типы данных
Целое (целое)
Это наиболее распространенный числовой тип данных, используемый для хранения чисел без дробной части (-707, 0, 707).
Плавающая точка (с плавающей запятой)
Это также числовой тип данных, используемый для хранения чисел, которые могут иметь дробную составляющую, как денежные значения (707,07, 0,7, 707,00).
Обратите внимание, что число часто используется как тип данных, который включает в себя как типы int, так и типы с плавающей запятой.
Персонаж (персонаж)
Он используется для хранения одной буквы, цифры, знака препинания, символа или пробела.
Строка (str или text)
Это последовательность символов и наиболее часто используемый тип данных для хранения текста. Кроме того, строка может также содержать цифры и символы, однако она всегда обрабатывается как текст.
Номер телефона обычно хранится в виде строки (+1-999-666-3333), но также может быть сохранен в виде целого числа (9996663333).
логическое значение (bool)
Он представляет значения true и false. При работе с логическим типом данных полезно помнить, что иногда логическое значение также представляется как 0 (ложь) и 1 (истина).
Перечислимый тип (enum)
Он содержит небольшой набор предопределенных уникальных значений (также известных как элементы или перечислители), которые можно сравнивать и назначать переменной перечисляемого типа данных.
Значения перечисляемого типа могут быть текстовыми или числовыми. По сути, логический тип данных — это предопределенное перечисление значений true и false.
Например, если перечислителями являются рок и джаз, переменной жанра перечисляемого типа может быть присвоено одно из двух значений, но не оба одновременно.
Если вас попросят указать ваши предпочтения в музыкальном приложении и выбрать один из двух жанров в раскрывающемся меню, переменный жанр будет хранить либо рок, либо джаз.
С перечисляемым типом значения могут храниться и извлекаться в виде числовых индексов (0, 1, 2) или строк.
Множество
Массив, также известный как список, представляет собой тип данных, в котором хранится ряд элементов в определенном порядке, обычно все одного типа.
Поскольку в массиве хранится несколько элементов или значений, структура данных, хранящихся в массиве, называется структурой данных массива.
Каждый элемент массива можно получить с помощью целочисленного индекса (0, 1, 2,…), а общее количество элементов в массиве представляет собой длину массива.
Например, переменная жанра массива может хранить один или несколько элементов рок, джаз и блюз. Индексы трех значений равны 0 (рок), 1 (джаз) и 2 (блюз), а длина массива равна 3 (поскольку он содержит три элемента).
Продолжая пример с музыкальным приложением, если вас попросят выбрать один или несколько из трех жанров, и вам понравятся все три (приветствую вас), переменная жанра сохранит все три элемента (рок, джаз, блюз). .
Дата
Не нуждается в объяснении; обычно хранит дату в формате ГГГГ-ММ-ДД (синтаксис ISO 8601).
Время
Сохраняет время в формате чч:мм:сс. Помимо времени суток, его также можно использовать для хранения прошедшего времени или временного интервала между двумя событиями, который может превышать 24 часа. Например, время, прошедшее с момента события, может составлять более 72 часов (72:00:59).
Дата и время
Сохраняет значение, содержащее одновременно дату и время в формате ГГГГ-ММ-ДД чч:мм:сс.
Отметка времени
Обычно представленная во времени Unix, отметка времени представляет собой количество секунд, прошедших с полуночи (00:00:00 UTC) 1 января 1970 года.
Обычно он используется компьютерными системами для регистрации точной даты и времени события с точностью до количества секунд в формате, на который не влияют часовые пояса. Поэтому, в отличие от даты и времени, временная метка остается неизменной независимо от вашего географического положения.
Если подумать, у каждого из нас есть временная метка — введите здесь дату и время своего рождения, чтобы увидеть свои собственные.

Пример и резюме
Различные языки программирования предлагают различные другие типы данных для различных целей, однако были рассмотрены наиболее часто используемые типы данных, которые вам необходимо знать, чтобы стать управляемым данными.
Хороший способ подумать о типах данных — это когда вы сталкиваетесь с какой-либо формой или опросом.
Глядя на стандартную регистрационную форму, следует иметь в виду, что каждое поле принимает значения определенного типа данных.
Текстовое поле хранит ввод в виде строки, а числовое поле обычно принимает целое число.
Имена и адреса электронной почты всегда имеют строковый тип, в то время как числа могут храниться как числовой тип или как строка, поскольку строка представляет собой набор символов, включая цифры.
В полях с одним или несколькими параметрами, где нужно выбирать из предопределенных параметров, в игру вступают перечисляемые типы данных и массивы.

В приведенной выше форме регистрации в Facebook поле «День рождения» имеет 3 подполя, каждое из которых относится к перечисляемому типу, в котором вам предлагается выбрать один вариант для дня, месяца и года соответственно.
Точно так же поле «Пол» требует, чтобы вы выбрали один из двух предопределенных вариантов или добавили пользовательский, ввод которого сохраняется в виде строки.
Строки, такие как пароли, всегда хешируются или шифруются (или, по крайней мере, должны быть).
Теперь давайте посмотрим на важность типов данных.
Важность типов данных
Вам может быть интересно, почему так важно знать обо всех этих типах данных, когда вас в основном интересует понимание того, как использовать данные о клиентах. Есть только одна основная причина — собрать чистые и непротиворечивые данные.
Ваши знания о типах данных пригодятся на двух этапах сбора данных, как описано ниже.
Инструментарий
Процесс отслеживания поведенческих данных из первичных источников данных и синхронизации данных с внутренней или внешней системой хранения называется инструментированием.
Первым шагом в процессе инструментирования является создание плана отслеживания данных. Все, что вам нужно знать о плане отслеживания, описано в этом руководстве.
При принятии решения о том, какие события отслеживать и какие свойства собирать (как события, так и сущности), указание типа данных каждого свойства в плане отслеживания делает процесс инструментирования намного более эффективным и оставляет мало места для ошибок.
Это особенно полезно для инженеров, которым поручено внедрение. Убедившись, что каждое свойство отправляется с правильным типом данных, можно избежать несогласованности данных.
Опросы
Как профессионал, работающий с данными, вы, вероятно, будете собирать данные от своих клиентов с помощью опросов на протяжении всего пути клиента — от регистрации до оттока.
Вопросы, которые вы задаете в опросе, могут быть открытыми (текстовые или числовые) или иметь предопределенные варианты выбора, такие как раскрывающийся список (перечисление), флажки (массив), переключатели (логическое значение) или даже ползунок (зависит). .
Для хранения данных опросов (в базе данных или сторонней системе) необходимо указать имя свойства (название_отрасли, роль_работы, причина_отмены, удовлетворено_и т.д.) и его тип данных (строка, число, логическое значение и т.д. ) для каждого поля в вашем опросе. Имя свойства сохраняет введенное значение, а тип данных подтверждает, что значение соответствует ожидаемому.
Это приводит к согласованности данных и упрощает их анализ и активацию. Следует иметь в виду, что открытые вопросы усложняют анализ, поскольку вы не можете агрегировать ответы, если не преобразуете данные, анализируя каждый ответ и извлекая текст, соответствующий правилу.
С предопределенными вариантами анализ выполняется просто и не влияет на него, даже если вы измените варианты на более позднем этапе (см. типы данных перечисления и массива).
Применение типов данных на практике
Применение ваших знаний о типах данных не ограничивается сбором или инструментированием данных; другие действия, такие как управление данными, интеграция данных и разработка внутренних приложений (с использованием инструментов без кода или с низким кодом), также должны стать намного проще теперь, когда вы понимаете различные типы данных.
Узнайте, как вы можете пойти дальше с данными, создав современный стек данных для роста и используя данные для повышения удержания. Или посмотрите свои типы данных в Amplitude .
