什么是数据类型,为什么它们很重要?
已发表: 2022-03-03数据类型是与一条数据相关联的属性,它告诉计算机系统如何解释其值。 了解数据类型可确保以首选格式收集数据,并且每个属性的值都符合预期。
请记住,不要将数据类型与统称为客户数据的两种数据类型相混淆——实体数据和事件数据。
正确定义事件属性和实体属性需要对数据类型有很好的理解。 一个定义明确的跟踪计划必须包含每个属性的数据类型,以确保数据准确性并防止数据丢失。
在讨论数据类型的重要性之前,让我们先来看看一些常见的数据类型。
常用数据类型
整数 (int)
它是最常见的数字数据类型,用于存储不带小数部分的数字(-707、0、707)。
浮点数(浮点数)
它也是一种数字数据类型,用于存储可能具有小数部分的数字,如货币值(707.07、0.7、707.00)。
请注意,数字通常用作包括 int 和 float 类型的数据类型。
字符(字符)
它用于存储单个字母、数字、标点符号、符号或空格。
字符串(字符串或文本)
它是一个字符序列,也是存储文本最常用的数据类型。 此外,字符串还可以包含数字和符号,但是,它始终被视为文本。
电话号码通常存储为字符串 (+1-999-666-3333),但也可以存储为整数 (9996663333)。
布尔值(布尔值)
它表示值 true 和 false。 使用布尔数据类型时,记住有时布尔值也表示为 0(表示假)和 1(表示真)是有帮助的。
枚举类型(enum)
它包含一小组预定义的唯一值(也称为元素或枚举器),可以比较这些值并分配给枚举数据类型的变量。
枚举类型的值可以是基于文本的或数字的。 实际上,布尔数据类型是值 true 和 false 的预定义枚举。
例如,如果 Rock 和 jazz 是枚举数,则可以为枚举类型变量 Genre 分配两个值中的任何一个,但不能同时分配这两个值。
假设您被要求在音乐应用程序上填写您的偏好,并被要求通过下拉菜单选择两种流派中的一种,则变量流派将存储摇滚或爵士乐。
使用枚举类型,可以将值存储和检索为数字索引(0、1、2)或字符串。
大批
也称为列表,数组是一种数据类型,它以特定顺序存储许多元素,通常都是相同的类型。
由于数组存储多个元素或值,因此数组存储的数据结构称为数组数据结构。
可以使用整数索引 (0, 1, 2,…) 检索数组的每个元素,数组中元素的总数表示数组的长度。
例如,数组变量流派可以存储一个或多个元素摇滚、爵士和布鲁斯。 三个值的索引分别为 0(摇滚)、1(爵士)和 2(布鲁斯),数组的长度为 3(因为它包含三个元素)。
继续音乐应用程序的示例,如果要求您选择三种类型中的一种或多种,并且您碰巧喜欢这三种类型(为此欢呼),变量流派将存储所有三种元素(摇滚、爵士、蓝调) .
日期
无需解释; 通常以 YYYY-MM-DD 格式(ISO 8601 语法)存储日期。
时间
以 hh:mm:ss 格式存储时间。 除了一天中的时间,它还可以用于存储经过的时间或两个事件之间的时间间隔,可能超过 24 小时。 例如,事件发生后经过的时间可能超过 72 小时 (72:00:59)。
约会时间
以 YYYY-MM-DD hh:mm:ss 格式存储包含日期和时间的值。
时间戳
通常以 Unix 时间表示,时间戳表示自 1970 年 1 月 1 日午夜 (00:00:00 UTC) 以来经过的秒数。
计算机系统通常使用它以不受时区影响的格式记录事件的精确日期和时间,精确到秒数。 因此,与日期时间不同,无论您的地理位置如何,时间戳都保持不变。
如果你仔细想想,我们每个人都有一个时间戳——在这里输入你的出生日期和时间来查看你自己的。

示例和回顾
不同的编程语言为各种目的提供各种其他数据类型,但是,您需要知道成为数据主导的最常用数据类型已被涵盖。
考虑数据类型的一个好方法是遇到任何表格或调查。
查看标准注册表单,您应该记住每个字段都接受特定数据类型的值。
文本字段将输入存储为字符串,而数字字段通常接受整数。
姓名和电子邮件地址始终是字符串类型,而数字可以存储为数字类型或字符串,因为字符串是一组包含数字的字符。
在单个选项或多个选项字段中,必须从预定义的选项中进行选择,数据类型枚举类型和数组开始发挥作用。

在上面的 Facebook 注册表单中,生日字段有 3 个子字段,每个子字段都是枚举类型,要求您分别为日、月和年选择一个选项。
同样,Gender 字段希望您从两个预定义选项中进行选择或添加一个自定义选项,其输入存储为字符串。
像密码这样的字符串总是经过散列或加密(或至少应该是)。
现在让我们看看数据类型的重要性。
数据类型的重要性
您可能想知道,当您主要关心如何利用客户数据时,了解所有这些数据类型为何如此重要。 只有一个主要原因——收集干净和一致的数据。
您对数据类型的了解将在您的数据收集工作的两个阶段中派上用场,如下所述。
仪器仪表
从主要数据源跟踪行为数据并将数据同步到内部或外部存储系统的过程称为检测。
检测过程的第一步是创建数据跟踪计划。 本指南涵盖了您需要了解的有关跟踪计划的所有信息。
在决定要跟踪哪些事件以及要收集哪些属性(事件和实体属性)时,在跟踪计划中指定每个属性的数据类型会使检测过程更加高效,并且几乎没有出错的余地。
这对于负责实施的工程师特别有用。 通过确保使用正确的数据类型发送每个属性,可以避免数据不一致。
调查
作为以数据为主导的专业人士,您很可能会通过整个客户旅程(从入职到流失)的调查从客户那里收集数据。
您在调查中提出的问题可以是开放式的(文本或数字),也可以带有预定义的选项,例如下拉列表(枚举)、复选框(数组)、单选按钮(布尔值),甚至是滑块(取决于) .
要存储来自调查的数据(在数据库或第三方系统中),您需要指定属性名称(industry_name、job_role、cancellation_reason、is_satisfied 等)及其数据类型(字符串、数字、布尔值等)。 ) 用于调查中的每个字段。 属性名称存储输入的值,数据类型验证该值是否符合预期。
这样做会导致数据保持一致,并更容易分析和激活数据。 请记住,开放式问题会使分析更加困难,因为除非您通过解析每个响应并提取与规则匹配的文本来转换数据,否则您无法汇总响应。
使用预定义的选项,分析很简单,即使您在稍后阶段更改选项也不受影响(请参阅枚举和数组数据类型)。
将数据类型付诸实践
数据类型知识的应用不限于数据收集或检测; 既然您了解了各种数据类型,其他活动,如数据管理、数据集成和内部应用程序开发(使用无代码或低代码工具)也应该变得容易得多。
了解如何通过构建现代数据堆栈以促进增长并使用数据来提高保留率,从而进一步利用数据。 或者,在 Amplitude 中查看您的数据类型。
