什麼是數據類型,為什麼它們很重要?
已發表: 2022-03-03數據類型是與一條數據相關聯的屬性,它告訴計算機系統如何解釋其值。 了解數據類型可確保以首選格式收集數據,並且每個屬性的值都符合預期。
請記住,不要將數據類型與統稱為客戶數據的兩種數據類型相混淆——實體數據和事件數據。
正確定義事件屬性和實體屬性需要對數據類型有很好的理解。 一個定義明確的跟踪計劃必須包含每個屬性的數據類型,以確保數據準確性並防止數據丟失。
在討論數據類型的重要性之前,讓我們先來看看一些常見的數據類型。
常用數據類型
整數 (int)
它是最常見的數字數據類型,用於存儲不帶小數部分的數字(-707、0、707)。
浮點數(浮點數)
它也是一種數字數據類型,用於存儲可能具有小數部分的數字,如貨幣值(707.07、0.7、707.00)。
請注意,數字通常用作包括 int 和 float 類型的數據類型。
字符(字符)
它用於存儲單個字母、數字、標點符號、符號或空格。
字符串(字符串或文本)
它是一個字符序列,也是存儲文本最常用的數據類型。 此外,字符串還可以包含數字和符號,但是,它始終被視為文本。
電話號碼通常存儲為字符串 (+1-999-666-3333),但也可以存儲為整數 (9996663333)。
布爾值(布爾值)
它表示值 true 和 false。 使用布爾數據類型時,記住有時布爾值也表示為 0(表示假)和 1(表示真)是有幫助的。
枚舉類型(enum)
它包含一小組預定義的唯一值(也稱為元素或枚舉器),可以比較這些值並分配給枚舉數據類型的變量。
枚舉類型的值可以是基於文本的或數字的。 實際上,布爾數據類型是值 true 和 false 的預定義枚舉。
例如,如果 Rock 和 jazz 是枚舉數,則可以為枚舉類型變量 Genre 分配兩個值中的任何一個,但不能同時分配這兩個值。
假設您被要求在音樂應用程序上填寫您的偏好,並被要求通過下拉菜單選擇兩種流派中的一種,則變量流派將存儲搖滾或爵士樂。
使用枚舉類型,可以將值存儲和檢索為數字索引(0、1、2)或字符串。
大批
也稱為列表,數組是一種數據類型,它以特定順序存儲許多元素,通常都是相同的類型。
由於數組存儲多個元素或值,因此數組存儲的數據結構稱為數組數據結構。
可以使用整數索引 (0, 1, 2,…) 檢索數組的每個元素,數組中元素的總數表示數組的長度。
例如,數組變量流派可以存儲一個或多個元素搖滾、爵士和布魯斯。 三個值的索引分別為 0(搖滾)、1(爵士)和 2(布魯斯),數組的長度為 3(因為它包含三個元素)。
繼續音樂應用程序的示例,如果要求您選擇三種類型中的一種或多種,並且您碰巧喜歡這三種類型(為此歡呼),變量流派將存儲所有三種元素(搖滾、爵士、藍調) .
日期
無需解釋; 通常以 YYYY-MM-DD 格式(ISO 8601 語法)存儲日期。
時間
以 hh:mm:ss 格式存儲時間。 除了一天中的時間,它還可以用於存儲經過的時間或兩個事件之間的時間間隔,可能超過 24 小時。 例如,事件發生後經過的時間可能超過 72 小時 (72:00:59)。
約會時間
以 YYYY-MM-DD hh:mm:ss 格式存儲包含日期和時間的值。
時間戳
通常以 Unix 時間表示,時間戳表示自 1970 年 1 月 1 日午夜 (00:00:00 UTC) 以來經過的秒數。
計算機系統通常使用它以不受時區影響的格式記錄事件的精確日期和時間,精確到秒數。 因此,與日期時間不同,無論您的地理位置如何,時間戳都保持不變。
如果你仔細想想,我們每個人都有一個時間戳——在這裡輸入你的出生日期和時間來查看你自己的。

示例和回顧
不同的編程語言為各種目的提供各種其他數據類型,但是,您需要知道成為數據主導的最常用數據類型已被涵蓋。
考慮數據類型的一個好方法是遇到任何表格或調查。
查看標準註冊表單,您應該記住每個字段都接受特定數據類型的值。
文本字段將輸入存儲為字符串,而數字字段通常接受整數。
姓名和電子郵件地址始終是字符串類型,而數字可以存儲為數字類型或字符串,因為字符串是一組包含數字的字符。
在單個選項或多個選項字段中,必須從預定義的選項中進行選擇,數據類型枚舉類型和數組開始發揮作用。

在上面的 Facebook 註冊表單中,生日字段有 3 個子字段,每個子字段都是枚舉類型,要求您分別為日、月和年選擇一個選項。
同樣,Gender 字段希望您從兩個預定義選項中進行選擇或添加一個自定義選項,其輸入存儲為字符串。
像密碼這樣的字符串總是經過散列或加密(或至少應該是)。
現在讓我們看看數據類型的重要性。
數據類型的重要性
您可能想知道,當您主要關心如何利用客戶數據時,了解所有這些數據類型為何如此重要。 只有一個主要原因——收集乾淨和一致的數據。
您對數據類型的了解將在您的數據收集工作的兩個階段中派上用場,如下所述。
儀器儀表
從主要數據源跟踪行為數據並將數據同步到內部或外部存儲系統的過程稱為檢測。
檢測過程的第一步是創建數據跟踪計劃。 本指南涵蓋了您需要了解的有關跟踪計劃的所有信息。
在決定要跟踪哪些事件以及要收集哪些屬性(事件和實體屬性)時,在跟踪計劃中指定每個屬性的數據類型會使檢測過程更加高效,並且幾乎沒有出錯的餘地。
這對於負責實施的工程師特別有用。 通過確保使用正確的數據類型發送每個屬性,可以避免數據不一致。
調查
作為以數據為主導的專業人士,您很可能會通過整個客戶旅程(從入職到流失)的調查從客戶那裡收集數據。
您在調查中提出的問題可以是開放式的(文本或數字),也可以帶有預定義的選項,例如下拉列表(枚舉)、複選框(數組)、單選按鈕(布爾值),甚至是滑塊(取決於) .
要存儲來自調查的數據(在數據庫或第三方系統中),您需要指定屬性名稱(industry_name、job_role、cancellation_reason、is_satisfied 等)及其數據類型(字符串、數字、布爾值等)。 ) 用於調查中的每個字段。 屬性名稱存儲輸入的值,數據類型驗證該值是否符合預期。
這樣做會導致數據保持一致,並更容易分析和激活數據。 請記住,開放式問題會使分析更加困難,因為除非您通過解析每個響應並提取與規則匹配的文本來轉換數據,否則您無法彙總響應。
使用預定義的選項,分析很簡單,即使您在稍後階段更改選項也不受影響(請參閱枚舉和數組數據類型)。
將數據類型付諸實踐
數據類型知識的應用不限於數據收集或檢測; 既然您了解了各種數據類型,其他活動,如數據管理、數據集成和內部應用程序開發(使用無代碼或低代碼工具)也應該變得容易得多。
了解如何通過構建現代數據堆棧以促進增長並使用數據來提高保留率,從而進一步利用數據。 或者,在 Amplitude 中查看您的數據類型。
