데이터 유형이란 무엇이며 왜 중요한가요?
게시 됨: 2022-03-03데이터 유형은 컴퓨터 시스템에 값을 해석하는 방법을 알려주는 데이터 조각과 관련된 속성입니다. 데이터 유형을 이해하면 데이터가 기본 형식으로 수집되고 각 속성의 값이 예상대로 유지됩니다.
데이터 유형을 고객 데이터라고 하는 두 가지 유형의 데이터(엔티티 데이터 및 이벤트 데이터)와 혼동해서는 안 됩니다.
이벤트 속성과 엔터티 속성을 적절하게 정의하려면 데이터 유형에 대한 올바른 이해가 필요합니다. 잘 정의된 추적 계획에는 데이터 정확성을 보장하고 데이터 손실을 방지하기 위해 모든 속성의 데이터 유형이 포함되어야 합니다.
데이터 유형의 중요성에 대해 알아보기 전에 몇 가지 일반적인 데이터 유형을 살펴보겠습니다.
공통 데이터 유형
정수(int)
소수 구성 요소(-707, 0, 707) 없이 숫자를 저장하는 데 사용되는 가장 일반적인 숫자 데이터 유형입니다.
부동 소수점(부동 소수점)
또한 화폐 값(707.07, 0.7, 707.00)과 같은 소수 구성 요소를 가질 수 있는 숫자를 저장하는 데 사용되는 숫자 데이터 유형입니다.
숫자는 종종 int 및 float 유형을 모두 포함하는 데이터 유형으로 사용됩니다.
문자(char)
단일 문자, 숫자, 구두점, 기호 또는 공백을 저장하는 데 사용됩니다.
문자열(문자열 또는 텍스트)
일련의 문자이며 텍스트를 저장하는 데 가장 일반적으로 사용되는 데이터 유형입니다. 또한 문자열에는 숫자와 기호도 포함될 수 있지만 항상 텍스트로 처리됩니다.
전화번호는 일반적으로 문자열(+1-999-666-3333)로 저장되지만 정수(9996663333)로 저장할 수도 있습니다.
부울(부울)
true 및 false 값을 나타냅니다. 부울 데이터 유형으로 작업할 때 부울 값이 0(거짓의 경우) 및 1(참의 경우)로 표시되기도 한다는 점을 염두에 두는 것이 좋습니다.
열거형(enum)
여기에는 비교 및 열거 데이터 유형의 변수에 할당할 수 있는 미리 정의된 고유 값(요소 또는 열거자라고도 함)의 작은 집합이 포함됩니다.
열거 유형의 값은 텍스트 기반 또는 숫자일 수 있습니다. 사실, 부울 데이터 유형은 true 및 false 값의 미리 정의된 열거형입니다.
예를 들어, 록과 재즈가 열거자인 경우 열거 유형 변수 장르는 두 값 중 하나를 할당할 수 있지만 둘 다 할당할 수는 없습니다.
음악 앱에서 기본 설정을 입력하라는 요청을 받고 드롭다운 메뉴를 통해 두 장르 중 하나를 선택하라는 요청을 받았다고 가정하면 변수 장르는 록 또는 재즈를 저장합니다.
열거형을 사용하면 값을 숫자 인덱스(0, 1, 2) 또는 문자열로 저장하고 검색할 수 있습니다.
정렬
목록이라고도 하는 배열은 여러 요소를 특정 순서로 저장하는 데이터 유형이며 일반적으로 모두 동일한 유형입니다.
배열은 여러 요소 또는 값을 저장하므로 배열에 저장된 데이터의 구조를 배열 데이터 구조라고 합니다.
배열의 각 요소는 정수 인덱스(0, 1, 2,…)를 사용하여 검색할 수 있으며 배열의 총 요소 수는 배열의 길이를 나타냅니다.
예를 들어, 배열 변수 장르는 록, 재즈 및 블루스 요소 중 하나 이상을 저장할 수 있습니다. 세 값의 인덱스는 0(록), 1(재즈), 2(블루스)이고 배열의 길이는 3(세 개의 요소를 포함하므로)입니다.
계속해서 음악 앱의 예에서 세 가지 장르 중 하나 이상을 선택하라는 메시지가 표시되고 세 가지 장르 모두가 마음에 든다면(건배), 변수 장르는 세 가지 요소(록, 재즈, 블루스)를 모두 저장합니다. .
날짜
설명이 필요 없습니다. 일반적으로 날짜를 YYYY-MM-DD 형식(ISO 8601 구문)으로 저장합니다.
시간
hh:mm:ss 형식으로 시간을 저장합니다. 하루 중 시간 외에도 경과된 시간 또는 24시간 이상이 될 수 있는 두 이벤트 사이의 시간 간격을 저장하는 데 사용할 수도 있습니다. 예를 들어, 이벤트가 발생한 이후 경과된 시간은 72시간 이상(72:00:59)이 될 수 있습니다.
날짜 시간
날짜와 시간을 모두 포함하는 값을 YYYY-MM-DD hh:mm:ss 형식으로 함께 저장합니다.
타임스탬프
일반적으로 Unix 시간으로 표시되는 타임스탬프는 1970년 1월 1일 자정(00:00:00 UTC) 이후 경과된 시간(초)을 나타냅니다.
일반적으로 컴퓨터 시스템에서 시간대의 영향을 받지 않는 형식으로 이벤트의 정확한 날짜와 시간을 초 단위로 기록하는 데 사용됩니다. 따라서 날짜/시간과 달리 타임스탬프는 지리적 위치에 관계없이 동일하게 유지됩니다.
생각해 보면 우리 각자는 타임스탬프를 가지고 있습니다. 여기에 자신의 생년월일과 시간을 입력하면 자신의 타임스탬프를 볼 수 있습니다.

예 및 요약
다양한 프로그래밍 언어는 다양한 목적을 위해 다양한 다른 데이터 유형을 제공하지만 데이터 주도형이 되기 위해 알아야 할 가장 일반적으로 사용되는 데이터 유형을 다뤘습니다.
데이터 유형에 대해 생각하는 좋은 방법은 양식이나 설문조사를 접했을 때입니다.
표준 등록 양식을 보면 각 필드가 특정 데이터 유형의 값을 허용한다는 점을 염두에 두어야 합니다.
텍스트 필드는 입력을 문자열로 저장하지만 숫자 필드는 일반적으로 정수를 허용합니다.
이름과 이메일 주소는 항상 문자열 유형이지만, 문자열은 숫자를 포함하는 문자 집합이므로 숫자는 숫자 유형 또는 문자열로 저장할 수 있습니다.
미리 정의된 옵션 중에서 선택해야 하는 단일 옵션 또는 다중 옵션 필드에서는 데이터 유형 열거 유형 및 배열이 작동합니다.

위의 Facebook 가입 양식에서 생일 필드에는 3개의 하위 필드가 있으며, 각 열거 유형은 일, 월 및 연도에 대해 각각 하나의 옵션을 선택하도록 요청합니다.
마찬가지로 성별 필드는 두 개의 미리 정의된 선택 항목 중에서 선택하거나 입력이 문자열로 저장되는 사용자 지정 항목을 추가하기를 원합니다.
암호와 같은 문자열은 항상 해시되거나 암호화됩니다(또는 최소한 그래야 합니다).
이제 데이터 유형의 중요성을 살펴보겠습니다.
데이터 유형의 중요성
고객 데이터를 활용하는 방법을 이해하는 데 주로 관심이 있을 때 이러한 모든 데이터 유형에 대해 아는 것이 왜 중요한지 의아해할 수 있습니다. 깨끗하고 일관된 데이터를 수집하는 주된 이유는 단 하나입니다.
데이터 유형에 대한 지식은 아래에 설명된 대로 데이터 수집 노력의 두 단계에서 유용할 것입니다.
수단
기본 데이터 소스의 행동 데이터를 추적하고 데이터를 내부 또는 외부 스토리지 시스템과 동기화하는 프로세스를 계측이라고 합니다.
계측 프로세스의 첫 번째 단계는 데이터 추적 계획을 만드는 것입니다. 추적 계획에 대해 알아야 할 모든 것이 이 가이드에서 다룹니다.
추적할 이벤트와 수집할 속성(이벤트 및 엔터티 속성 모두)을 결정할 때 추적 계획에서 각 속성의 데이터 유형을 지정하면 계측 프로세스가 훨씬 더 효율적이고 오류가 발생할 여지가 거의 없습니다.
이는 구현을 담당하는 엔지니어에게 특히 유용합니다. 각 속성이 올바른 데이터 유형으로 전송되었는지 확인하여 데이터 불일치를 방지할 수 있습니다.
설문조사
데이터 주도형 전문가는 온보딩에서 이탈에 이르기까지 고객 여정 전반에 걸쳐 설문조사를 통해 고객으로부터 데이터를 수집할 가능성이 높습니다.
설문조사에서 묻는 질문은 개방형(텍스트 또는 숫자)이거나 드롭다운 목록(열거형), 확인란(배열), 라디오 버튼(부울) 또는 슬라이더(종속)와 같은 미리 정의된 선택 항목과 함께 제공될 수 있습니다. .
설문조사의 데이터를 데이터베이스 또는 타사 시스템에 저장하려면 속성 이름(industry_name, job_role, cancel_reason, is_satisfied 등)과 해당 데이터 유형(문자열, 숫자, 부울 등)을 지정해야 합니다. ) 설문조사의 모든 필드에 대해 속성 이름은 입력된 값을 저장하고 데이터 유형은 값이 예상대로인지 확인합니다.
이렇게 하면 데이터가 일관되고 데이터를 더 쉽게 분석하고 활성화할 수 있습니다. 개방형 질문은 각 응답을 구문 분석하고 규칙과 일치하는 텍스트를 추출하여 데이터를 변환하지 않는 한 응답을 집계할 수 없으므로 분석이 더 어려워진다는 점을 염두에 두는 것이 좋습니다.
미리 정의된 선택 항목을 사용하면 분석이 간단하며 나중에 선택 항목을 변경하더라도 영향을 받지 않습니다(열거형 및 배열 데이터 유형 참조).
데이터 유형 실행
데이터 유형에 대한 지식의 적용은 데이터 수집 또는 계측에 국한되지 않습니다. 데이터 관리, 데이터 통합, 내부 애플리케이션 개발(노코드 또는 로우코드 도구 사용)과 같은 다른 활동도 다양한 데이터 유형을 이해하게 되었기 때문에 훨씬 더 쉬워질 것입니다.
성장을 위한 최신 데이터 스택을 구축하고 데이터를 사용하여 보존을 유도하여 데이터를 더 발전시킬 수 있는 방법을 알아보십시오. 또는 Amplitude 에서 데이터 유형을 확인하십시오 .
