Apa Itu Tipe Data dan Mengapa Penting?
Diterbitkan: 2022-03-03Tipe data adalah atribut yang terkait dengan sepotong data yang memberi tahu sistem komputer bagaimana menafsirkan nilainya. Memahami tipe data memastikan bahwa data dikumpulkan dalam format yang disukai dan nilai setiap properti seperti yang diharapkan.
Harap diingat bahwa tipe data tidak sama dengan dua tipe data yang bersama-sama disebut sebagai data pelanggan—data entitas dan data peristiwa.
Pemahaman yang baik tentang tipe data diperlukan untuk mendefinisikan properti peristiwa dan properti entitas dengan benar. Rencana pelacakan yang terdefinisi dengan baik harus berisi tipe data dari setiap properti untuk memastikan keakuratan data dan mencegah kehilangan data.
Sebelum beralih ke pentingnya tipe data, mari kita lihat beberapa tipe data umum.
Tipe data umum
Bilangan bulat (int)
Ini adalah tipe data numerik yang paling umum digunakan untuk menyimpan angka tanpa komponen pecahan (-707, 0, 707).
Titik Apung (float)
Ini juga merupakan tipe data numerik yang digunakan untuk menyimpan angka yang mungkin memiliki komponen pecahan seperti nilai moneter (707.07, 0.7, 707.00).
Harap dicatat bahwa angka sering digunakan sebagai tipe data yang mencakup tipe int dan float.
Karakter (char)
Digunakan untuk menyimpan satu huruf, angka, tanda baca, simbol, atau spasi kosong.
String (str atau teks)
Ini adalah urutan karakter dan tipe data yang paling umum digunakan untuk menyimpan teks. Selain itu, string juga dapat menyertakan angka dan simbol, namun selalu diperlakukan sebagai teks.
Nomor telepon biasanya disimpan sebagai string (+1-999-666-3333) tetapi juga dapat disimpan sebagai bilangan bulat (9996663333).
Boolean (bool)
Ini mewakili nilai benar dan salah. Saat bekerja dengan tipe data boolean, perlu diingat bahwa terkadang nilai boolean juga direpresentasikan sebagai 0 (untuk salah) dan 1 (untuk benar).
Jenis enumerasi (enum)
Ini berisi satu set kecil nilai unik yang telah ditentukan sebelumnya (juga dikenal sebagai elemen atau enumerator) yang dapat dibandingkan dan ditetapkan ke variabel tipe data enumerated.
Nilai dari tipe enumerasi dapat berbasis teks atau numerik. Faktanya, tipe data boolean adalah enumerasi yang telah ditentukan sebelumnya dari nilai benar dan salah.
Misalnya, jika rock dan jazz adalah enumerator, sebuah enumerated type variable genre dapat diberikan salah satu dari dua nilai tersebut, tetapi tidak keduanya.
Dengan asumsi bahwa Anda diminta untuk mengisi preferensi Anda pada aplikasi musik dan diminta untuk memilih salah satu dari dua genre melalui menu tarik-turun, genre variabel akan menyimpan rock atau jazz.
Dengan tipe enumerasi, nilai dapat disimpan dan diambil sebagai indeks numerik (0, 1, 2) atau string.
Himpunan
Juga dikenal sebagai daftar, array adalah tipe data yang menyimpan sejumlah elemen dalam urutan tertentu, biasanya semua dari tipe yang sama.
Karena array menyimpan banyak elemen atau nilai, struktur data yang disimpan oleh array disebut sebagai struktur data array.
Setiap elemen array dapat diambil menggunakan indeks integer (0, 1, 2,…), dan jumlah total elemen dalam array mewakili panjang array.
Misalnya, genre variabel array dapat menyimpan satu atau lebih elemen rock, jazz, dan blues. Indeks dari tiga nilai adalah 0 (rock), 1 (jazz), dan 2 (blues), dan panjang array adalah 3 (karena mengandung tiga elemen).
Melanjutkan contoh aplikasi musik, jika Anda diminta untuk memilih satu atau lebih dari tiga genre dan kebetulan Anda menyukai ketiganya (sorak untuk itu), genre variabel akan menyimpan ketiga elemen (rock, jazz, blues) .
Tanggal
Tidak perlu penjelasan; biasanya menyimpan tanggal dalam format YYYY-MM-DD (sintaks ISO 8601).
Waktu
Menyimpan waktu dalam format jj:mm:dd. Selain waktu dalam sehari, juga dapat digunakan untuk menyimpan waktu yang telah berlalu atau interval waktu antara dua peristiwa yang bisa lebih dari 24 jam. Misalnya, waktu yang berlalu sejak suatu peristiwa terjadi bisa lebih dari 72 jam (72:00:59).
Tanggal Waktu
Menyimpan nilai yang berisi tanggal dan waktu secara bersamaan dalam format YYYY-MM-DD jj:mm:dd.
stempel waktu
Biasanya diwakili dalam waktu Unix, stempel waktu mewakili jumlah detik yang telah berlalu sejak tengah malam (00:00:00 UTC), 1 Januari 1970.
Ini biasanya digunakan oleh sistem komputer untuk mencatat tanggal dan waktu yang tepat dari suatu peristiwa, hingga jumlah detik, dalam format yang tidak terpengaruh oleh zona waktu. Oleh karena itu tidak seperti datetime, stempel waktu tetap sama terlepas dari lokasi geografis Anda.
Jika Anda memikirkannya, masing-masing dari kami membawa stempel waktu—masukkan tanggal dan waktu lahir Anda di sini untuk melihat tanggal dan waktu Anda sendiri.
Contoh dan rekap
Bahasa pemrograman yang berbeda menawarkan berbagai tipe data lain untuk berbagai tujuan, namun tipe data yang paling umum digunakan yang perlu Anda ketahui untuk menjadi data-led telah dibahas.

Cara yang baik untuk memikirkan tipe data adalah ketika Anda menemukan formulir atau survei apa pun.
Melihat formulir pendaftaran standar, Anda harus ingat bahwa setiap bidang menerima nilai dari tipe data tertentu.
Bidang teks menyimpan input sebagai string sementara bidang angka biasanya menerima bilangan bulat.
Nama dan alamat email selalu berupa string, sedangkan angka dapat disimpan sebagai tipe numerik atau string karena string adalah kumpulan karakter termasuk digit.
Dalam opsi tunggal atau beberapa bidang opsi, di mana seseorang harus memilih dari opsi yang telah ditentukan, tipe data tipe enumerated dan array ikut bermain.

Dalam formulir pendaftaran Facebook di atas, bidang Ulang Tahun memiliki 3 sub-bidang, masing-masing jenis enumerasi meminta Anda untuk memilih satu opsi untuk hari, bulan, dan tahun masing-masing.
Demikian pula, bidang Gender ingin Anda memilih dari dua pilihan yang telah ditentukan sebelumnya atau menambahkan yang khusus, yang inputnya disimpan sebagai string.
String seperti kata sandi selalu di-hash atau dienkripsi (atau setidaknya harus).
Sekarang mari kita lihat pentingnya tipe data.
Pentingnya tipe data
Anda mungkin bertanya-tanya mengapa penting untuk mengetahui tentang semua tipe data ini ketika Anda terutama berfokus pada pemahaman bagaimana memanfaatkan data pelanggan. Hanya ada satu alasan utama—untuk mengumpulkan data yang bersih dan konsisten.
Pengetahuan Anda tentang tipe data akan berguna dalam dua tahap upaya pengumpulan data Anda seperti yang dijelaskan di bawah ini.
Peralatan
Proses pelacakan data perilaku dari sumber data primer dan sinkronisasi data ke sistem penyimpanan internal atau eksternal dikenal sebagai instrumentasi.
Langkah pertama dalam proses instrumentasi adalah membuat rencana pelacakan data. Semua yang perlu Anda ketahui tentang rencana pelacakan tercakup dalam panduan ini.
Saat memutuskan peristiwa mana yang akan dilacak dan properti apa yang akan dikumpulkan (baik properti peristiwa dan entitas), menentukan tipe data setiap properti dalam rencana pelacakan membuat proses instrumentasi jauh lebih efisien dan menyisakan sedikit ruang untuk kesalahan.
Ini sangat membantu bagi para insinyur yang ditugaskan untuk mengimplementasikannya. Dengan memastikan bahwa setiap properti dikirim dengan tipe data yang benar, inkonsistensi data dapat dihindari.
Survei
Sebagai profesional yang dipimpin oleh data, kemungkinan besar Anda akan mengumpulkan data dari pelanggan Anda melalui survei sepanjang perjalanan pelanggan—dari orientasi hingga churn.
Pertanyaan yang Anda ajukan dalam survei dapat berupa pertanyaan terbuka (teks atau angka) atau datang dengan pilihan yang telah ditentukan sebelumnya seperti daftar drop-down (enum), kotak centang (array), tombol radio (boolean), atau bahkan penggeser (tergantung) .
Untuk menyimpan data dari survei (dalam database atau sistem pihak ketiga), Anda perlu menentukan nama properti (nama_industri, peran_pekerjaan, alasan_pembatalan, is_satisfied, dll.) dan tipe datanya (string, angka, boolean, dll. ) untuk setiap bidang dalam survei Anda. Nama properti menyimpan nilai yang dimasukkan dan tipe data memvalidasi bahwa nilainya seperti yang diharapkan.
Melakukannya menghasilkan data yang konsisten dan memudahkan untuk menganalisis dan mengaktifkan data. Sebaiknya diingat bahwa pertanyaan terbuka membuat analisis lebih sulit karena Anda tidak dapat menggabungkan respons kecuali Anda mengubah data dengan menguraikan setiap respons dan mengekstrak teks yang cocok dengan aturan.
Dengan pilihan yang telah ditentukan sebelumnya, analisis mudah dilakukan dan tidak terpengaruh bahkan jika Anda mengubah pilihan di tahap selanjutnya (lihat tipe data enum dan array).
Menerapkan tipe data ke dalam praktik
Penerapan pengetahuan Anda tentang tipe data tidak terbatas pada pengumpulan atau instrumentasi data; aktivitas lain seperti manajemen data, integrasi data, dan pengembangan aplikasi internal (menggunakan alat tanpa kode atau kode rendah) juga akan menjadi jauh lebih mudah sekarang setelah Anda memahami berbagai tipe data.
Pelajari bagaimana Anda dapat melangkah lebih jauh dengan data dengan membangun tumpukan data modern untuk pertumbuhan dan menggunakan data untuk mendorong retensi. Atau, lihat tipe data Anda di Amplitude .
