ประเภทข้อมูลคืออะไรและเหตุใดจึงสำคัญ
เผยแพร่แล้ว: 2022-03-03ชนิดข้อมูลเป็นคุณลักษณะที่เกี่ยวข้องกับข้อมูลที่บอกระบบคอมพิวเตอร์ถึงวิธีตีความค่าของมัน การทำความเข้าใจประเภทข้อมูลช่วยให้มั่นใจได้ว่าข้อมูลจะถูกเก็บรวบรวมในรูปแบบที่ต้องการและมูลค่าของแต่ละพร็อพเพอร์ตี้เป็นไปตามที่คาดไว้
โปรดทราบว่าอย่าสับสนระหว่างประเภทข้อมูลกับข้อมูลสองประเภทที่เรียกว่าข้อมูลลูกค้า ซึ่งก็คือข้อมูลเอนทิตีและข้อมูลเหตุการณ์
จำเป็นต้องมีความเข้าใจที่ดีเกี่ยวกับชนิดข้อมูลเพื่อกำหนดคุณสมบัติของเหตุการณ์และคุณสมบัติของเอนทิตีอย่างเหมาะสม แผนการติดตามที่กำหนดไว้อย่างดีต้องมีประเภทข้อมูลของทุกสถานที่เพื่อให้แน่ใจว่าข้อมูลมีความถูกต้องและป้องกันการสูญหายของข้อมูล
ก่อนที่จะพูดถึงความสำคัญของประเภทข้อมูล มาดูประเภทข้อมูลทั่วไปกันบ้าง
ประเภทข้อมูลทั่วไป
จำนวนเต็ม (int)
เป็นประเภทข้อมูลตัวเลขที่ใช้กันทั่วไปในการจัดเก็บตัวเลขโดยไม่มีส่วนประกอบที่เป็นเศษส่วน (-707, 0, 707)
จุดลอยตัว (ลอย)
นอกจากนี้ยังเป็นประเภทข้อมูลตัวเลขที่ใช้เก็บตัวเลขที่อาจมีส่วนประกอบที่เป็นเศษส่วน เช่น ค่าเงิน (707.07, 0.7, 707.00)
โปรดทราบว่าตัวเลขมักใช้เป็นประเภทข้อมูลที่มีทั้งประเภท int และ float
ตัวละคร (อักขระ)
ใช้สำหรับเก็บตัวอักษร ตัวเลข เครื่องหมายวรรคตอน สัญลักษณ์ หรือช่องว่าง
สตริง (str หรือข้อความ)
เป็นลำดับของอักขระและชนิดข้อมูลที่ใช้บ่อยที่สุดในการจัดเก็บข้อความ นอกจากนี้ สตริงยังสามารถรวมตัวเลขและสัญลักษณ์ได้ แต่จะถือว่าเป็นข้อความเสมอ
หมายเลขโทรศัพท์มักจะจัดเก็บเป็นสตริง (+1-999-666-3333) แต่สามารถจัดเก็บเป็นจำนวนเต็มได้ (9996663333)
บูลีน (บูล)
มันแสดงถึงค่าจริงและเท็จ เมื่อทำงานกับชนิดข้อมูลบูลีน โปรดจำไว้ว่าบางครั้งค่าบูลีนยังแสดงเป็น 0 (สำหรับเท็จ) และ 1 (สำหรับจริง) ด้วย
ประเภทที่แจกแจง (enum)
ประกอบด้วยชุดค่าเฉพาะที่กำหนดไว้ล่วงหน้าขนาดเล็กจำนวนหนึ่ง (หรือเรียกอีกอย่างว่าองค์ประกอบหรือตัวแจงนับ) ที่สามารถเปรียบเทียบและกำหนดให้กับตัวแปรประเภทข้อมูลที่แจกแจงได้
ค่าของประเภทที่แจกแจงอาจเป็นแบบข้อความหรือตัวเลข อันที่จริง ชนิดข้อมูลบูลีนเป็นการแจงนับที่กำหนดไว้ล่วงหน้าของค่าจริงและเท็จ
ตัวอย่างเช่น ถ้าร็อคและแจ๊สเป็นตัวแจงนับ ประเภทตัวแปรประเภทที่แจงนับสามารถกำหนดค่าอย่างใดอย่างหนึ่งในสองค่า แต่ไม่ใช่ทั้งสองค่า
สมมติว่าคุณถูกขอให้กรอกการตั้งค่าของคุณในแอปเพลง และถูกขอให้เลือกประเภทใดประเภทหนึ่งจากสองประเภทผ่านเมนูแบบเลื่อนลง ประเภทตัวแปรจะจัดเก็บทั้งร็อคหรือแจ๊ส
ด้วยประเภทที่แจกแจง ค่าสามารถจัดเก็บและดึงออกมาเป็นดัชนีตัวเลข (0, 1, 2) หรือสตริงได้
Array
หรือที่เรียกว่ารายการ อาร์เรย์คือประเภทข้อมูลที่จัดเก็บองค์ประกอบจำนวนหนึ่งตามลำดับเฉพาะ ซึ่งโดยทั่วไปจะเป็นประเภทเดียวกันทั้งหมด
เนื่องจากอาร์เรย์เก็บองค์ประกอบหรือค่าหลายรายการ โครงสร้างของข้อมูลที่จัดเก็บโดยอาร์เรย์จึงเรียกว่าโครงสร้างข้อมูลอาร์เรย์
แต่ละองค์ประกอบของอาร์เรย์สามารถดึงข้อมูลได้โดยใช้ดัชนีจำนวนเต็ม (0, 1, 2,…) และจำนวนองค์ประกอบทั้งหมดในอาร์เรย์แสดงถึงความยาวของอาร์เรย์
ตัวอย่างเช่น ประเภทตัวแปรอาร์เรย์สามารถจัดเก็บองค์ประกอบร็อค แจ๊ส และบลูส์ได้ตั้งแต่หนึ่งรายการขึ้นไป ดัชนีของค่าทั้งสามคือ 0 (ร็อค), 1 (แจ๊ส) และ 2 (บลูส์) และความยาวของอาร์เรย์คือ 3 (เนื่องจากมีสามองค์ประกอบ)
ต่อจากตัวอย่างแอปเพลง หากคุณถูกขอให้เลือกหนึ่งหรือหลายแนวจากสามแนวและคุณชอบทั้งสามแนว (ไชโย) แนวเพลงที่แปรผันจะเก็บองค์ประกอบทั้งสามไว้ (ร็อค แจ๊ส บลูส์) .
วันที่
ไม่ต้องการคำอธิบาย โดยทั่วไปจะจัดเก็บวันที่ในรูปแบบ YYYY-MM-DD (ไวยากรณ์ ISO 8601)
เวลา
จัดเก็บเวลาในรูปแบบ hh:mm:ss นอกจากช่วงเวลาของวันแล้ว ยังสามารถใช้เพื่อจัดเก็บเวลาที่ผ่านไปหรือช่วงเวลาระหว่างสองเหตุการณ์ที่อาจมากกว่า 24 ชั่วโมง ตัวอย่างเช่น เวลาที่ผ่านไปตั้งแต่เกิดเหตุการณ์อาจมากกว่า 72 ชั่วโมงขึ้นไป (72:00:59)
วันเวลา
เก็บค่าที่มีทั้งวันที่และเวลาร่วมกันในรูปแบบ YYYY-MM-DD hh:mm:ss
การประทับเวลา
โดยปกติจะแสดงในเวลา Unix การประทับเวลาแสดงถึงจำนวนวินาทีที่ผ่านไปตั้งแต่เที่ยงคืน (00:00:00 UTC) 1 มกราคม 1970
โดยทั่วไปจะใช้โดยระบบคอมพิวเตอร์เพื่อบันทึกวันที่และเวลาที่แม่นยำของเหตุการณ์ จนถึงจำนวนวินาทีในรูปแบบที่ไม่ได้รับผลกระทบจากเขตเวลา ดังนั้นการประทับเวลาจึงไม่เหมือนกับวันที่และเวลาโดยไม่คำนึงถึงตำแหน่งทางภูมิศาสตร์ของคุณ
หากคุณลองนึกดู เราแต่ละคนมีประทับเวลา—ป้อนวันที่และเวลาที่คุณเกิดที่นี่เพื่อดูของคุณเอง
ตัวอย่างและบทสรุป
ภาษาโปรแกรมต่างๆ นำเสนอประเภทข้อมูลอื่นๆ ที่หลากหลายเพื่อวัตถุประสงค์ที่หลากหลาย อย่างไรก็ตาม ประเภทข้อมูลที่ใช้บ่อยที่สุดที่คุณจำเป็นต้องรู้เพื่อนำข้อมูลมาใช้ได้ครอบคลุม

วิธีที่ดีในการคิดเกี่ยวกับชนิดข้อมูลคือเมื่อคุณเจอแบบฟอร์มหรือแบบสำรวจใดๆ
เมื่อพิจารณาจากแบบฟอร์มการลงทะเบียนมาตรฐาน คุณควรจำไว้ว่าแต่ละฟิลด์ยอมรับค่าของประเภทข้อมูลเฉพาะ
ฟิลด์ข้อความเก็บอินพุตเป็นสตริงในขณะที่ฟิลด์ตัวเลขมักจะยอมรับจำนวนเต็ม
ชื่อและที่อยู่อีเมลเป็นสตริงประเภทเสมอ ในขณะที่ตัวเลขสามารถจัดเก็บเป็นประเภทตัวเลขหรือเป็นสตริงได้ เนื่องจากสตริงคือชุดของอักขระรวมถึงตัวเลข
ในฟิลด์ตัวเลือกเดียวหรือหลายตัวเลือก ซึ่งต้องเลือกจากตัวเลือกที่กำหนดไว้ล่วงหน้า ชนิดข้อมูลที่ระบุประเภทและอาร์เรย์จะเข้ามามีบทบาท

ในแบบฟอร์มการสมัคร Facebook ด้านบน ช่องวันเกิดมี 3 ช่องย่อย แต่ละประเภทระบุให้คุณเลือกหนึ่งตัวเลือกสำหรับวัน เดือน และปีตามลำดับ
ในทำนองเดียวกัน ฟิลด์เพศต้องการให้คุณเลือกจากสองตัวเลือกที่กำหนดไว้ล่วงหน้าหรือเพิ่มตัวเลือกแบบกำหนดเอง ซึ่งข้อมูลเข้าจะถูกเก็บไว้เป็นสตริง
สตริงเช่นรหัสผ่านจะถูกแฮชหรือเข้ารหัสเสมอ (หรืออย่างน้อยก็ควรเป็น)
ทีนี้มาดูความสำคัญของประเภทข้อมูลกัน
ความสำคัญของประเภทข้อมูล
คุณอาจสงสัยว่าเหตุใดการรู้เกี่ยวกับประเภทข้อมูลทั้งหมดเหล่านี้จึงสำคัญ ในเมื่อคุณกังวลกับการทำความเข้าใจวิธีใช้ประโยชน์จากข้อมูลลูกค้าเป็นหลัก มีเหตุผลหลักเพียงข้อเดียว—เพื่อรวบรวมข้อมูลที่ชัดเจนและสม่ำเสมอ
ความรู้เกี่ยวกับประเภทข้อมูลของคุณจะมีประโยชน์ในสองขั้นตอนของความพยายามในการรวบรวมข้อมูลของคุณดังที่อธิบายไว้ด้านล่าง
เครื่องมือวัด
กระบวนการติดตามข้อมูลพฤติกรรมจากแหล่งข้อมูลหลักและการซิงค์ข้อมูลกับระบบจัดเก็บข้อมูลภายในหรือภายนอกเรียกว่าเครื่องมือวัด
ขั้นตอนแรกในกระบวนการวัดผลคือการสร้างแผนการติดตามข้อมูล ทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับแผนการติดตามจะครอบคลุมอยู่ในคู่มือนี้
เมื่อตัดสินใจว่าจะติดตามเหตุการณ์ใดและคุณสมบัติใดที่จะรวบรวม (ทั้งคุณสมบัติของเหตุการณ์และเอนทิตี) การระบุชนิดข้อมูลของแต่ละคุณสมบัติในแผนการติดตามจะทำให้กระบวนการเครื่องมือวัดมีประสิทธิภาพมากขึ้น และทำให้มีข้อผิดพลาดเพียงเล็กน้อย
สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับวิศวกรที่ได้รับมอบหมายให้ดำเนินการใช้งาน โดยตรวจสอบให้แน่ใจว่าแต่ละคุณสมบัติถูกส่งด้วยชนิดข้อมูลที่ถูกต้อง ข้อมูลจะไม่สอดคล้องกันสามารถหลีกเลี่ยงได้
แบบสำรวจ
ในฐานะมืออาชีพด้านข้อมูล มีแนวโน้มว่าคุณจะรวบรวมข้อมูลจากลูกค้าของคุณผ่านแบบสำรวจตลอดเส้นทางของลูกค้า ตั้งแต่การเริ่มต้นใช้งานจนถึงการยกเลิก
คำถามที่คุณถามในแบบสำรวจอาจเป็นคำถามปลายเปิด (ข้อความหรือตัวเลข) หรือมาพร้อมกับตัวเลือกที่กำหนดไว้ล่วงหน้า เช่น รายการดรอปดาวน์ (enum) ช่องกาเครื่องหมาย (อาร์เรย์) ปุ่มตัวเลือก (บูลีน) หรือแม้แต่ตัวเลื่อน (ขึ้นอยู่กับ) .
ในการจัดเก็บข้อมูลจากแบบสำรวจ (ในฐานข้อมูลหรือระบบของบุคคลที่สาม) คุณต้องระบุชื่อคุณสมบัติ (industry_name, job_role, cancel_reason, is_satisfied ฯลฯ) และประเภทข้อมูล (สตริง ตัวเลข บูลีน ฯลฯ) ) สำหรับทุกฟิลด์ในแบบสำรวจของคุณ ชื่อคุณสมบัติเก็บค่าที่ป้อน และชนิดข้อมูลจะตรวจสอบว่าค่าเป็นไปตามที่คาดไว้
การทำเช่นนี้ส่งผลให้ข้อมูลมีความสอดคล้องกันและทำให้วิเคราะห์และเปิดใช้งานข้อมูลได้ง่ายขึ้น โปรดจำไว้ว่าคำถามปลายเปิดมีไว้เพื่อการวิเคราะห์ที่เข้มงวดขึ้น เนื่องจากคุณไม่สามารถรวมคำตอบได้เว้นแต่คุณจะแปลงข้อมูลโดยแยกวิเคราะห์คำตอบแต่ละรายการและแยกข้อความที่ตรงกับกฎ
ด้วยตัวเลือกที่กำหนดไว้ล่วงหน้า การวิเคราะห์จะตรงไปตรงมาและไม่ได้รับผลกระทบแม้ว่าคุณจะเปลี่ยนตัวเลือกในภายหลัง (ดูที่ประเภทข้อมูล enum และอาร์เรย์)
นำประเภทข้อมูลไปปฏิบัติ
การประยุกต์ใช้ความรู้ของคุณเกี่ยวกับประเภทข้อมูลไม่จำกัดเพียงการเก็บรวบรวมข้อมูลหรือเครื่องมือวัด กิจกรรมอื่นๆ เช่น การจัดการข้อมูล การรวมข้อมูล และการพัฒนาแอปพลิเคชันภายใน (โดยใช้เครื่องมือที่ไม่ต้องใช้โค้ดหรือเครื่องมือแบบ low-code) จะง่ายขึ้นมากเมื่อคุณเข้าใจประเภทข้อมูลต่างๆ
เรียนรู้ว่าคุณจะใช้งานข้อมูลต่อไปได้อย่างไรโดยการสร้างกองข้อมูลที่ทันสมัยสำหรับการเติบโตและการใช้ข้อมูลเพื่อขับเคลื่อนการเก็บข้อมูล หรือ ดูประเภทข้อมูลของคุณใน Amplitude
