ประเภทข้อมูลคืออะไรและเหตุใดจึงสำคัญ

เผยแพร่แล้ว: 2022-03-03

ชนิดข้อมูลเป็นคุณลักษณะที่เกี่ยวข้องกับข้อมูลที่บอกระบบคอมพิวเตอร์ถึงวิธีตีความค่าของมัน การทำความเข้าใจประเภทข้อมูลช่วยให้มั่นใจได้ว่าข้อมูลจะถูกเก็บรวบรวมในรูปแบบที่ต้องการและมูลค่าของแต่ละพร็อพเพอร์ตี้เป็นไปตามที่คาดไว้

โปรดทราบว่าอย่าสับสนระหว่างประเภทข้อมูลกับข้อมูลสองประเภทที่เรียกว่าข้อมูลลูกค้า ซึ่งก็คือข้อมูลเอนทิตีและข้อมูลเหตุการณ์

จำเป็นต้องมีความเข้าใจที่ดีเกี่ยวกับชนิดข้อมูลเพื่อกำหนดคุณสมบัติของเหตุการณ์และคุณสมบัติของเอนทิตีอย่างเหมาะสม แผนการติดตามที่กำหนดไว้อย่างดีต้องมีประเภทข้อมูลของทุกสถานที่เพื่อให้แน่ใจว่าข้อมูลมีความถูกต้องและป้องกันการสูญหายของข้อมูล

ก่อนที่จะพูดถึงความสำคัญของประเภทข้อมูล มาดูประเภทข้อมูลทั่วไปกันบ้าง

ประเภทข้อมูลทั่วไป

จำนวนเต็ม (int)

เป็นประเภทข้อมูลตัวเลขที่ใช้กันทั่วไปในการจัดเก็บตัวเลขโดยไม่มีส่วนประกอบที่เป็นเศษส่วน (-707, 0, 707)

จุดลอยตัว (ลอย)

นอกจากนี้ยังเป็นประเภทข้อมูลตัวเลขที่ใช้เก็บตัวเลขที่อาจมีส่วนประกอบที่เป็นเศษส่วน เช่น ค่าเงิน (707.07, 0.7, 707.00)

โปรดทราบว่าตัวเลขมักใช้เป็นประเภทข้อมูลที่มีทั้งประเภท int และ float

ตัวละคร (อักขระ)

ใช้สำหรับเก็บตัวอักษร ตัวเลข เครื่องหมายวรรคตอน สัญลักษณ์ หรือช่องว่าง

สตริง (str หรือข้อความ)

เป็นลำดับของอักขระและชนิดข้อมูลที่ใช้บ่อยที่สุดในการจัดเก็บข้อความ นอกจากนี้ สตริงยังสามารถรวมตัวเลขและสัญลักษณ์ได้ แต่จะถือว่าเป็นข้อความเสมอ

หมายเลขโทรศัพท์มักจะจัดเก็บเป็นสตริง (+1-999-666-3333) แต่สามารถจัดเก็บเป็นจำนวนเต็มได้ (9996663333)

บูลีน (บูล)

มันแสดงถึงค่าจริงและเท็จ เมื่อทำงานกับชนิดข้อมูลบูลีน โปรดจำไว้ว่าบางครั้งค่าบูลีนยังแสดงเป็น 0 (สำหรับเท็จ) และ 1 (สำหรับจริง) ด้วย

ประเภทที่แจกแจง (enum)

ประกอบด้วยชุดค่าเฉพาะที่กำหนดไว้ล่วงหน้าขนาดเล็กจำนวนหนึ่ง (หรือเรียกอีกอย่างว่าองค์ประกอบหรือตัวแจงนับ) ที่สามารถเปรียบเทียบและกำหนดให้กับตัวแปรประเภทข้อมูลที่แจกแจงได้

ค่าของประเภทที่แจกแจงอาจเป็นแบบข้อความหรือตัวเลข อันที่จริง ชนิดข้อมูลบูลีนเป็นการแจงนับที่กำหนดไว้ล่วงหน้าของค่าจริงและเท็จ

ตัวอย่างเช่น ถ้าร็อคและแจ๊สเป็นตัวแจงนับ ประเภทตัวแปรประเภทที่แจงนับสามารถกำหนดค่าอย่างใดอย่างหนึ่งในสองค่า แต่ไม่ใช่ทั้งสองค่า

สมมติว่าคุณถูกขอให้กรอกการตั้งค่าของคุณในแอปเพลง และถูกขอให้เลือกประเภทใดประเภทหนึ่งจากสองประเภทผ่านเมนูแบบเลื่อนลง ประเภทตัวแปรจะจัดเก็บทั้งร็อคหรือแจ๊ส

ด้วยประเภทที่แจกแจง ค่าสามารถจัดเก็บและดึงออกมาเป็นดัชนีตัวเลข (0, 1, 2) หรือสตริงได้

Array

หรือที่เรียกว่ารายการ อาร์เรย์คือประเภทข้อมูลที่จัดเก็บองค์ประกอบจำนวนหนึ่งตามลำดับเฉพาะ ซึ่งโดยทั่วไปจะเป็นประเภทเดียวกันทั้งหมด

เนื่องจากอาร์เรย์เก็บองค์ประกอบหรือค่าหลายรายการ โครงสร้างของข้อมูลที่จัดเก็บโดยอาร์เรย์จึงเรียกว่าโครงสร้างข้อมูลอาร์เรย์

แต่ละองค์ประกอบของอาร์เรย์สามารถดึงข้อมูลได้โดยใช้ดัชนีจำนวนเต็ม (0, 1, 2,…) และจำนวนองค์ประกอบทั้งหมดในอาร์เรย์แสดงถึงความยาวของอาร์เรย์

ตัวอย่างเช่น ประเภทตัวแปรอาร์เรย์สามารถจัดเก็บองค์ประกอบร็อค แจ๊ส และบลูส์ได้ตั้งแต่หนึ่งรายการขึ้นไป ดัชนีของค่าทั้งสามคือ 0 (ร็อค), 1 (แจ๊ส) และ 2 (บลูส์) และความยาวของอาร์เรย์คือ 3 (เนื่องจากมีสามองค์ประกอบ)

ต่อจากตัวอย่างแอปเพลง หากคุณถูกขอให้เลือกหนึ่งหรือหลายแนวจากสามแนวและคุณชอบทั้งสามแนว (ไชโย) แนวเพลงที่แปรผันจะเก็บองค์ประกอบทั้งสามไว้ (ร็อค แจ๊ส บลูส์) .

วันที่

ไม่ต้องการคำอธิบาย โดยทั่วไปจะจัดเก็บวันที่ในรูปแบบ YYYY-MM-DD (ไวยากรณ์ ISO 8601)

เวลา

จัดเก็บเวลาในรูปแบบ hh:mm:ss นอกจากช่วงเวลาของวันแล้ว ยังสามารถใช้เพื่อจัดเก็บเวลาที่ผ่านไปหรือช่วงเวลาระหว่างสองเหตุการณ์ที่อาจมากกว่า 24 ชั่วโมง ตัวอย่างเช่น เวลาที่ผ่านไปตั้งแต่เกิดเหตุการณ์อาจมากกว่า 72 ชั่วโมงขึ้นไป (72:00:59)

วันเวลา

เก็บค่าที่มีทั้งวันที่และเวลาร่วมกันในรูปแบบ YYYY-MM-DD hh:mm:ss

การประทับเวลา

โดยปกติจะแสดงในเวลา Unix การประทับเวลาแสดงถึงจำนวนวินาทีที่ผ่านไปตั้งแต่เที่ยงคืน (00:00:00 UTC) 1 มกราคม 1970

โดยทั่วไปจะใช้โดยระบบคอมพิวเตอร์เพื่อบันทึกวันที่และเวลาที่แม่นยำของเหตุการณ์ จนถึงจำนวนวินาทีในรูปแบบที่ไม่ได้รับผลกระทบจากเขตเวลา ดังนั้นการประทับเวลาจึงไม่เหมือนกับวันที่และเวลาโดยไม่คำนึงถึงตำแหน่งทางภูมิศาสตร์ของคุณ

หากคุณลองนึกดู เราแต่ละคนมีประทับเวลา—ป้อนวันที่และเวลาที่คุณเกิดที่นี่เพื่อดูของคุณเอง

ตัวอย่างและบทสรุป

ภาษาโปรแกรมต่างๆ นำเสนอประเภทข้อมูลอื่นๆ ที่หลากหลายเพื่อวัตถุประสงค์ที่หลากหลาย อย่างไรก็ตาม ประเภทข้อมูลที่ใช้บ่อยที่สุดที่คุณจำเป็นต้องรู้เพื่อนำข้อมูลมาใช้ได้ครอบคลุม

วิธีที่ดีในการคิดเกี่ยวกับชนิดข้อมูลคือเมื่อคุณเจอแบบฟอร์มหรือแบบสำรวจใดๆ

เมื่อพิจารณาจากแบบฟอร์มการลงทะเบียนมาตรฐาน คุณควรจำไว้ว่าแต่ละฟิลด์ยอมรับค่าของประเภทข้อมูลเฉพาะ

ฟิลด์ข้อความเก็บอินพุตเป็นสตริงในขณะที่ฟิลด์ตัวเลขมักจะยอมรับจำนวนเต็ม

ชื่อและที่อยู่อีเมลเป็นสตริงประเภทเสมอ ในขณะที่ตัวเลขสามารถจัดเก็บเป็นประเภทตัวเลขหรือเป็นสตริงได้ เนื่องจากสตริงคือชุดของอักขระรวมถึงตัวเลข

ในฟิลด์ตัวเลือกเดียวหรือหลายตัวเลือก ซึ่งต้องเลือกจากตัวเลือกที่กำหนดไว้ล่วงหน้า ชนิดข้อมูลที่ระบุประเภทและอาร์เรย์จะเข้ามามีบทบาท

แบบฟอร์มลงทะเบียนประเภทข้อมูล

ในแบบฟอร์มการสมัคร Facebook ด้านบน ช่องวันเกิดมี 3 ช่องย่อย แต่ละประเภทระบุให้คุณเลือกหนึ่งตัวเลือกสำหรับวัน เดือน และปีตามลำดับ

ในทำนองเดียวกัน ฟิลด์เพศต้องการให้คุณเลือกจากสองตัวเลือกที่กำหนดไว้ล่วงหน้าหรือเพิ่มตัวเลือกแบบกำหนดเอง ซึ่งข้อมูลเข้าจะถูกเก็บไว้เป็นสตริง

สตริงเช่นรหัสผ่านจะถูกแฮชหรือเข้ารหัสเสมอ (หรืออย่างน้อยก็ควรเป็น)

ทีนี้มาดูความสำคัญของประเภทข้อมูลกัน

ความสำคัญของประเภทข้อมูล

คุณอาจสงสัยว่าเหตุใดการรู้เกี่ยวกับประเภทข้อมูลทั้งหมดเหล่านี้จึงสำคัญ ในเมื่อคุณกังวลกับการทำความเข้าใจวิธีใช้ประโยชน์จากข้อมูลลูกค้าเป็นหลัก มีเหตุผลหลักเพียงข้อเดียว—เพื่อรวบรวมข้อมูลที่ชัดเจนและสม่ำเสมอ

ความรู้เกี่ยวกับประเภทข้อมูลของคุณจะมีประโยชน์ในสองขั้นตอนของความพยายามในการรวบรวมข้อมูลของคุณดังที่อธิบายไว้ด้านล่าง

เครื่องมือวัด

กระบวนการติดตามข้อมูลพฤติกรรมจากแหล่งข้อมูลหลักและการซิงค์ข้อมูลกับระบบจัดเก็บข้อมูลภายในหรือภายนอกเรียกว่าเครื่องมือวัด

ขั้นตอนแรกในกระบวนการวัดผลคือการสร้างแผนการติดตามข้อมูล ทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับแผนการติดตามจะครอบคลุมอยู่ในคู่มือนี้

เมื่อตัดสินใจว่าจะติดตามเหตุการณ์ใดและคุณสมบัติใดที่จะรวบรวม (ทั้งคุณสมบัติของเหตุการณ์และเอนทิตี) การระบุชนิดข้อมูลของแต่ละคุณสมบัติในแผนการติดตามจะทำให้กระบวนการเครื่องมือวัดมีประสิทธิภาพมากขึ้น และทำให้มีข้อผิดพลาดเพียงเล็กน้อย

สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับวิศวกรที่ได้รับมอบหมายให้ดำเนินการใช้งาน โดยตรวจสอบให้แน่ใจว่าแต่ละคุณสมบัติถูกส่งด้วยชนิดข้อมูลที่ถูกต้อง ข้อมูลจะไม่สอดคล้องกันสามารถหลีกเลี่ยงได้

แบบสำรวจ

ในฐานะมืออาชีพด้านข้อมูล มีแนวโน้มว่าคุณจะรวบรวมข้อมูลจากลูกค้าของคุณผ่านแบบสำรวจตลอดเส้นทางของลูกค้า ตั้งแต่การเริ่มต้นใช้งานจนถึงการยกเลิก

คำถามที่คุณถามในแบบสำรวจอาจเป็นคำถามปลายเปิด (ข้อความหรือตัวเลข) หรือมาพร้อมกับตัวเลือกที่กำหนดไว้ล่วงหน้า เช่น รายการดรอปดาวน์ (enum) ช่องกาเครื่องหมาย (อาร์เรย์) ปุ่มตัวเลือก (บูลีน) หรือแม้แต่ตัวเลื่อน (ขึ้นอยู่กับ) .

ในการจัดเก็บข้อมูลจากแบบสำรวจ (ในฐานข้อมูลหรือระบบของบุคคลที่สาม) คุณต้องระบุชื่อคุณสมบัติ (industry_name, job_role, cancel_reason, is_satisfied ฯลฯ) และประเภทข้อมูล (สตริง ตัวเลข บูลีน ฯลฯ) ) สำหรับทุกฟิลด์ในแบบสำรวจของคุณ ชื่อคุณสมบัติเก็บค่าที่ป้อน และชนิดข้อมูลจะตรวจสอบว่าค่าเป็นไปตามที่คาดไว้

การทำเช่นนี้ส่งผลให้ข้อมูลมีความสอดคล้องกันและทำให้วิเคราะห์และเปิดใช้งานข้อมูลได้ง่ายขึ้น โปรดจำไว้ว่าคำถามปลายเปิดมีไว้เพื่อการวิเคราะห์ที่เข้มงวดขึ้น เนื่องจากคุณไม่สามารถรวมคำตอบได้เว้นแต่คุณจะแปลงข้อมูลโดยแยกวิเคราะห์คำตอบแต่ละรายการและแยกข้อความที่ตรงกับกฎ

ด้วยตัวเลือกที่กำหนดไว้ล่วงหน้า การวิเคราะห์จะตรงไปตรงมาและไม่ได้รับผลกระทบแม้ว่าคุณจะเปลี่ยนตัวเลือกในภายหลัง (ดูที่ประเภทข้อมูล enum และอาร์เรย์)

นำประเภทข้อมูลไปปฏิบัติ

การประยุกต์ใช้ความรู้ของคุณเกี่ยวกับประเภทข้อมูลไม่จำกัดเพียงการเก็บรวบรวมข้อมูลหรือเครื่องมือวัด กิจกรรมอื่นๆ เช่น การจัดการข้อมูล การรวมข้อมูล และการพัฒนาแอปพลิเคชันภายใน (โดยใช้เครื่องมือที่ไม่ต้องใช้โค้ดหรือเครื่องมือแบบ low-code) จะง่ายขึ้นมากเมื่อคุณเข้าใจประเภทข้อมูลต่างๆ


เรียนรู้ว่าคุณจะใช้งานข้อมูลต่อไปได้อย่างไรโดยการสร้างกองข้อมูลที่ทันสมัยสำหรับการเติบโตและการใช้ข้อมูลเพื่อขับเคลื่อนการเก็บข้อมูล หรือ ดูประเภทข้อมูลของคุณใน Amplitude

การวิเคราะห์ผลิตภัณฑ์สำหรับหุ่น