ما هي أنواع البيانات ولماذا هي مهمة؟

نشرت: 2022-03-03

نوع البيانات هو سمة مرتبطة بجزء من البيانات يخبر نظام الكمبيوتر بكيفية تفسير قيمته. يضمن فهم أنواع البيانات أن يتم جمع البيانات بالتنسيق المفضل وأن تكون قيمة كل خاصية كما هو متوقع.

يرجى الأخذ في الاعتبار أنه لا يجب الخلط بين أنواع البيانات وبين نوعي البيانات معًا يشار إليهما ببيانات العميل - بيانات الكيان وبيانات الأحداث.

مطلوب فهم جيد لأنواع البيانات لتحديد خصائص الحدث وخصائص الكيان بشكل صحيح. يجب أن تحتوي خطة التتبع المحددة جيدًا على نوع البيانات لكل عقار لضمان دقة البيانات ومنع فقدان البيانات.

قبل القفز إلى أهمية أنواع البيانات ، دعنا نلقي نظرة على بعض أنواع البيانات الشائعة.

أنواع البيانات الشائعة

عدد صحيح (int)

إنه أكثر أنواع البيانات الرقمية شيوعًا المستخدمة لتخزين الأرقام بدون مكون كسري (-707 ، 0 ، 707).

النقطة العائمة (عائمة)

وهو أيضًا نوع بيانات رقمي يُستخدم لتخزين الأرقام التي قد تحتوي على مكون كسري مثل القيم النقدية (707.07 ، 0.7 ، 707.00).

يرجى ملاحظة أن الرقم غالبًا ما يستخدم كنوع بيانات يتضمن كلا النوعين int و float.

حرف (شار)

يتم استخدامه لتخزين حرف واحد أو رقم أو علامة ترقيم أو رمز أو مساحة فارغة.

سلسلة (str أو text)

إنها سلسلة من الأحرف ونوع البيانات الأكثر استخدامًا لتخزين النص. بالإضافة إلى ذلك ، يمكن أن تتضمن السلسلة أيضًا أرقامًا ورموزًا ، ومع ذلك ، يتم التعامل معها دائمًا كنص.

عادةً ما يتم تخزين رقم الهاتف كسلسلة (+ 1-999-666-3333) ولكن يمكن أيضًا تخزينه كعدد صحيح (9996663333).

منطقية (منطقية)

إنه يمثل القيم الحقيقية والخطأ. عند العمل باستخدام نوع البيانات المنطقية ، من المفيد أن تضع في اعتبارك أنه في بعض الأحيان يتم تمثيل القيمة المنطقية أيضًا على أنها 0 (للخطأ) و 1 (للصواب).

النوع المعدود (تعداد)

يحتوي على مجموعة صغيرة من القيم الفريدة المحددة مسبقًا (المعروفة أيضًا باسم العناصر أو العدادين) التي يمكن مقارنتها وتعيينها إلى متغير من نوع البيانات المعدودة.

يمكن أن تكون قيم النوع الذي تم تعداده قائمة على النص أو رقمية. في الواقع ، نوع البيانات المنطقية هو تعداد محدد مسبقًا للقيم صواب وخطأ.

على سبيل المثال ، إذا كانت موسيقى الروك والجاز هي العدادين ، فيمكن تعيين نوع متغير من النوع المعدَّد أيًا من القيمتين ، ولكن ليس كليهما.

بافتراض أنه قد تمت مطالبتك بملء تفضيلاتك في تطبيق الموسيقى ومطالبتك باختيار أحد النوعين عبر قائمة منسدلة ، فإن النوع المتغير سيخزن إما موسيقى الروك أو الجاز.

باستخدام النوع الذي تم تعداده ، يمكن تخزين القيم واستردادها كمؤشرات رقمية (0 ، 1 ، 2) أو سلاسل.

مجموعة مصفوفة

المصفوفة تُعرف أيضًا باسم القائمة ، وهي نوع بيانات يخزن عددًا من العناصر بترتيب معين ، وعادةً ما تكون جميعها من نفس النوع.

نظرًا لأن المصفوفة تخزن عناصر أو قيمًا متعددة ، يُشار إلى بنية البيانات المخزنة بواسطة المصفوفة باسم بنية بيانات الصفيف.

يمكن استرجاع كل عنصر من عناصر المصفوفة باستخدام فهرس عدد صحيح (0 ، 1 ، 2 ، ...) ، ويمثل العدد الإجمالي للعناصر في المصفوفة طول المصفوفة.

على سبيل المثال ، يمكن لنوع متغير مصفوفة تخزين عنصر أو أكثر من عناصر موسيقى الروك والجاز والبلوز. مؤشرات القيم الثلاث هي 0 (موسيقى الروك) و 1 (موسيقى الجاز) و 2 (البلوز) ، وطول المصفوفة هو 3 (لأنها تحتوي على ثلاثة عناصر).

بالاستمرار في مثال تطبيق الموسيقى ، إذا طُلب منك اختيار نوع واحد أو أكثر من الأنواع الثلاثة وحدث أنك تحب الثلاثة (هتاف لذلك) ، فإن النوع المتغير سيخزن العناصر الثلاثة (موسيقى الروك والجاز والبلوز) .

تاريخ

لا يحتاج إلى تفسير ؛ عادةً ما يخزن التاريخ بتنسيق YYYY-MM-DD (بناء جملة ISO 8601).

وقت

يخزن وقتًا بتنسيق hh: mm: ss. إلى جانب الوقت من اليوم ، يمكن استخدامه أيضًا لتخزين الوقت المنقضي أو الفاصل الزمني بين حدثين يمكن أن يكون أكثر من 24 ساعة. على سبيل المثال ، يمكن أن يكون الوقت المنقضي منذ وقوع الحدث أكثر من 72 ساعة (72:00:59).

التاريخ والوقت

يخزن قيمة تحتوي على كل من التاريخ والوقت معًا بتنسيق YYYY-MM-DD hh: mm: ss.

الطابع الزمني

يتم تمثيل الطابع الزمني عادةً في وقت Unix ، ويمثل عدد الثواني التي انقضت منذ منتصف الليل (00:00:00 بالتوقيت العالمي المنسق) ، في الأول من يناير 1970.

يتم استخدامه عادةً بواسطة أنظمة الكمبيوتر لتسجيل التاريخ والوقت الدقيقين لحدث ما ، وصولاً إلى عدد الثواني ، بتنسيق لا يتأثر بالمناطق الزمنية. لذلك ، على عكس التاريخ والوقت ، يظل الطابع الزمني كما هو بغض النظر عن موقعك الجغرافي.

إذا فكرت في الأمر ، فكل واحد منا يحمل طابعًا زمنيًا - أدخل تاريخ ووقت ميلادك هنا لترى طابعك الخاص.

مثال وخلاصة

تقدم لغات البرمجة المختلفة أنواعًا مختلفة من البيانات الأخرى لمجموعة متنوعة من الأغراض ، ومع ذلك ، فقد تم تغطية أنواع البيانات الأكثر استخدامًا التي تحتاج إلى معرفتها لتصبح قائمة على البيانات.

هناك طريقة جيدة للتفكير في أنواع البيانات عندما تصادف أي نموذج أو استطلاع.

بالنظر إلى نموذج التسجيل القياسي ، يجب أن تضع في اعتبارك أن كل حقل يقبل قيمًا من نوع بيانات معين.

يخزن حقل النص الإدخال كسلسلة بينما يقبل حقل الرقم عادةً عددًا صحيحًا.

دائمًا ما تكون الأسماء وعناوين البريد الإلكتروني من سلسلة النوع ، بينما يمكن تخزين الأرقام كنوع رقمي أو كسلسلة لأن السلسلة عبارة عن مجموعة من الأحرف بما في ذلك الأرقام.

في الخيار الفردي أو حقول الخيارات المتعددة ، حيث يتعين على المرء الاختيار من بين الخيارات المحددة مسبقًا ، يتم تشغيل أنواع البيانات والنوع والمصفوفات التي تم تعدادها.

نموذج تسجيل أنواع البيانات

في نموذج التسجيل على Facebook أعلاه ، يحتوي حقل "عيد الميلاد" على 3 حقول فرعية ، كل منها يطلب منك اختيار خيار واحد لليوم والشهر والسنة على التوالي.

وبالمثل ، يريد حقل الجنس أن تختار من بين الخيارين المحددين مسبقًا أو إضافة خيار مخصص ، يتم تخزين مدخلاته كسلسلة.

يتم دائمًا تجزئة أو تشفير سلاسل مثل كلمات المرور (أو على الأقل يجب أن تكون كذلك).

الآن دعونا نلقي نظرة على أهمية أنواع البيانات.

أهمية أنواع البيانات

قد تتساءل عن سبب أهمية معرفة جميع أنواع البيانات هذه عندما تكون مهتمًا بشكل أساسي بفهم كيفية الاستفادة من بيانات العملاء. هناك سبب رئيسي واحد فقط - لجمع بيانات نظيفة ومتسقة.

ستكون معرفتك بأنواع البيانات مفيدة في مرحلتين من جهود جمع البيانات كما هو موضح أدناه.

الأجهزة

تُعرف عملية تتبع البيانات السلوكية من مصادر البيانات الأولية ومزامنة البيانات إلى نظام تخزين داخلي أو خارجي باسم الأجهزة.

تتمثل الخطوة الأولى في عملية الأجهزة في إنشاء خطة تتبع البيانات. كل ما تحتاج لمعرفته حول خطة التتبع مغطى في هذا الدليل.

عند تحديد الأحداث التي يجب تتبعها وما هي الخصائص التي يجب جمعها (كل من خصائص الحدث والكيان) ، فإن تحديد نوع البيانات لكل خاصية في خطة التتبع يجعل عملية الأجهزة أكثر كفاءة ولا يترك مجالًا للخطأ.

هذا مفيد بشكل خاص للمهندسين المكلفين بالتنفيذ. من خلال التأكد من إرسال كل خاصية بنوع البيانات الصحيح ، يمكن تجنب عدم تناسق البيانات.

الدراسات الاستقصائية

بصفتك محترفًا قائمًا على البيانات ، من المحتمل أنك ستجمع البيانات من عملائك عبر استطلاعات الرأي طوال رحلة العميل - بدءًا من الانضمام إلى الخدمة.

يمكن أن تكون الأسئلة التي تطرحها في استطلاع رأي مفتوحة (نصية أو رقمًا) أو تأتي مع خيارات محددة مسبقًا مثل القائمة المنسدلة (التعداد) أو مربعات الاختيار (المصفوفة) أو أزرار الاختيار (منطقية) أو حتى شريط التمرير (حسب) .

لتخزين البيانات من الاستطلاعات (في قاعدة بيانات أو نظام تابع لجهة خارجية) ، تحتاج إلى تحديد اسم خاصية (اسم الصناعة ، وظيفة_العمل ، إلغاء_سبب ، is_satisfied ، إلخ.) ونوع بياناتها (سلسلة ، رقم ، منطقي ، إلخ. ) لكل مجال في المسح الخاص بك. يخزن اسم الخاصية القيمة التي تم إدخالها ويتحقق نوع البيانات من أن القيمة كما هو متوقع.

يؤدي القيام بذلك إلى اتساق البيانات وتسهيل تحليل البيانات وتنشيطها. من الجيد أن تضع في اعتبارك أن الأسئلة المفتوحة تؤدي إلى تحليل أكثر صرامة حيث لا يمكنك تجميع الردود إلا إذا قمت بتحويل البيانات عن طريق تحليل كل إجابة واستخراج النص المطابق لقاعدة.

باستخدام الاختيارات المحددة مسبقًا ، يكون التحليل مباشرًا ولا يتأثر حتى إذا قمت بتغيير الاختيارات في مرحلة لاحقة (راجع أنواع بيانات التعداد والصفيف).

وضع أنواع البيانات موضع التنفيذ

لا يقتصر تطبيق معرفتك على أنواع البيانات على جمع البيانات أو الأجهزة ؛ يجب أن تصبح الأنشطة الأخرى مثل إدارة البيانات ، وتكامل البيانات ، وتطوير التطبيقات الداخلية (باستخدام أدوات no-code أو ذات التعليمات البرمجية المنخفضة) أسهل كثيرًا الآن بعد أن فهمت أنواع البيانات المختلفة.


تعرف على كيفية المضي قدمًا في استخدام البيانات من خلال إنشاء مكدس بيانات حديث للنمو واستخدام البيانات لزيادة الاحتفاظ. أو راجع أنواع البيانات الخاصة بك في Amplitude .

تحليلات المنتج للدمى