ما هو اختبار A / B؟ كيف يعمل ومتى يتم استخدامه

نشرت: 2022-01-25

تحدد طريقة اختبار A / B (أ / ب) أي إصدارين من الشيء ينتج أفضل النتائج. غالبًا ما يُشار إليه باسم "الاختبار المقسم" لأن مجموعات المستخدمين تنقسم إلى مجموعتين (المجموعة "أ" والمجموعة "ب") ويتم توجيههم إلى تجارب رقمية منفصلة.

يمكن أن يساعدك اختبار A / B في صياغة حملات تسويقية أفضل أداءً أو تعديل تدفقات سير عمل إعداد المنتج. يمكن اختبار التغييرات التي تم إجراؤها على منتجك أو ميزتك على مجموعات صغيرة مجزأة تسمى المجموعات الجماعية للتحقق من الفعالية مع تقليل الاحتكاك.

يعد اختبار A / B أداة حيوية وموثوقة يمكن ويجب استخدامها في مجموعة متنوعة من المواقف. يتخذ مديرو المنتجات والمسوقون والمصممين وغيرهم ممن يستخدمون اختبار A / B بنشاط قرارات مدعومة بالبيانات تؤدي إلى نتائج حقيقية وقابلة للقياس الكمي.

الماخذ الرئيسية

  • يساعد اختبار A / B في تحديد أي من أصلين مختلفين يعمل بشكل أفضل.
  • تُستخدم اختبارات A / B لتحسين الحملات التسويقية وتحسين واجهة المستخدم / UX وزيادة التحويلات.
  • توجد إصدارات متعددة من اختبارات A / B لاختبار الصفحات الفردية والمتغيرات المتعددة ومهام سير العمل والمسارات بالكامل.
  • يجب أن تكون اختبارات A / B مجزأة ، والتحقق من صحتها ، وقابلة للتكرار للحصول على أقصى النتائج.

ما هي فوائد اختبار أ / ب؟

تجيب اختبارات A / B على سؤال أساسي: هل يفضل العملاء الخيار 1 أم الخيار 2؟ في عالم المنتجات الرقمية ، تعتبر الإجابة على هذا السؤال ذات قيمة في عدد من المواقف ، بما في ذلك مجالان رئيسيان: تحسين تجربة العملاء وتعزيز الحملات التسويقية.

تحسين واجهة المستخدم / UX

يمكن أن تؤدي التعديلات حسنة النية على واجهة مستخدم منتجك إلى عواقب غير مقصودة تؤدي إلى حدوث احتكاك بين المستخدمين. يمكنك تغيير موقع علامة تبويب في تطبيق الهاتف المحمول الخاص بك لجذب مستخدمين جدد ولكنك تحبط بطريق الخطأ المستخدمين الحاليين الذين اعتادوا على مكانها السابق.

يؤدي إجراء سلسلة من اختبارات A / B إلى تقليل مخاطر إجراء تغييرات شاملة عن طريق اختبار شريحة أصغر من قاعدة المستخدمين أولاً. على سبيل المثال ، يمكنك إنشاء شريحة صغيرة من المستخدمين الجدد في تجربة السعة وتوجيههم خلال التكرار الجديد لمنتجك مع تغيير مكان علامة التبويب.

في نفس الوقت ، يمكنك إنشاء مجموعة مماثلة من المستخدمين الجدد ولكن تتبعهم أثناء استخدامهم للإصدار الحالي. في نهاية التجربة ، يمكنك مقارنة سلوكيات المجموعة التجريبية بسلوكيات المجموعة الضابطة لمعرفة أي إصدار من منتجك ينتج أفضل النتائج.

للتعرف على كيفية تفاعل العملاء الحاليين مع التغيير مقابل المستخدمين الجدد ، يجب عليك تكرار التجربة. هذه المرة ، استبدل المجموعات التجريبية والمجموعات الضابطة بشرائح من المستخدمين الحاليين. من خلال تشغيل التجربة عدة مرات باستخدام شرائح مختلفة ، يمكنك تحسين فرص أن تغذي تغييراتك اعتماد منتجك بدلاً من إثارة الزخم.

تخصيص التجربة

تحسين الحملات التسويقية

يمكن استخدام اختبار A / B لتعزيز أداء جهودك التسويقية. من المرجح أن تكشف بياناتك السلوكية أن العملاء الذين يجرون تحويلات من المرجح أن يشاركوا في سلوكيات أو خصائص ديموغرافية مماثلة. أنت تعرف من تريد استهدافه ، لكن يتبين أن النقاط الدقيقة بعيدة المنال:

  • ما هي الرسائل الأكثر فعالية في تأجيج التحويلات؟
  • ما العرض أو الحافز الذي يستجيب له العملاء المحتملون أو الحاليون بشكل أفضل؟
  • هل ينتج عن تصميم مختلف لزر الحث على اتخاذ إجراء مزيد من النقرات؟

يمكنك إنشاء حملة بناءً على تجربتك وغرائزك والأمل في الأفضل ، لكن هذا لا يزال ينطوي على مخاطر. يمكنك إرسال رسائل البريد الإلكتروني أو المنشورات الاجتماعية المدفوعة إلى الأشخاص المناسبين بينما تفوتك الهدف برسالتك. قد تحصل الحملة على العديد من التحويلات ، لكنك لن تعرف أبدًا ما إذا كانت الخيارات التي لم تحددها ستجلب لك المزيد.

تحدد اختبارات A / B أفضل خيارات التسويق من خلال تقديم نتائج مدعومة بالبيانات. قد تكشف سلسلة من اختبارات A / B أن المستخدمين يستجيبون بشكل أفضل لطلبات CTA الخضراء أكثر من تلك الزرقاء أو أن عرضًا تجريبيًا مجانيًا يعمل بمستويات أعلى من الخصم لمرة واحدة. تساعدك هذه العملية في تقليل الإنفاق الذي كان سيُهدر على الإعلانات ذات الأداء الأقل.

تجربة السعة: عرض قمع اختبار A / B
تعرض طريقة عرض اختبار A / B ضمن مخطط تحليل مسار التحويل حركات المستخدم خلال مسار التحويل.

أمثلة من العالم الحقيقي لاختبار أ / ب

تعزيز تحويلات الصفحة المقصودة

استخدمت منصة الرياضات الإلكترونية G-Loot اختبار A / B لتحسين معدلات تحويل الصفحة المقصودة إلى نتائج مذهلة. اختبرت G-Loot التغييرات التي تم إجراؤها على صفحاتها المقصودة التي تعتمد على الإعلانات وحدد أفضل التعديلات باستخدام تجربة السعة. بعد تغيير الصفحات لتعكس التصميم الأفضل أداءً ومتغيرات العرض ، قفزت معدلات تحويل الصفحة المقصودة الخاصة بـ G-Loot من ثلاثة بالمائة إلى نسبة لا تُصدق بنسبة 35٪.

زيادة الاستبقاء عن طريق تحسين تجربة العملاء

تبنت NBCUniversal اختبار A / B كوسيلة لتقليل الاضطراب. اختبرت شركة الوسائط العملاقة صفحتها الرئيسية الحالية لأجهزة تلفزيون Vizio مقابل التكرارات الأحدث. بمساعدة Amplitude ، حددت الشركة صفحة رئيسية جديدة أدت إلى زيادة نسبة المشاهدة في مجموعة التجربة بنسبة 10٪. تبنت NBCUniversal الصفحة الرئيسية الجديدة لجميع العملاء ، وهي خطوة ضاعفت الاحتفاظ لمدة 7 أيام.

قيادة الابتكار من خلال اختبار A / B

يشجع حل التحليلات الصحيح على إجراء المزيد من التجارب المتكررة ، مما يؤدي بدوره إلى زيادة المرونة وتغذية الابتكار. اعتاد الفريق في GoFundMe أن يطلب أسابيع لتحليل نتائج اختبار A / B. بفضل قدرة Amplitude على تحليل النتائج في الوقت الفعلي ، تمكنت GoFundMe من زيادة عدد الاختبارات التي أجروها من اختبارين أو ثلاثة إلى 10 اختبارات شهريًا. بدلاً من الاضطرار إلى انتقاء واختيار الأفكار التي سيتم اختبارها بسبب ضيق الوقت ، يمكن للفريق الآن اختبار الفرضيات أثناء تطويرها.

3 أنواع مختلفة من اختبارات A / B - ومتى تستخدم كل منها

إلى جانب اختبار A / B التقليدي ، هناك ثلاثة أنواع من اختبارات A / B التي يمكن الاستفادة منها حسب الموقف:

انقسام اختبار URL

انقسام URL اختبار A / B

يعد التغيير والتبديل في زر على صفحتك الرئيسية شيئًا واحدًا ، ولكن ماذا يحدث إذا كنت ترغب في اختبار تصميم صفحة جديد تمامًا؟ يأخذ اختبار URL المقسم مفهوم اختبار A / B ويوسع نطاقه إلى نطاق أكبر. يُنشئ هذا النوع من الاختبارات عنوان URL منفصلًا تمامًا بحيث يمكنك إعادة تصميم صفحة ويب بالكامل من الألف إلى الياء. يمكن بعد ذلك توجيه مجموعتك التجريبية إلى هذه الصفحة الجديدة بحيث يمكن مقارنة النتائج مع صفحتك الحالية.

يمكن استخدام اختبار URL المقسم واختبار A / B التقليدي معًا لتحسين أداء الصفحة. سيكشف اختبار عنوان URL المنفصل عن التصميمين الأفضل للصفحة المعنية. من هناك ، يمكن لسلسلة من اختبارات A / B التقليدية اختبار تفضيل المستخدم لمزيد من التفاصيل الدقيقة مثل نسخة CTA أو حجم الخط أو الصور.

اختبار متعدد المتغيرات

اختبار AB متعدد المتغيرات

هذا النوع من الاختبارات التجريبية التي تحتوي على أكثر من متغير. قد يقوم اختبار A / B التقليدي بتقييم أي من حجمي زر CTA المفضل. نسبيًا ، يمكن أن يشتمل اختبار متعدد المتغيرات على أحجام مختلفة للحث على اتخاذ إجراء وعناوين وصور ، مما يسمح لك بتحديد أي من مجموعة كبيرة من الخيارات يحقق أفضل أداء لحملتك.

يعد الاختبار متعدد المتغيرات مفيدًا في تأكيد أو نفي افتراضاتك فيما يتعلق بالأصول الأفضل أداءً من بين العديد. قد تعتقد أن مجموعة معينة من عناصر التصميم تؤدي بشكل أفضل لقاعدة هدفك. من خلال إنشاء إصدارات باستخدام متغيرات بديلة ، يمكنك اختبار التصميم المفضل لديك مقابل العديد من التصميمات الأخرى للحصول على حساب صادق لما يحقق أفضل أداء.

يتمثل العيب الرئيسي للاختبار متعدد المتغيرات في أن كل متغير إضافي يضيف إصدارًا آخر من الأصل الذي يجب إنشاؤه. إذا كنت ترغب في اختبار خمسة أشكال مختلفة لأزرار CTA وأربعة ألوان زر CTA وثلاثة خطوط مختلفة ، فستحتاج إلى إنشاء 60 أصل اختبار مختلف (!) لتغطية جميع القواعد الخاصة بك.

اختبار متعدد

اختبار AB متعدد الصفحات

يقيس اختبار متعدد الصفحات نجاح نسخة بديلة من مسارات العمل أو مسار التحويل. يمكن إجراء تغييرات شاملة على صفحات متعددة في تسلسل لإنشاء مسار منفصل يمكن اختباره مقابل الأصل. يعد اختبار متعدد الصفحات مناسبًا أيضًا في المواقف التي ترغب فيها ببساطة في إضافة عنصر واحد أو إزالته من كل صفحة في التدفق أو المسار واختبار التأثيرات.

لنفترض أن تسلسل الخروج لموقع التجارة الإلكترونية الخاص بك يبدو كما يلي:

عربة التسوق (أ) ← معلومات الدفع (أ) ← معلومات الشحن (أ) ← مراجعة الطلب (أ) ← إرسال الطلب (أ)

لديك فضول لمعرفة ما إذا كان تحريك زر "الخطوة التالية" في الصفحات الثلاث الأولى يساعد أو يضر بمعدلات الشراء. يمكنك نظريًا اختبار كل صفحة على حدة ، ولكن لا يختبر العملاء هذه الصفحات بمعزل عن غيرها. ينتقلون من صفحة إلى أخرى بالتسلسل.

أنت تعلم أن نتائج تجربتك ستكون أكثر دقة إذا اختبرت الصفحات بالترتيب. لهذا السبب ، يمكنك إنشاء أشكال مختلفة من تسلسل الشراء بحيث يبدو مسار التحويل التجريبي كما يلي:

عربة التسوق (م) ← معلومات الدفع (ب) ← معلومات الشحن (ب) ← مراجعة الطلب (أ) ← إرسال الطلب (أ)

مثل أي شكل من أشكال اختبار A / B ، فإن الهدف هو تحديد مسار التحويل الأفضل أداءً مقابل النسخة الأصلية وحتى ضد التكرارات الأخرى. بعد اختبار عدد من المواقع لزر "الخطوة التالية" ، قد يبدو مسار التحويل النهائي أكثر مثل هذا:

عربة التسوق (ب) ← معلومات الدفع (د) ← معلومات الشحن (ج) ← مراجعة الطلب (أ) ← إرسال الطلب (أ)

مفتاح إجراء اختبار أ / ب

على الرغم من أن اختبارات A / B مفيدة لتصميم UI / UX وتسويق المنتجات ، يجب إجراؤها وتقييمها بشكل صحيح لإطلاق العنان لإمكانياتها الحقيقية. تشمل مفاتيح نجاح اختبار A / B ما يلي:

التكرار

في بعض الأحيان ، توفر اختبارات A / B نتائج مثيرة للغاية لدرجة أنها تؤدي إلى قرارات متهورة. رأت إحدى الشركات أن تغيير لون زر الحث على الشراء عزز معدلات التحويل بمقدار ثلاثة أضعاف. إذا أدى اختبار أ / ب الخاص بك إلى نتيجة مماثلة ، فقد ترغب في تشغيل هذا الإصدار من إعلانك على الفور ، وسيكون من الصعب إلقاء اللوم عليك.

ومع ذلك ، تعتبر نتائج الاختبار صالحة فقط إذا كانت قابلة للتكرار. يؤدي تحقيق نفس النتائج مرارًا وتكرارًا إلى تقليل احتمالية أن تكون نتيجتك الأولية صدفة. علاوة على ذلك ، إذا تقدمت في حملة تستخدم أزرار CTA الزرقاء دون اختبار نسخة حمراء ، فلن تعرف أبدًا ما إذا كنت تستخدم بالفعل أفضل خيار CTA.

تجزئة المستخدم

تقسيم المستخدم هو عملية إنشاء مجموعة فرعية من مستخدمين محددين لاختبارات أ / ب. تستند مجموعات المستخدمين هذه إلى عملاء لهم سمات سلوكية أو ديموغرافية متشابهة. في العديد من اختبارات A / B ، تريد معرفة كيفية تفاعل مجموعة معينة من العملاء مع التغييرات التي ستؤثر عليهم. في هذه الحالات ، قد يؤدي اختبار نطاق واسع من العملاء إلى إضعاف النتيجة من الشريحة التي ترغب في استهدافها.

تخيل أنك تفكر في إجراء تغييرات جمالية على برنامج الدردشة الآلي الخاص بمنتجك. أنت تعلم أنه من غير المرجح أن يستخدم العملاء الذين استخدموا منتجك لأكثر من ثلاثة أشهر هذه الميزة ، لذا فإن تضمينهم في اختبار A / B ليس منطقيًا. بدلاً من ذلك ، يجب عليك إنشاء شريحة من المستخدمين الذين استخدموا منتجك لمدة تقل عن ثلاثة أشهر للحصول على أفضل فكرة عن كيفية تأثير تغييرات التصميم على أولئك الذين سيستخدمونها.

يمكن لـ Amplitude التوصية بناء مجموعة من العملاء الذين من المرجح أن يقوموا بإجراء معين في المستقبل. هذا يعني أنه يمكنك إنشاء شريحة مكونة بالكامل من مستخدمين جدد تم توقعهم بشكل تحليلي لاستخدام روبوت المحادثة بناءً على السلوكيات السابقة. اختبار A / B باستخدام مجموعة تنبؤية لديه احتمالية أعلى بكثير لتضمين المستخدمين الذين تريد استهدافهم مع استبعاد الأشخاص غير المهتمين باستخدام chatbot.

اختبار اختبارك

إذا قمت ببناء اختبار A / B الخاص بك بشكل خاطئ ، فإن جميع اختباراتك ستكون هباءً. قد يؤدي الاختبار المعيب إلى نتائج غير منطقية على الرغم من تجزئة المستخدم والاختبار المتكرر. بالتأكيد ، يتصرف العملاء بشكل غير متوقع من وقت لآخر ، ولكن بشكل عام هناك نمط لسلوكهم.

بدلاً من إنشاء مجموعتين وتوجيههما إلى تجربتين منفصلتين ، اختبر منتجك مقابل نفسه فيما يسمى أحيانًا "اختبار A / A". من الناحية النظرية ، يجب أن تكون نتائج اختبار A / A متشابهة بشكل ملحوظ حيث لا يوجد اختلاف بين الرحلتين. إذا كانت النتائج منحرفة ، فقد حان الوقت لتقسيم تجربتك إلى البراغي وإجراء تحليل خطوة بخطوة لمكان حدوث المشكلة.

3 أخطاء شائعة في اختبار A / B (وكيفية تجنبها)

توفر اختبارات A / B رؤى قيمة طالما يتم إجراؤها بشكل صحيح. يمكن أن تؤدي النتائج غير الصحيحة إلى تحريف النتائج وتقود الفرق إلى اتخاذ قرارات مهمة بناءً على البيانات السيئة. تتضمن بعض أخطاء اختبار A / B الأكثر شيوعًا ما يلي:

1. اختبار متغيرات متعددة في اختبار واحد أ / ب

تم تصميم اختبار A / B لاختبار متغير واحد في كل مرة. يتيح لك قصر اختيارات "أ" و "ب" على تغيير واحد أن تعرف على وجه اليقين أن هذا التغيير المحدد كان مسؤولاً عن النتيجة النهائية.

يؤدي تغيير المتغيرات المتعددة إلى فتح نتائج الاختبار للتفسير. على سبيل المثال ، قد يؤدي تغيير ثلاث ميزات جمالية إلى نتيجة أفضل للإعلان أ على الإعلان ب ، ولكن لن تكون هناك طريقة لمعرفة ما إذا كانت جميع التغييرات الثلاثة مسؤولة عن الأداء الأفضل. عند الاختبار بشكل فردي ، قد تجد أن اثنين من التغييرات تضر بالأداء بالفعل والتغيير الثالث كان المسؤول الوحيد عن معدل التحويل الأعلى.

افعل لنفسك معروفًا واجعل الأمور بسيطة: حدد نفسك بصيغة واحدة لكل اختبار أ / ب.

2. الاختبار في وقت مبكر جدًا

إذا قمت للتو بإعداد صفحة مقصودة جديدة ، فمن المفيد تأجيل اختبار A / B لفترة من الوقت. يؤدي تغيير العناصر في صفحة جديدة على الفور إلى منعك من جمع المقاييس الضرورية حول أداء التكرار الأصلي. بدون أساس ثابت ، ليس لديك البيانات الصحيحة لاختبار التغييرات وفقًا لها.

3. استدعاء الاختبار قبل الأوان

قد تميل إلى إعلان النجاح بعد أيام قليلة فقط بناءً على النتائج الواعدة. ومع ذلك ، فمن الأفضل ترك الاختبارات تعمل لمدة أسبوعين على الأقل للحصول على بيانات أكثر موثوقية. يمكن أن يوفر عامل بسيط مثل يوم الأسبوع أو العطلة نتائج منحرفة. يمكن أن يوفر الاختبار لعدة أسابيع صورة أكثر واقعية عن كيفية تفاعل العملاء مع التغييرات التي أجريتها على مدار الوقت.

زوِّد اختبارات A / B ببيانات العميل

تُستخدم البيانات التاريخية والديموغرافية والسلوكية في اختبارات A / B الضخمة من قبل بعض أكبر الشركات في العالم. تستخدم Amazon اختبار A / B لتحديد مدى فعالية آلة التوصيات القوية. استفادت Netflix من اختبار A / B لتبرير إنشاء قوائمها العشرة الأولى. بالنظر إلى النجاحات التي حققتها كل من Amazon و Netflix في صناعاتهما ، يجدر إضافة اختبار A / B إلى حزام أدوات إدارة المنتج.

مراجع

  • 24 من أكثر اختبارات A / B إثارة للدهشة على الإطلاق ، WordStream. 08 يوليو 2021.
  • استخدام اختبار A / B لقياس فعالية التوصيات التي تم إنشاؤها بواسطة Amazon Personalize ، AWS. 20 أغسطس 2020.
  • ما هو اختبار A / B؟ مدونة Netflix Tech. 22 سبتمبر 2021.