الأسباب الأكثر شيوعًا للقيم المتطرفة في مجموعة البيانات: أخطاء القياس(أخطاء الأداة) الأخطاء التجريبية (أخطاء استخراج البيانات أو تخطيط التجربة / التنفيذ) المتعمدة (القيم المتطرفة الوهمية المصممة للاختبار طرق الكشف) أخطاء معالجة البيانات (معالجة البيانات أو مجموعة البيانات الطفرات غير المقصودة)
ما هو السبب المحتمل وراء الانشقاق؟
هناك ثلاثة أسباب للقيم المتطرفة - إدخال البيانات / أخطاء قياس التجربة ، ومشاكل أخذ العينات ، والتباين الطبيعي. يمكن أن يحدث خطأ أثناء التجربة / إدخال البيانات. أثناء إدخال البيانات ، يمكن أن يكتب خطأ مطبعي قيمة خاطئة عن طريق الخطأ.
أيهما أكثر تأثراً بالقيم المتطرفة؟
متوسط ، الوسيط والوضع هي مقاييس الاتجاه المركزي. الوسط هو المقياس الوحيد للنزعة المركزية التي تتأثر دائمًا بالمنشأة. المتوسط ، المتوسط ، هو المقياس الأكثر شيوعًا للاتجاه المركزي.
هل النطاق الأكثر تأثراً بالقيم المتطرفة؟
لذا إذا كان لدينا مجموعة من {52 ، 54 ، 56 ، 58 ، 60} ، فسنحصل على r=60−52=8 ، وبالتالي فإن النطاق هو 8. بالنظر إلى ما نعرفه الآن ، فمن الصحيح قل أن خارجي سيؤثر على تشغيل g e أكثر.
هل يجب إزالة القيم المتطرفة من البيانات؟
إزالة القيم المتطرفة شرعية فقط لأسباب محددةيمكن أن تكون القيم المتطرفة مفيدة للغاية حول مجال الموضوع وعملية جمع البيانات. … القيم المتطرفة تزيد من التباين في بياناتك ، مما يقلل من القوة الإحصائية. وبالتالي ، يمكن أن يؤدي استبعاد القيم المتطرفة إلى أن تصبح نتائجك ذات دلالة إحصائية.