Πίνακας περιεχομένων:
Βίντεο: Τι είναι οι ακραίες τιμές στην ανάλυση δεδομένων;
2024 Συγγραφέας: Lynn Donovan | [email protected]. Τελευταία τροποποίηση: 2023-12-15 23:45
Στα στατιστικά, ένα ακραία είναι ένα δεδομένα σημείο που διαφέρει σημαντικά από άλλες παρατηρήσεις. Ενα ακραία μπορεί να οφείλεται σε μεταβλητότητα στη μέτρηση ή μπορεί να υποδεικνύει πειραματικό σφάλμα. οι τελευταίες μερικές φορές αποκλείονται από το δεδομένα σειρά. Ενα ακραία μπορεί να προκαλέσει σοβαρά προβλήματα σε Στατιστικές αναλύσεις.
Λαμβάνοντας υπόψη αυτό, πώς βρίσκετε ακραίες τιμές στα δεδομένα;
Ένα σημείο που πέφτει έξω από το δεδομένα τα εσωτερικά του συνόλου ταξινομούνται ως δευτερεύοντα ακραία , ενώ ένα που πέφτει έξω από τους εξωτερικούς φράχτες χαρακτηρίζεται ως κύριο ακραία . Για να βρείτε τους εσωτερικούς φράχτες για εσάς δεδομένα ρυθμίστε, πρώτα, πολλαπλασιάστε το διατεταρτημόριο με 1,5. Στη συνέχεια, προσθέστε το αποτέλεσμα στο Q3 και αφαιρέστε το από το Q1.
Εκτός από τα παραπάνω, πρέπει να αφαιρέσω τα ακραία στοιχεία από τα δεδομένα μου; Για ο ως επί το πλείστον, αν τα δεδομένα σου επηρεάζεστε από αυτές τις ακραίες περιπτώσεις, εσείς μπορώ όριο ο εισροή σε έναν ιστορικό εκπρόσωπο του τα δεδομένα σου που αποκλείει ακραίες τιμές . Προσδιορίστε κατά περίπτωση τι ο επίδραση του τα ακραία σημεία ήταν. Και από εκεί, αποφασίστε αν θέλετε αφαιρώ , αλλαγή ή διατήρηση πιο ακραία αξίες.
Σε σχέση με αυτό, πώς αντιμετωπίζει η ανάλυση δεδομένων τις ακραίες τιμές;
Ακολουθούν τέσσερις προσεγγίσεις:
- Καταργήστε τις εγγραφές ακραίων τιμών. Στην περίπτωση του Bill Gates ή ενός άλλου αληθινού ακραίου στοιχείου, μερικές φορές είναι καλύτερο να αφαιρέσετε εντελώς αυτήν την εγγραφή από το σύνολο δεδομένων σας για να αποτρέψετε αυτό το άτομο ή το συμβάν να παραμορφώσει την ανάλυσή σας.
- Περιορίστε τα ακραία δεδομένα σας.
- Εκχωρήστε μια νέα τιμή.
- Δοκιμάστε μια μεταμόρφωση.
Τι είναι ένα παράδειγμα ακραίας τιμής;
Εξωφρενικό . περισσότερα Μια τιμή που "βρίσκεται έξω" (είναι πολύ μικρότερη ή μεγαλύτερη από) τις περισσότερες από τις άλλες τιμές σε ένα σύνολο δεδομένων. Για παράδειγμα στις βαθμολογίες 25, 29, 3, 32, 85, 33, 27, 28 και τα δύο 3 και 85 είναι " ακραίες τιμές ".
Συνιστάται:
Τι είναι το λεξικό δεδομένων στην επιχειρηματική ανάλυση;
Τα λεξικά δεδομένων είναι ένα μοντέλο δεδομένων RML που καταγράφει λεπτομέρειες σε επίπεδο πεδίου σχετικά με τα δεδομένα σε ένα σύστημα ή συστήματα. Κατά τη φάση των απαιτήσεων, η εστίαση δεν είναι σε πραγματικά δεδομένα στη βάση δεδομένων ή στον τεχνικό σχεδιασμό που απαιτείται για την υλοποίηση των αντικειμένων επιχειρηματικών δεδομένων στη βάση δεδομένων
Τι είναι η ποιοτική ανάλυση δεδομένων στην έρευνα;
Η ανάλυση ποιοτικών δεδομένων (QDA) είναι το εύρος των διαδικασιών και διαδικασιών με τις οποίες περνάμε από τα ποιοτικά δεδομένα που έχουν συλλεχθεί, σε κάποια μορφή εξήγησης, κατανόησης ή ερμηνείας των ανθρώπων και των καταστάσεων που ερευνούμε. Το QDA βασίζεται συνήθως σε μια ερμηνευτική φιλοσοφία
Συμπεριλαμβάνετε ακραίες τιμές στην περίληψη 5 αριθμών;
Οι πέντε αριθμοί είναι η ελάχιστη, η τιμή του πρώτου τεταρτημορίου (Q1), η διάμεσος, η τιμή του τρίτου τεταρτημορίου (Q3) και η μέγιστη. Το πρώτο πράγμα που μπορεί να παρατηρήσετε σχετικά με αυτό το σύνολο δεδομένων είναι ο αριθμός 27. Αυτός είναι πολύ διαφορετικός από τα υπόλοιπα δεδομένα. Είναι ακραίο και πρέπει να αφαιρεθεί
Συμπεριλαμβάνετε ακραίες τιμές στην τυπική απόκλιση;
Η τυπική απόκλιση δεν είναι ποτέ αρνητική. Η τυπική απόκλιση είναι ευαίσθητη σε ακραίες τιμές. Ένα singleoutlier μπορεί να αυξήσει την τυπική απόκλιση και με τη σειρά του, να παραμορφώσει την εικόνα της εξάπλωσης. Για δεδομένα με περίπου τον ίδιο μέσο όρο, όσο μεγαλύτερη είναι η διαφορά, τόσο μεγαλύτερη είναι η τυπική απόκλιση
Τι προκαλεί ακραίες τιμές στα δεδομένα;
Οι ακραίες τιμές προκαλούνται συχνά από ανθρώπινο λάθος, όπως σφάλματα στη συλλογή, την καταγραφή ή την καταχώριση δεδομένων. Τα δεδομένα από μια συνέντευξη μπορεί να καταγραφούν λανθασμένα, ή να θεωρηθούν εσφαλμένα κατά την εισαγωγή δεδομένων