Πώς μπορώ να αφαιρέσω τις τιμές που λείπουν στο R;
Πώς μπορώ να αφαιρέσω τις τιμές που λείπουν στο R;

Βίντεο: Πώς μπορώ να αφαιρέσω τις τιμές που λείπουν στο R;

Βίντεο: Πώς μπορώ να αφαιρέσω τις τιμές που λείπουν στο R;
Βίντεο: R BOOTCAMP DATA TYPES IN R PROGRAMMING (Factors, Strings, Data Frames, Dates) R Statistics Part 2/9 2024, Ενδέχεται
Anonim

Πρώτον, αν θέλουμε να αποκλείσουμε αξίες που λείπουν από μαθηματικές πράξεις χρησιμοποιήστε το na . rm = TRUE όρισμα. Αν δεν τα αποκλείσετε αυτά αξίες οι περισσότερες συναρτήσεις θα επιστρέψουν ένα ΝΑ . Μπορεί επίσης να επιθυμούμε να υποκαθιστούμε το δικό μας δεδομένα για να λάβετε πλήρεις παρατηρήσεις, αυτές οι παρατηρήσεις (σειρές) στο δικό μας δεδομένα που περιέχουν αρ δεδομένα που λείπουν.

Απλώς, πώς το R χειρίζεται τις τιμές που λείπουν;

Σε R ο αξίες που λείπουν κωδικοποιούνται από το σύμβολο ΝΑ . Για τον εντοπισμό ελλείψεων στο σύνολο δεδομένων σας, η συνάρτηση είναι. na (). Όταν εισάγετε δεδομένα από άλλες στατιστικές εφαρμογές, το αξίες που λείπουν μπορεί να κωδικοποιηθεί με έναν αριθμό, για παράδειγμα 99. Για να αφήσετε R να ξέρεις ότι είναι α λείπει τιμή πρέπει να το ξανακωδικοποιήσεις.

Επιπλέον, πώς καταλογίζετε τιμές που λείπουν στο R; Αντιμετώπιση δεδομένων που λείπουν χρησιμοποιώντας το R

  1. colsum(is.na(πλαίσιο δεδομένων))
  2. sum(is.na(πλαίσιο δεδομένων$όνομα στήλης)
  3. Οι τιμές που λείπουν μπορούν να αντιμετωπιστούν χρησιμοποιώντας τις ακόλουθες μεθόδους:
  4. Μέσος/Τρόπος/Μέσος Καταλογισμός: Ο καταλογισμός είναι μια μέθοδος για τη συμπλήρωση των τιμών που λείπουν με τις εκτιμώμενες.
  5. Μοντέλο πρόβλεψης: Το μοντέλο πρόβλεψης είναι μια από τις εξελιγμένες μεθόδους χειρισμού δεδομένων που λείπουν.

Στη συνέχεια, κάποιος μπορεί επίσης να ρωτήσει, πώς μπορώ να αφαιρέσω σειρές που περιέχουν τιμές NA στο R;

Η συνάρτηση omit() επιστρέφει μια λίστα χωρίς καμία σειρές ότι περιέχουν τιμές na . Περνώντας το πλαίσιο δεδομένων σας μέσω του na . Η συνάρτηση omit() είναι ένας απλός τρόπος για να καθαρίσετε τις ημιτελείς εγγραφές από την ανάλυσή σας. Είναι ένα αποτελεσματικό τρόπος για να αφαιρέσετε τις τιμές na στο r.

Πώς μπορώ να αφαιρέσω ακραίες τιμές από ένα σύνολο δεδομένων στο R;

Δεν υπάρχουν συγκεκριμένα R λειτουργίες για να αφαιρέστε τα ακραία σημεία . Θα πρέπει πρώτα να μάθετε ποιες είναι οι παρατηρήσεις ακραίες τιμές και μετά αφαιρώ τους, δηλαδή βρίσκοντας το πρώτο και το τρίτο τεταρτημόριο (οι μεντεσέδες) και το διατεταρτημόριο για να ορίσουμε αριθμητικά τους εσωτερικούς φράχτες.

Συνιστάται: