Πίνακας περιεχομένων:

Πώς αντιμετωπίζετε τις τιμές NA στο R;
Πώς αντιμετωπίζετε τις τιμές NA στο R;

Βίντεο: Πώς αντιμετωπίζετε τις τιμές NA στο R;

Βίντεο: Πώς αντιμετωπίζετε τις τιμές NA στο R;
Βίντεο: Jitano x Trannos x Thug Slime - Lamogia (Official Music Video) 2024, Ενδέχεται
Anonim

Όταν εισάγετε δεδομένα από άλλες στατιστικές εφαρμογές, το αξίες που λείπουν μπορεί να κωδικοποιηθεί με έναν αριθμό, για παράδειγμα 99. Για να αφήσετε R να ξέρεις ότι είναι α λείπει τιμή πρέπει να το ξανακωδικοποιήσεις. Μια άλλη χρήσιμη λειτουργία στο R προς το ασχοληθείτε με αξίες που λείπουν είναι na . omit() που διαγράφει ημιτελείς παρατηρήσεις.

Λοιπόν, πώς αντιμετωπίζετε το NA στο R;

Επιλογές NA στο R

  1. παραλείπω και να. exclude: επιστρέφει το αντικείμενο με τις παρατηρήσεις που έχουν αφαιρεθεί εάν περιέχουν τιμές που λείπουν. Οι διαφορές μεταξύ της παράλειψης και της εξαίρεσης των NA μπορούν να φανούν σε ορισμένες συναρτήσεις πρόβλεψης και υπολειπόμενες συναρτήσεις.
  2. pass: επιστρέφει το αντικείμενο αμετάβλητο.
  3. fail: επιστρέφει το αντικείμενο μόνο εάν δεν περιέχει τιμές που λείπουν.

Ομοίως, πώς χειρίζεστε τα χαμένα κατηγορικά δεδομένα στο R; Υπάρχουν διάφοροι τρόποι χειρισμού των χαμένων τιμών των κατηγορικών τρόπων.

  1. Αγνοήστε τις παρατηρήσεις των τιμών που λείπουν, εάν έχουμε να κάνουμε με μεγάλα σύνολα δεδομένων και λιγότερος αριθμός εγγραφών έχει τιμές που λείπουν.
  2. Αγνοήστε τη μεταβλητή, εάν δεν είναι σημαντική.
  3. Αναπτύξτε μοντέλο για την πρόβλεψη τιμών που λείπουν.
  4. Αντιμετωπίστε τα δεδομένα που λείπουν ως απλώς μια άλλη κατηγορία.

Παρομοίως, κάποιος μπορεί να ρωτήσει, πώς ορίζετε τις τιμές που λείπουν στο R;

Σε R , αξίες που λείπουν αντιπροσωπεύονται από το σύμβολο ΝΑ (μη διαθέσιμος). Αδύνατο αξίες (π.χ. διαίρεση με το μηδέν) αντιπροσωπεύονται με το σύμβολο NaN (όχι αριθμός). Σε αντίθεση με τη SAS, R χρησιμοποιεί το ίδιο σύμβολο για χαρακτήρα και αριθμητικό δεδομένα . Για περισσότερη εξάσκηση στην εργασία με δεδομένα που λείπουν , δοκιμάστε αυτό το μάθημα καθαρισμού δεδομένα στο R.

Τι σημαίνει το Na Rm στο R;

Όταν χρησιμοποιείτε μια συνάρτηση πλαισίου δεδομένων na . rm σε r αναφέρεται στη λογική παράμετρο που λέει στη συνάρτηση εάν πρέπει να αφαιρεθεί ή όχι ΝΑ τιμές από τον υπολογισμό. Είναι κυριολεκτικά σημαίνει ΝΑ αφαιρώ. Δεν είναι ούτε λειτουργία ούτε λειτουργία. Είναι απλώς μια παράμετρος που χρησιμοποιείται από πολλές συναρτήσεις πλαισίου δεδομένων.

Συνιστάται: