Taula de continguts:

Com tracteu els valors de NA a R?
Com tracteu els valors de NA a R?

Vídeo: Com tracteu els valors de NA a R?

Vídeo: Com tracteu els valors de NA a R?
Vídeo: SHAKIRA || BZRP Music Sessions #53 2024, De novembre
Anonim

Quan importeu un conjunt de dades d'altres aplicacions estadístiques, el fitxer valors que falten es pot codificar amb un número, per exemple 99. Per tal de deixar R saber que és a valor que falta l'has de recodificar. Una altra funció útil en R a tractar els valors que falten és na . omit() que elimina les observacions incompletes.

Així, com tracteu NA a R?

Opcions de NA a R

  1. ometre i na. excloure: retorna l'objecte amb les observacions eliminades si contenen valors que falten; Les diferències entre ometre i excloure NA es poden veure en algunes funcions de predicció i residuals.
  2. pass: retorna l'objecte sense canvis.
  3. error: retorna l'objecte només si no conté valors que falten.

De la mateixa manera, com gestioneu les dades categòriques que falten a R? Hi ha diverses maneres de gestionar els valors que falten de les maneres categòriques.

  1. Ignoreu les observacions de valors que falten si estem tractant amb conjunts de dades grans i un nombre menor de registres té valors que falten.
  2. Ignoreu la variable, si no és significativa.
  3. Desenvolupar un model per predir els valors que falten.
  4. Tracteu les dades que falten com una categoria més.

De la mateixa manera, es pot preguntar, com es defineixen els valors que falten a R?

En R , valors que falten es representen amb el símbol NA (no disponible). Impossible valors (per exemple, dividint per zero) es representen amb el símbol NaN (no un nombre). A diferència de SAS, R utilitza el mateix símbol per a caràcters i numèrics dades . Per a més pràctica sobre el treball amb dades que falten , prova aquest curs sobre neteja dades en R.

Què significa Na Rm en R?

Quan s'utilitza una funció de marc de dades na . rm en r fa referència al paràmetre lògic que indica a la funció si s'ha d'eliminar o no NA valors del càlcul. És literalment significa NA eliminar. No és una funció ni una operació. És simplement un paràmetre utilitzat per diverses funcions de marc de dades.

Recomanat: