Cum te descurci cu valorile NA din R?
Cum te descurci cu valorile NA din R?
Anonim

Când importați setul de date din alte aplicații statistice, valori lipsă poate fi codificat cu un număr, de exemplu 99. Pentru a lăsa R știi că este o valoare lipsă trebuie să-l recodați. O altă funcție utilă în R la se ocupă de valorile lipsă este n / A . omit() care șterge observațiile incomplete.

Doar așa, cum te descurci cu NA în R?

Opțiuni NA în R

  1. omite și na. exclude: returnează obiectul cu observațiile eliminate dacă acestea conțin valori lipsă; diferențele dintre omiterea și excluderea NA pot fi observate în unele funcții de predicție și reziduale.
  2. pass: returnează obiectul neschimbat.
  3. fail: returnează obiectul numai dacă nu conține valori lipsă.

De asemenea, cum gestionați datele categorice lipsă în R? Există diferite moduri de a gestiona valorile lipsă ale căilor categorice.

  1. Ignorați observațiile privind valorile lipsă dacă avem de-a face cu seturi mari de date și un număr mai mic de înregistrări are valori lipsă.
  2. Ignorați variabila, dacă nu este semnificativă.
  3. Dezvoltați model pentru a prezice valorile lipsă.
  4. Tratați datele lipsă doar ca pe o altă categorie.

În mod similar, cineva se poate întreba, cum setați valorile lipsă în R?

În R , valori lipsă sunt reprezentate prin simbol N / A (nu e disponibil). Imposibil valorile (de exemplu, împărțirea la zero) sunt reprezentate prin simbolul NaN (nu un număr). Spre deosebire de SAS, R folosește același simbol pentru caracter și numeric date . Pentru mai multă practică despre lucrul cu date lipsa , încercați acest curs despre curățare datele din R.

Ce înseamnă Na Rm în R?

Când utilizați o funcție de cadru de date n / A . rm în r se referă la parametrul logic care spune funcției dacă să fie eliminată sau nu N / A valorile din calcul. Literal înseamnă NA elimina. Nu este nici o funcție, nici o operație. Este pur și simplu un parametru utilizat de mai multe funcții de cadru de date.

Recomandat: