INHOUDSOPGAWE:

Hoe hanteer jy NA-waardes in R?
Hoe hanteer jy NA-waardes in R?

Video: Hoe hanteer jy NA-waardes in R?

Video: Hoe hanteer jy NA-waardes in R?
Video: R BOOTCAMP GEGEVENSTYPEN IN R PROGRAMMERING (Vector, Lijst, Matrix, Array & Indexing) R Statist... 2024, April
Anonim

Wanneer jy datastel vanaf ander statistiese toepassings invoer die ontbrekende waardes kan met 'n nommer gekodeer word, byvoorbeeld 99. Om te laat R weet dit is a ontbrekende waarde jy moet dit herkodeer. Nog 'n nuttige funksie in R aan ontbrekende waardes hanteer is na . weglaat() wat onvolledige waarnemings uitvee.

Net so, hoe hanteer jy NA in R?

NA opsies in R

  1. weglaat en na. sluit uit: gee die voorwerp terug met waarnemings verwyder as hulle enige ontbrekende waardes bevat; verskille tussen weglating en uitsluiting van NA's kan in sommige voorspellings- en residuele funksies gesien word.
  2. slaag: gee die voorwerp onveranderd terug.
  3. misluk: gee die voorwerp slegs terug as dit geen ontbrekende waardes bevat nie.

Net so, hoe hanteer jy ontbrekende kategoriese data in R? Daar is verskeie maniere om ontbrekende waardes van kategoriese maniere te hanteer.

  1. Ignoreer waarnemings van ontbrekende waardes as ons te doen het met groot datastelle en minder aantal rekords het ontbrekende waardes.
  2. Ignoreer veranderlike, as dit nie betekenisvol is nie.
  3. Ontwikkel model om ontbrekende waardes te voorspel.
  4. Hanteer ontbrekende data as net nog 'n kategorie.

Net so kan 'n mens vra, hoe stel jy ontbrekende waardes in R?

In R , ontbrekende waardes word deur die simbool voorgestel NA (nie beskikbaar nie). Onmoontlik waardes (bv. deling deur nul) word voorgestel deur die simbool NaN (nie 'n getal nie). Anders as SAS, R gebruik dieselfde simbool vir karakter en numeries data . Vir meer oefening oor werk met ontbrekende data , probeer hierdie kursus oor skoonmaak data in R.

Wat beteken Na Rm in R?

Wanneer 'n dataraamfunksie gebruik word na . rm in r verwys na die logiese parameter wat die funksie vertel of dit verwyder moet word of nie NA waardes uit die berekening. Dit letterlik beteken NA verwyder. Dit is nie 'n funksie of 'n operasie nie. Dit is bloot 'n parameter wat deur verskeie dataraamfunksies gebruik word.

Aanbeveel: