Hoe verwyder ek ontbrekende waardes in R?
Hoe verwyder ek ontbrekende waardes in R?

Video: Hoe verwyder ek ontbrekende waardes in R?

Video: Hoe verwyder ek ontbrekende waardes in R?
Video: Data Analysis in R by Dustin Tran 2024, November
Anonim

Eerstens, as ons wil uitsluit ontbrekende waardes van wiskundige bewerkings gebruik die na . rm = WARE argument. As jy dit nie uitsluit nie waardes meeste funksies sal 'n terugstuur NA . Ons kan ook begeer om ons subset data volledige waarnemings te verkry, daardie waarnemings (rye) in ons data wat nr ontbrekende data.

Eenvoudig so, hoe hanteer R ontbrekende waardes?

In R die ontbrekende waardes word deur die simbool gekodeer NA . Die funksie is om ontbrekende in jou datastel te identifiseer. na (). Wanneer jy datastel vanaf ander statistiese toepassings invoer die ontbrekende waardes kan met 'n nommer gekodeer word, byvoorbeeld 99. Om te laat R weet dit is a ontbrekende waarde jy moet dit herkodeer.

Verder, hoe reken jy ontbrekende waardes in R toe? Hanteer ontbrekende data deur R

  1. colsum(is.na(dataraam))
  2. som(is.na(dataraam$kolomnaam)
  3. Ontbrekende waardes kan met die volgende metodes behandel word:
  4. Gemiddelde/modus/mediaantoerekening: Toerekening is 'n metode om die ontbrekende waardes met geskatte in te vul.
  5. Voorspellingsmodel: Voorspellingsmodel is een van die gesofistikeerde metodes vir die hantering van ontbrekende data.

Vervolgens kan 'n mens ook vra, hoe verwyder ek rye wat NA-waardes in R bevat?

weglaat() funksie gee 'n lys terug sonder enige rye daardie bevat waardes . Deur jou dataraam deur die na . weglaat() funksie is 'n eenvoudige manier om onvolledige rekords uit jou analise te verwyder. Dit is 'n doeltreffende manier om na-waardes in r te verwyder.

Hoe verwyder ek uitskieters uit 'n datastel in R?

Daar is geen spesifieke R funksies aan verwyder uitskieters . Jy sal eers moet uitvind wat waarnemings is uitskieters en toe verwyder hulle, dit wil sê om die eerste en derde kwartiel (die skarniere) en die interkwartielreeks te vind om die binneste heinings numeries te definieer.

Aanbeveel: