INHOUDSOPGAWE:

Wat is uitskieters in data-analise?
Wat is uitskieters in data-analise?

Video: Wat is uitskieters in data-analise?

Video: Wat is uitskieters in data-analise?
Video: What is Outlier? 2024, November
Anonim

In statistiek, 'n uitskieter is 'n data punt wat aansienlik verskil van ander waarnemings. An uitskieter kan wees as gevolg van veranderlikheid in die meting of dit kan eksperimentele fout aandui; laasgenoemde word soms uitgesluit van die data stel. An uitskieter kan ernstige probleme veroorsaak in statistiese ontledings.

As u dit in ag neem, hoe vind u uitskieters in data?

N punt wat buite die val data stel se innerfensies word as minderjarig geklassifiseer uitskieter , terwyl een wat buite die buitenste heinings val as 'n majeur geklassifiseer word uitskieter . Om die binneste heinings vir jou te vind data stel, vermenigvuldig eerstens die interkwartielreeks met 1,5. Voeg dan die resultaat by Q3 en trek dit af van Q1.

Behalwe hierbo, moet ek uitskieters uit my data verwyder? Vir die meeste, as jou data word deur hierdie uiterste gevalle geraak, jy kan gebind die insette aan 'n historiese verteenwoordiger van jou data wat uitsluit uitskieters . Bepaal op 'n geval-tot-geval basis wat die effek van die uitskieters was. En van daar af, besluit of jy wil verwyder , verander, of hou die uitskieter waardes.

Met betrekking tot hierdie, hoe hanteer data-analise uitskieters?

Hier is vier benaderings:

  1. Los die uitskieterrekords. In die geval van Bill Gates, of 'n ander ware uitskieter, is dit soms die beste om daardie rekord heeltemal uit jou datastel te verwyder om te verhoed dat daardie persoon of gebeurtenis jou analise skeeftrek.
  2. Beperk jou uitskietersdata.
  3. Ken 'n nuwe waarde toe.
  4. Probeer 'n transformasie.

Wat is 'n voorbeeld van 'n uitskieter?

Uitskieter . meer 'n Waarde wat "buite lê" (baie kleiner of groter as) meeste van die ander waardes in 'n stel data. Vir voorbeeld in die tellings 25, 29, 3, 32, 85, 33, 27, 28 is beide3 en 85 " uitskieters ".

Aanbeveel: