INHOUDSOPGAWE:
Video: Wat is uitskieters in data-analise?
2024 Outeur: Lynn Donovan | [email protected]. Laas verander: 2023-12-15 23:42
In statistiek, 'n uitskieter is 'n data punt wat aansienlik verskil van ander waarnemings. An uitskieter kan wees as gevolg van veranderlikheid in die meting of dit kan eksperimentele fout aandui; laasgenoemde word soms uitgesluit van die data stel. An uitskieter kan ernstige probleme veroorsaak in statistiese ontledings.
As u dit in ag neem, hoe vind u uitskieters in data?
N punt wat buite die val data stel se innerfensies word as minderjarig geklassifiseer uitskieter , terwyl een wat buite die buitenste heinings val as 'n majeur geklassifiseer word uitskieter . Om die binneste heinings vir jou te vind data stel, vermenigvuldig eerstens die interkwartielreeks met 1,5. Voeg dan die resultaat by Q3 en trek dit af van Q1.
Behalwe hierbo, moet ek uitskieters uit my data verwyder? Vir die meeste, as jou data word deur hierdie uiterste gevalle geraak, jy kan gebind die insette aan 'n historiese verteenwoordiger van jou data wat uitsluit uitskieters . Bepaal op 'n geval-tot-geval basis wat die effek van die uitskieters was. En van daar af, besluit of jy wil verwyder , verander, of hou die uitskieter waardes.
Met betrekking tot hierdie, hoe hanteer data-analise uitskieters?
Hier is vier benaderings:
- Los die uitskieterrekords. In die geval van Bill Gates, of 'n ander ware uitskieter, is dit soms die beste om daardie rekord heeltemal uit jou datastel te verwyder om te verhoed dat daardie persoon of gebeurtenis jou analise skeeftrek.
- Beperk jou uitskietersdata.
- Ken 'n nuwe waarde toe.
- Probeer 'n transformasie.
Wat is 'n voorbeeld van 'n uitskieter?
Uitskieter . meer 'n Waarde wat "buite lê" (baie kleiner of groter as) meeste van die ander waardes in 'n stel data. Vir voorbeeld in die tellings 25, 29, 3, 32, 85, 33, 27, 28 is beide3 en 85 " uitskieters ".
Aanbeveel:
Sluit jy uitskieters in 5-nommer opsomming in?
Die vyf getalle is die minimum, die eerste kwartiel(Q1) waarde, die mediaan, die derde kwartiel(Q3) waarde en die maksimum. Die eerste ding wat jy van hierdie datastel kan oplet, is die nommer 27. Dit verskil baie van die res van die data. Dit is 'n uitskieter en moet verwyder word
Wat is data-ontginning en wat is nie data-ontginning nie?
Data-ontginning word gedoen sonder enige vooropgestelde hipotese, dus die inligting wat uit die data kom, is nie om spesifieke vrae van die organisasie te beantwoord nie. Nie data-ontginning nie: Die doel van data-ontginning is die onttrekking van patrone en kennis uit groot hoeveelhede data, nie die ontginning (ontginning) van data self nie
Sluit jy uitskieters by standaardafwyking in?
Standaardafwyking is nooit negatief nie. Standaardafwyking is sensitief vir uitskieters. 'n Enkeluitskieter kan die standaardafwyking verhoog en op sy beurt die prentjie van verspreiding verdraai. Vir data met ongeveer dieselfde gemiddelde, hoe groter die verspreiding, hoe groter is die standaardafwyking
Wat veroorsaak uitskieters in data?
Uitskieters word dikwels deur menslike foute veroorsaak, soos foute in data-insameling, opname of invoer. Data van 'n onderhoud kan verkeerd opgeneem word, of verkeerd gemerk word by data-invoer
Watter grafiek word gebruik om die eenveranderlike uitskieters te sien?
1. Eenveranderlike metode. Een van die eenvoudigste metodes om uitskieters op te spoor is die gebruik van bokserwe. 'n Kasplot is 'n grafiese vertoning om die verspreidings van die data te beskryf. Box plots gebruik die mediaan en die onderste en boonste kwartiele