Taula de continguts:

Què són els valors atípics en l'anàlisi de dades?
Què són els valors atípics en l'anàlisi de dades?

Vídeo: Què són els valors atípics en l'anàlisi de dades?

Vídeo: Què són els valors atípics en l'anàlisi de dades?
Vídeo: La Sotana 155, amb Ricard Torquemada 2024, Maig
Anonim

En estadística, an anormal és un dades punt que difereix significativament d'altres observacions. An anormal pot ser degut a la variabilitat en la mesura o pot indicar un error experimental; aquests últims de vegades estan exclosos de la dades conjunt. An anormal pot causar problemes greus anàlisis estadístiques.

Tenint en compte això, com es troben els valors atípics a les dades?

Un punt que queda fora de dades les tanques internes del conjunt es classifica com a menor anormal , mentre que un que cau fora de les tanques exteriors es classifica com a major anormal . Per trobar les tanques interiors per al vostre dades establiu, primer, multipliqueu el rang interquartil per 1,5. A continuació, sumeu el resultat a Q3 i resteu-lo de Q1.

A més a més, he d'eliminar els valors atípics de les meves dades? Per el la major part, si les teves dades es veu afectada per aquests casos extrems, tu llauna lligat el aportació a un representant històric de les teves dades que exclou atípics . Determinar cas per cas què el efecte de els atípics era. I a partir d'aquí, decidiu si voleu eliminar , canviar o mantenir l'extrem valors.

En aquest sentit, com tracta l'anàlisi de dades amb els valors atípics?

Aquí hi ha quatre enfocaments:

  1. Elimina els registres atípics. En el cas de Bill Gates, o d'un altre valor atípic, de vegades el millor és eliminar completament aquest registre del vostre conjunt de dades per evitar que aquesta persona o esdeveniment distorsioni la vostra anàlisi.
  2. Limiteu les vostres dades atípiques.
  3. Assigna un valor nou.
  4. Prova una transformació.

Quin és un exemple de valor atípic?

Outlier . més Un valor que "es troba fora" (és molt més petit o més gran que) la majoria dels altres valors d'un conjunt de dades. Per exemple a les puntuacions 25, 29, 3, 32, 85, 33, 27, 28, tant 3 com 85 són " atípics ".

Recomanat: