Cuprins:

Ce sunt valorile aberante în analiza datelor?
Ce sunt valorile aberante în analiza datelor?

Video: Ce sunt valorile aberante în analiza datelor?

Video: Ce sunt valorile aberante în analiza datelor?
Video: STATISTICA NOASTRĂ CEA DE TOATE ZILELE 2024, Noiembrie
Anonim

În statistică, an anormal este o date punct care diferă semnificativ de alte observații. Un anormal se poate datora variabilității măsurătorii sau poate indica o eroare experimentală; acestea din urmă sunt uneori excluse din date a stabilit. Un anormal poate cauza probleme serioase în analize statistice.

Având în vedere acest lucru, cum găsiți valori aberante în date?

Un punct care se încadrează în afara date innerfences-ul setului este clasificat drept minor anormal , în timp ce unul care se încadrează în afara gardurilor exterioare este clasificat ca fiind major anormal . Pentru a găsi gardurile interioare pentru dvs date setați, mai întâi, înmulțiți intervalul intercuartil cu 1,5. Apoi, adăugați rezultatul la Q3 și scădeți-l din Q1.

Alături de mai sus, ar trebui să elimin valorile aberante din datele mele? Pentru cel cea mai mare parte, dacă datele tale este afectat de aceste cazuri extreme, tu poate sa legat cel intrare la un reprezentant istoric al datele tale care exclude valori aberante . Stabiliți de la caz la caz ce cel efectul valorile aberante a fost. Și de acolo, decideți dacă doriți elimina , schimbați sau păstrați anormal valorile.

În acest sens, cum tratează analiza datelor valorile aberante?

Iată patru abordări:

  1. Eliminați înregistrările aberante. În cazul lui Bill Gates sau al unui alt lucru aberant, uneori este mai bine să eliminați complet acea înregistrare din setul dvs. de date pentru a împiedica acea persoană sau eveniment să vă modifice analiza.
  2. Limitați datele aberante.
  3. Atribuiți o nouă valoare.
  4. Încercați o transformare.

Care este un exemplu de un outlier?

Outlier . mai mult O valoare care „se află în afara” (este mult mai mică sau mai mare decât) majoritatea celorlalte valori dintr-un set de date. Pentru exemplu în scorurile 25, 29, 3, 32, 85, 33, 27, 28, atât 3, cât și 85 sunt " valori aberante ".

Recomandat: