Scheefheid

Voorbeeld van rechtsscheef verdeelde data

In de statistiek is scheefheid (Engels: skewness) een maat voor asymmetrie van een kansverdeling.

De scheefheid is het derde gestandaardiseerde moment, mits dit bestaat, van de kansverdeling:

Hierin is het derde centrale moment en de standaardafwijking. De scheefheid kan dus ook geschreven worden als

met een stochastische variabele verdeeld volgens de gegeven kansverdeling en de verwachtingswaarde daarvan.

Een symmetrische verdeling heeft een scheefheid . Voorbeelden van symmetrische verdelingen zijn de normale verdeling, de uniforme verdeling (discreet en continu) en de binomiale verdeling met succeskans .

Een verdeling heet rechtsscheef, als deze aan de rechterkant een langere en zwaardere staart heeft dan aan de linkerkant. Bij deze verdeling is de mediaan kleiner dan de verwachtingswaarde. Deze benaming is enigszins verwarrend, omdat dit automatisch inhoudt dat de meeste massa zich juist links van de verwachtingswaarde bevindt (zie grafiek). Voor zo'n verdeling geldt dat . Een voorbeeld van een rechtsscheve verdeling is de Gamma-verdeling. Voor de -verdeling geldt dat .

Als de zwaardere staart zich aan de linkerkant bevindt, heet de verdeling linksscheef. Voor zo'n verdeling geldt dat . Een voorbeeld van een linksscheve verdeling is de Beta(1,0)-verdeling met de kansdichtheid , en scheefheid .

De scheefheid van een verdeling kan aan de hand van de uitkomst van een aselecte steekproef geschat worden door de momentschatter:

,

waarin het steekproefgemiddelde is. Omdat deze schatter geen zuivere schatter is, dat wil zeggen , wordt in praktijk meestal de volgende, wel zuivere, schatter gebruikt

Andere maten van asymmetrie

[bewerken | brontekst bewerken]

Karl Pearson suggereerde twee asymmetrie-maten die eenvoudiger te berekenen zijn:

Deze maten zijn echter minder gebruikelijk geraakt sinds de opkomst van de computer, die het berekenen van de gewone scheefheidsmaat vergemakkelijkte.