Zuiverheid (statistiek)

Zuiverheid is in de statistiek een eigenschap die van toepassing kan zijn op schatters en op toetsen.

Zuivere schatter

[bewerken | brontekst bewerken]

Een schatter berekent uit een steekproef een waarde die een indruk geeft van een onbekende eigenschap (parameter) van de populatie. Een schatter is praktisch nooit gelijk aan de werkelijke onbekende eigenschap, maar zit er iets naast. Als de schatter echter gemiddeld (over alle mogelijke steekproeven) genomen precies de juiste waarde geeft, noemt men de schatter zuiver. Formeel:

Laat een toevalsvariabele zijn waarvan de verdelingsfunctie afhankelijk is van een onbekende parameter . Een schatter heet zuiver voor als voor alle geldt:

Als een schatter niet zuiver is, spreekt men van een onzuivere schatter. Een schatter is onzuiver als er een parameterwaarde bestaat die verschilt van de verwachtingswaarde van de schatter bij die waarde. Voor deze parameterwaarde geeft de schatter dus gemiddeld gesproken een verschil met de waarde van de te schatten parameter. Men noemt deze afwijking de onzuiverheid, of met de Engelse term bias, van de schatter. In formule:

In een binomiaal experiment met onbekende succeskans p is X het aantal successen van de n keer. De gebruikelijke schatter is zuiver, want:

Voor kleine waarden van de steekproefomvang n zal deze schatter nog al eens als schatting van p de waarde 0 of 1 geven. Men gebruikt om dat te vermijden wel de schatter (X+1)/(n+2), die als minimale schatting de waarde 1/(n+2) en als maximale waarde (n+1)/(n+2) geeft. Deze schatter is niet zuiver en de onzuiverheid is:

Omdat bij toenemende n de onzuiverheid voor alle p naar 0 gaat, zegt men dat deze schatter asymptotisch zuiver is.

Zuivere toets

[bewerken | brontekst bewerken]

Met een statistische toets hoopt men de gestelde nulhypothese te verwerpen ten gunste van de alternatieve hypothese. Als het resultaat van de toets is dat de nulhypothese verworpen wordt, hoeft dit nog geen juiste beslissing te zijn: de toets kan ernaast zitten en een fout van de eerste soort maken, dus de nulhypothese ten onrechte verwerpen. Van een goede toets mag verwacht worden dat er eerder een onjuiste nulhypothese verworpen zal worden dan een juiste. Een toets met deze eigenschap heet zuiver. Formeel:

Laat een toevalsvariabele zijn waarvan de verdelingsfunctie afhankelijk is van een onbekende parameter θ ∈ Θ. Een toets voor de nulhypothese θ ∈ Θ0 tegen de alternatieve hypothese θ ∈ Θ1 heet zuiver als voor alle θ0 ∈ Θ0 en θ1 ∈ Θ geldt:


Deze eigenschap kan ook geformuleerd worden in termen van de onbetrouwbaarheid α van de toets. Daarvoor geldt:

De toets is zuiver als tevens geldt:

  • M. G. Kendall. "The advanced theory of statistics (vol. I). Distribution theory (2nd edition)". Charles Griffin & Company Limited, 1945.
  • M. G. Kendall and A. Stuart. "The advanced theory of statistics (vol. II). Inference and relationship (2nd edition)". Charles Griffin & Company Limited, 1967.
  • A. Papoulis. Probability, random variables, and stochastic processes (3rd edition). McGrow-Hill Inc., 1991.