Gemiddelde

Bij rekenen en in de wiskunde is het gemiddelde of de gemiddelde waarde een begrip dat veelvuldig voorkomt. Het bekendste is het rekenkundig gemiddelde: de som van een aantal getallen gedeeld door het aantal getallen.

In de statistiek wordt het begrip gemiddelde veel gebruikt. We moeten hierbij onderscheiden of het om de gehele populatie gaat of om een steekproef daaruit.

Populatiegemiddelde

[bewerken | brontekst bewerken]

In de statistiek wordt het populatiegemiddelde van een kenmerkende grootheid vaak aangeduid met de Griekse letter . Voor een eindige populatie is het populatiegemiddelde niets anders dan het rekenkundig gemiddelde van alle populatiewaarden.

Bij aselecte trekking van een waarde van die grootheid uit de populatie, is de kansverdeling van de populatieverdeling, met als gevolg dat de verwachtingswaarde van gelijk is aan het populatiegemiddelde.

Heeft een discrete verdeling met kansfunctie , dan is de verwachtingswaarde gedefinieerd door:

Als een continue verdeling heeft met kansdichtheid , dan is de verwachtingswaarde gedefinieerd door:

Het is echter vaak onmogelijk om het populatiegemiddelde te bepalen. Is men bijvoorbeeld geïnteresseerd in het gemiddelde gewicht van de Sumatraanse neushoorn, dan kan men dat gewoon bepalen, omdat er nog maar zo'n 250 van zijn. Bij muskieten ligt dat echter heel anders. Er zijn er gewoon te veel om ze allemaal te kunnen onderzoeken. In zo'n geval nemen statistici hun toevlucht tot een steekproef om door de berekening van het steekproefgemiddelde een schatting te krijgen van het populatiegemiddelde.

Steekproefgemiddelde

[bewerken | brontekst bewerken]

Het steekproefgemiddelde is het rekenkundige gemiddelde van de steekproef. Als de steekproefuitkomst bestaat uit de elementen , dan is het steekproefgemiddelde het getal:

In de theorie is men niet zozeer geïnteresseerd in de uitkomsten, maar in het stochastisch gedrag van de steekproef. De steekproef bestaat uit de stochastische variabelen en het steekproefgemiddelde is de variabele:

Het steekproefgemiddelde wordt vaak gebruikt om iets te zeggen over het populatiegemiddelde . Het wordt dan opgevat als een realisatie van het steekproefgemiddelde . Daar zitten echter een paar haken en ogen aan. Als de steekproef aselect was, is het steekproefgemiddelde een goede benadering, of schatting, van het populatiegemiddelde. Dan zijn de steekproefelementen onderling onafhankelijk en gelijkverdeeld, b.v. als , zodat, mits bestaat:

Als bovendien , geldt ook:

Hoe goed deze benadering is, hangt nog van vele factoren af, zoals van de steekproefomvang en de onderliggende verdeling. Wanneer het aantal proeven voldoende is, is daarmee voor de steekproef een wet van de grote aantallen bepaald. Er zijn verdelingen die geen populatiegemiddelde bezitten, omdat de bovenstaande integraal niet bestaat.

Gelukkig kunnen we vaak veronderstellen dat de onderliggende verdeling normaal is. Dan speelt naast de verwachtingswaarde alleen de standaardafwijking een rol, waarvan we de waarde ook uit de steekproef kunnen schatten.

Soorten gemiddelde

[bewerken | brontekst bewerken]