De wilcoxontoets voor twee steekproeven is een verdelingsvrije (statistische) toets om na te gaan of twee verdelingen ten opzichte van elkaar verschoven zijn. De toets is genoemd naar de Amerikaanse scheikundige Frank Wilcoxon en equivalent aan de mann-whitneytoets.
Voorbeeld
Een landmeter heeft een nieuwe theodoliet gekregen omdat de oude aan vervanging toe is. Het instrument is van hetzelfde merk en van dezelfde uitvoering als het oude. Om na te gaan of de nul-instellingen van de instrumenten gelijk zijn, meet hij met beide instrumenten een aantal keren dezelfde hoogte. Hij doet 10 metingen X met het oude instrument en 12 metingen Y met het nieuwe.
We kunnen ervan uitgaan dat de verdelingen van X en van Y op een verschuiving na aan elkaar gelijk zijn.
De nulhypothese is dat de nul-instellingen dezelfde zijn, dus dat de verdelingen exact aan elkaar gelijk zijn, zonder verschuiving. Als alternatieve hypothese nemen we voor de eenvoud een eenzijdige, namelijk dat het nieuwe instrument systematisch te hoog meet.
Met het oude instrument meet hij achtereenvolgens:
Instrument X: 3,0163 3,0147 3,0175 3,0150 3,0123 3,0169 3,0143 3,0122 3,0154 3,0164
Met het nieuwe instrument meet hij:
Instrument Y: 3,0148 3,0146 3,0162 3,0155 3,0153 3,0190 3,0187 3,0167 3,0152 3,0178 3,0177 3,0158
De uitkomsten rangschikken we naar grootte:
Rangnummer: 1 2 3 4 5 6 7 8 9 10 11 12 Instrument: X X X Y X Y X Y Y X Y Y Meetwaarde: 3,0122 3,0123 3,0143 3,0146 3,0147 3,0148 3,0150 3,0152 3,0153 3,0154 3,0155 3,0158
Vervolg tabel:
13 14 15 16 17 18 19 20 21 22 Y X X Y X X Y Y Y Y 3,0162 3,0163 3,0164 3,0167 3,0169 3,0175 3,0177 3,0178 3,0187 3,0190
Vervolgens zetten we de instrumentaanduidingen uit de tabel op een rij:
- X X X Y X Y X Y Y X Y Y Y X X Y X X Y Y Y Y
Onder de nulhypothese is voor elke plaats in de rij de kans op een X dezelfde, maar onder de alternatieve hypothese zullen aan het begin van de rij met grotere kans X'en te vinden zijn en aan het eind van de rij Y'en. In het extreme geval dat de metingen als volgt waren:
- X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y
is het duidelijk: het nieuwe instrument geeft systematisch hogere waarden dan het oude. Als we vinden:
- Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X
is dit weliswaar een heel bijzondere uitkomst, maar er is geen reden om het nieuwe instrument te wantrouwen.
Wat moeten we concluderen uit de gevonden uitkomst? Op het eerste gezicht lijken de X'en meer naar links en de Y'en meer naar rechts te liggen. Dus bewijs tegen de nulhypothese. Maar is dit resultaat significant? Om dat na te gaan berekent de toetsingsgrootheid het totaal van de rangnummers van de X'en in de rij. In ons geval dus:
Het zal duidelijk zijn dat hoe kleiner W is hoe meer reden er is om de nulhypothese te verwerpen. Maar is onze uitkomst te klein? Met kansrekening kan de verdeling van onder de nulhypothese bepaald worden, gebruikmakend van het feit dat, als de nulhypothese waar is, alle mogelijke rangschikkingen van de X'en en Y'en even waarschijnlijk zijn. We hoeven deze berekening niet steeds zelf uit te voeren, daarvoor zijn er tabellen.
Definitie
De twee toevalsvariabelen en zijn onderling onafhankelijk en continu verdeeld met verdelingsfuncties respectievelijk die op een verschuiving na aan elkaar gelijk zijn. Er geldt dus:
- .
Van en zijn aselecte steekproeven en gegeven.
De toetsingsgrootheid van de wilcoxontoets voor het toetsen van de nulhypothese
bestaat uit de som van de rangnummers van een van de steekproeven, zeg , in het totaal van de waarnemingen:
- .
Daarin is dus het rangnummer van in de geordende rij van beide steekproeven. Afhankelijk van de alternatieve hypothese wordt de nulhypothese verworpen voor te kleine, te grote of te kleine en te grote waarden van .
Exacte verdeling
Voor steekproeven met omvang en , kan de exacte verdeling van de toetsingsgrootheid onder de nulhypothese met behulp van combinatoriek gemakkelijk bepaald worden. Voor grotere steekpoeven neemt echter de hoeveelheid rekenwerk flink toe. De verdeling kan ook bepaald worden met de onderstaande recursieve formule. De formule ontstaat door conditionering op de voorwaarde dat de laatste waarde in de volgorde een X ("...X") of een Y ("...Y") is.
Normale benadering
Voor grotere waarden van en kan een normale benadering toegepast worden. De verwachtingswaarde en de variantie van onder de nulhypothese worden gegeven door:
Mann-whitneytoets
De mann-whitneytoets berekent om de volgorde van de X'en en Y'en te vergelijken een andere grootheid , die echter omgerekend kan worden in de wilcoxontoetsingsgrootheid.