Ondanks alle voorzorgsmaatregelen en een goed bedoelde instelling blijft proeven een subjectieve bezigheid.
Het scoren en zo "objectief" (zie later) mogelijk beoordelen van een whisky is wel degelijk gebonden aan persoonlijke smaak. Hoewel ik zelf ook de ene whisky, maar ook whisky-soort, lekkerder vind dan de ander, ben ik er nog geen tegengekomen die ik vies vind en probeer ik altijd een objectieve score te geven, ook al is een whisky "niet mijn ding" ( Nut en interpretatie van Whisky scores ).
De Kentucky Bourbon Vintage Small Batch van Kentucky Bourbon Distillers, Ltd. uit HWF VBT-1 #2 toont aan dat niet elke whisky-liefhebber aan elk (whisky)panel deel kan nemen. Althans indien het gaat om een proefpanel ter "objectieve" beoordeling van de kwaliteit van een whisky.
In contests en zaken als Whisky lintjes, medailles, awards en bijbels, wil je zo min mogelijk risico nemen. Dat doe je door een team van proevers aan te stellen ter beoordeling van de kwaliteit. Ook dan kunnen proevers zich vergissen maar de kans dat ze zich allemaal vergissen, en op dezelfde manier, is aanmerkelijk kleiner.
Meerdere beoordelingen door een panel van één whisky zullen dan ook meer op elkaar lijken dan bij individuele proevers. Maar, er is een groot voorbehoud. En dat is dat alle panelleden hetgeen te beoordelen indien dat van goede kwaliteit is, lekker vinden en ook als zodanig waarderen.
Whisky wordt vaak dus té veel in algemene termen benaderd. Voor een dergelijke situatie als deze dienen we wel degelijk een onderscheid te maken tussen Bourbons en Malts. En wellicht evenzo tussen Blends en Malts en wellicht zelfs Islay. Als de laatstgenoemde onderdeel uit maken van een tasting van b.v. alleen malts, dan nog kun je je niet permitteren dat in het proefpanel personen zitten die zwaar geturfd vies vinden.
De kwaliteit van een proefpanel is direct gerelateerd aan de mate waarin panelleden een gelijkluidend oordeel vellen. Hierbij kan de homogeniteit worden uitgedrukt als de standaarddeviatie.
Als voorbeeld nemen we de scores van HWF VBT-1 #2 met en zonder de grootste negatieve uitschieters (afgerond naar de bovenmarges).
Algemeen panel: A: 56, 56; 75, 80, 80, 7 x 85. Gemiddelde score = 942/12 = 78,5
Alleen liefhebbers: B: 75, 80, 80, 7 x 85. Gemiddelde score = 830/10 = 83
Eigenlijk hadden de twee 56-scorers veel lager willen scoren.
Als we die niet mee rekenen komen we zelfs op 830/12=69,2.
Niet alleen is de gemiddelde score van de liefhebbers aanzienlijk hoger ook is de marge aanmerkelijk smaller met een variatiebreedte van 10 bij B tegenover 29 (of meer) bij A.
Omdat de variatiebreedte alleen betrekking heeft op de twee uiterste waarden wordt de standaarddeviatie meestal als spreidingsmaat gebruikt.
Mocht je e.e.a. verder uit willen werken dan staat hier de volledige formule: Wiswijzer standaarddeviatie.

Voor mij staat vast dat als het gaat om een kwaliteitsoordeel, een proefpanel moet zijn samengesteld uit personen die de te proeven waar kunnen waarderen wanneer die werkelijk van goede kwaliteit is. Want ook het begrip "van goede kwaliteit" staat anders voortdurend ter discussie. En het gaat bij een warentest per slot om het keuren van de waar en minder om het keuren van de keurmeesters.
Overigens is de standaarddeviatie ook te bepalen voor onderdelen van een beoordeling, bijvoorbeeld als een score van 100 is opgebouwd uit 4 delen van 25. Dan zou kunnen dat juist op één specifiek onderdeel er grote overeenkomsten of juist afwijkingen zijn tussen de proevers.
PS: Opletten welk magazine dit als eerste zal publiceren! Hoewel deze opmerking daar wel weer invloed op kan hebben.




