Schaakopening - Percentages
Door verschillende organisaties en personen in de schaakwereld worden grote databases opgebouwd en onderhouden met zeer veel gespeelde schaakpartijen. Deze worden als commercieel product op CD-ROM uitgebracht, of via Internet verspreid.
Uit de partijdatabases kunnen bepaalde statistische gegevens worden afgeleid:
- hoe vaak de verschillende zetten in een bepaalde stelling worden gespeeld
- wat het resultaat is van elke zet (hoevaak wint wit, is het remise en wint zwart)
- hoe de bovengenoemde gegevens samenhangen met de sterkte (Elo-rating) van de spelers
- welke varianten een bepaalde speler pleegt te spelen
Deze gegevens kunnen over de gehele verzameling worden bepaald, maar ook kan worden bepaald hoe zij zich in de loop der tijd hebben ontwikkeld.
De databases kunnen zowel kwantitatief als kwalitatief grote onderlinge verschillen vertonen. Dit houdt verband met het collectiebeleid:
- Worden alleen partijen vanaf een bepaald niveau meegenomen, of ook potjes van amateurs uit de onderbond.
- Worden alleen gewone schaakpartijen met reguliere denktijd achter het bord meegenomen, of ook snelschaak, rapidschaak, correspondentieschaak en online schaken via Internet.
- Worden alleen partijen van mensen meegenomen, of ook van computers.
- Worden alleen partijen uit bepaalde regio's meegenomen, of uit alle werelddelen.
- Worden historische partijverzamelingen meegenomen, of alleen hedendaagse.
- In hoeverre wordt de database opgeschoond (doublures, notatiefouten e.d.).
- Hoeveel moeite wordt ondernomen om partijen uit alle delen van de wereld op te vragen en toe te voegen.
- Hoeveel moeite wordt ondernomen om partijen aan de juiste spelers toe te schrijven, gelet op de verschillende schrijfwijzen van de namen.
- Hoeveel moeite wordt ondernomen om onvolledige gegevens in historische collecties na te speuren en aan te vullen (bijvoorbeeld: het jaartal, de uitslag, de namen en ratings van beide spelers).
Het onderling uitwisselen en aanvullen van de databases wordt gehinderd door commerciële belangen, andere uitgangspunten met betrekking tot het collectiebeleid en het databankenrecht.
De vulling van de databases wordt in de praktijk beperkt door de beschikbaarheid van gespeelde partijen, en de mate waarin partijnotaties gedigitaliseerd zijn. Bij de gesloten internationale toernooien op topniveau is het tegenwoordig vanzelfsprekend dat de gespeelde partijen in digitale vorm via Internet verspreid worden. Maar bij open toernooien met een regionaal karakter en bij amateurtoernooien worden de partijnotaties veelal niet systematisch verzameld, gedigitaliseerd en verspreid.
Men dient er bij het interpreteren van de statistieken rekening mee te houden dat de cijfers in feite meer zeggen over de specifieke database waaraan ze ontleend zijn, dan over de mogelijke zetten. Dit geldt ook voor de openingstatistieken in de Wikipedia, die gebaseerd zijn op de partijdatabase Simbase.
[bewerk] Statistieken op basis van Simbase
Bijgaande tabel is de neerslag van een groot aantal schaakpartijen in de databank Simbase die onderverdeeld is in bijna dertig openingen. Van iedere opening is het percentage berekend, hetgeen enigszins aangeeft in welke mate die opening populair is. Er zijn drie peildata: augustus 2003 met 4.558.487 partijen, maart 2004 met 5.066.327 partijen en november 2005 met 7.316.773 partijen. De vierde peildatum zal volgen na het overschrijden van de 8.000.000 partijen.
# | Naam | aug 2003 | mrt 2004 | nov 2005 | ||||||
---|---|---|---|---|---|---|---|---|---|---|
1 | Siciliaans | 888.035 | 19,48% | 992.095 | 19,58% | 1.542.740 | 21,08% | |||
2 | Frans | 315.775 | 6,92% | 344.883 | 6,80% | 461.892 | 6,31% | |||
3 | Engels | 274.724 | 6,12% | 299.615 | 5,91% | 412.833 | 5,64% | |||
4 | Konings-Indisch | 250.340 | 5,49% | 275.951 | 5,44% | 360.049 | 4,92% | |||
5 | Spaans | 226.131 | 4,96% | 248.446 | 4,90% | 369.878 | 5,05% | |||
6 | Slavisch | 170.174 | 3,73% | 192.631 | 3,80% | 298.720 | 4,08% | |||
7 | Caro Kann | 158.551 | 3,47% | 175.065 | 3,45% | 241.018 | 3,29% | |||
8 | geweigerd damegambiet | 143.453 | 3,14% | 160.613 | 3,17% | 228.693 | 3,12% | |||
9 | Réti | 145.439 | 3,19% | 158.681 | 3,13% | 217.815 | 2,97% | |||
10 | Nimzo-Indisch | 121.809 | 2,67% | 138.999 | 2,74% | 221.814 | 3,15% | |||
11 | Italiaans | 114.055 | 2,50% | 125.257 | 2,47% | 178.541 | 2,44% | |||
12 | Pirc | 110.944 | 2,43% | 121.741 | 2,40% | 161.921 | 2,21% | |||
13 | Dame-Indisch | 103.848 | 2,27% | 120.796 | 2,38% | 185.267 | 2,53% | |||
14 | Hollands | 98.125 | 2,12% | 105.861 | 2,08% | 139.279 | 1,90% | |||
15 | Grünfeld-Indisch | 92.389 | 2,02% | 103.525 | 2,04% | 147.250 | 2,01% | |||
16 | Ben-Oni | 77.391 | 1,69% | 83.606 | 1,65% | 105.484 | 1,44% | |||
17 | Koningsfianchetto | 75.491 | 1,63% | 82.156 | 1,62% | 101.104 | 1,38% | |||
18 | Schots | 70.883 | 1,55% | 77.833 | 1,53% | 108.223 | 1,47% | |||
19 | Scandinavisch | 67.313 | 1,47% | 75.801 | 1,49% | 107.618 | 1,47% | |||
20 | Aljechin | 63.397 | 1,39% | 69.492 | 1,37% | 93.182 | 1,27% | |||
21 | aangenomen damegambiet | 52.084 | 1,14% | 59.496 | 1,17% | 103.969 | 1,42% | |||
22 | Russisch | 49.833 | 1,09% | 56.494 | 1,11% | 92.685 | 1,26% | |||
23 | Tarrasch | 51.017 | 1,11% | 55.379 | 1,09% | 73.570 | 1,00% | |||
24 | Oud-Indisch | 45.054 | 0,98% | 48.767 | 0,96% | 60.546 | 0,82% | |||
25 | Philidor | 22.759 | 0,49% | 47.590 | 0,93% | 45.453 | 0,61% | |||
26 | Koningsgambiet | 43.428 | 0,91% | 47.108 | 0,92% | 68.774 | 0,93% | |||
27 | Catalaans | 41.064 | 0,90% | 45.887 | 0,90% | 73.993 | 1,01% | |||
28 | Weens | 36.156 | 0,79% | 39.206 | 0,77% | 53.811 | 0,70% | |||
Overige | 648.825 | 14,23% | 713.353 | 14,08% | 1.060.651 | 14,50% |
De resterende openingen met in maart 2004 een totaal van 760.943 partijen (15%) zijn te vinden bij de open, halfopen, gesloten en halfgesloten spelen, en bij de flankspelen. In november 2005 resteren 629.358 partijen = 8% voor de minder vaak gespeelde openingen.