Je lavais initialement publié sur StackOverflow car il pourrait sagir dun bogue dans les implémentations , mais certains mont suggéré de poster sur les maths. Je viens de trouver ce stackexchange, et je me suis dit qui était mieux? Certains dentre vous savent peut-être dès le départ que cela semble exact ou non, sans avoir besoin de débogage. Tous les liens vers des calculatrices en ligne ou des méthodes de notation alternatives sont les bienvenus.
Glicko-2 est un système de notation utilisé aux échecs, mais peut être utilisé dans de nombreuses autres situations. Glicko-2 est une amélioration par rapport à Glicko-1, qui a résolu les problèmes de lancienne classification ELO.
Ce qui rend Glicko-2 spécial par rapport à la version 1, cest quil incorpore un écart de notation plus élevé (RD). plus longtemps quelquun a été inactif. Il le fait avec la notion de constante système qui se rapporte aux périodes de temps / de notation.
Un exemple décriture de lauteur se trouve ici: http://www.glicko.net/glicko/glicko2.pdf .
Dans ce document, il explique:
Le système Glicko-2 fonctionne mieux lorsque le nombre de jeux dans une période de classement est modéré à élevé, disons une moyenne dau moins 10 à 15 parties par joueur au cours dune période de classement. La durée dune période de classement est à la discrétion de ladministrateur.
En supposant quun groupe de joueurs déchecs actifs joue 10 à 15 parties en moyenne sur une période dun mois, ladministrateur mettrait ensuite à jour les notes à la fin de chaque mois.
Javais besoin dune implémentation PHP du système de notation Glicko-2 et je suis tombé sur ce qui suit:
Implémentation JavaScript Glicko-2
- Le JavaScript avait une petite erreur, dans laquelle il ne correspondait pas à l’exemple de rédaction technique, l’auteur l’a trouvé suffisamment proche et n’a pas pris la peine de debug.
- Limplémentation PHP était en proie à de nombreux bogues, mais cela nétait pas apparent à moins que vous nayez fait plus dune période de notation (ce que la technique écrit- up nev er affiche les valeurs attendues de)
Calculatrice Glicko-2 dans Excel
- Enfin, la calculatrice Excel semblait être sans erreur et la plus professionnelle, réalisée par un membre de la communauté des échecs. Une fois le bogue JavaScript résolu, le calculateur JavaScript et Excel correspondaient très étroitement (bien que ce ne soit pas parfait, cela pouvait être une erreur darrondi)
Javais corrigé les bogues (et soumis des problèmes / patches aux auteurs) Jai pu trouver sur les versions PHP et JavaScript pour correspondre au plus près de la calculatrice Excel
Maintenant, je suis à 99% confiant que jai une implémentation Glicko-2 précise (entre les 3 dentre eux) pour analyse et cest là que je suis tombé sur quelque chose détrange, et le sujet de cette discussion.
Compte tenu de la valeur par défaut suggérée pour Glicko-2 pour un nouveau joueur:
Rating: 1500 RD: 350 Volatility: 0.06
Si vous affrontez un adversaire moyen de classement 1378 et RD 99 ( Source ) une seule fois par période de classement (1 mois) pour les 12 prochaines périodes (1 an), vous aurez accumulé une Classe nationale A (1800-1999) note de 1852 alors quen réalité vous avez na battu que 12 joueurs notés en moyenne sur une période de 12 mois.
Month Rating RD Volatility Class 1 1625 259 0.059999 National Class B 2 1682 225 0.059998 〃 3 1718 205 0.059997 〃 6 1784 174 0.059994 〃 12 1852 148 0.059988 National Class A 24 1922 127 0.059976 〃
Si vous affrontez 2 adversaires moyens à chaque période de classement, vous pouvez accéder à la classe nationale A environ 4 à 5 mois, face à seulement 8 à 10 adversaires moyens.
Month Rating RD Volatility Class 1 1672 215 0.059999 National Class B 2 1733 183 0.059997 〃 3 1770 166 0.059995 〃 4 1797 154 0.059993 〃 5 1819 146 0.059992 National Class A 6 1836 140 0.059991 〃
Ces hypothèses sont-elles exactes? Y a-t-il un bug dans ma calculatrice?
Si ce nest pas un bogue, quelles sont les façons de contrer cela en plus:
- Considérez que « vraie note » est la limite inférieure de lécart (Rating – RD)
- Ne pas afficher la note des utilisateurs inactifs
- Ne pas afficher les utilisateurs avec moins de N jeux
Commentaires
- chess.com/forum/view/general/chess-ratings—glicko-vs-elo jeter un œil à ceci
- chesschat.org/showthread.php?t=13621
Réponse
Jai travaillé sur une implémentation Scala il y a quelques mois, même si elle était un peu non polie – je devrais revenir en arrière pour la terminer. Jai au moins obtenu des résultats raisonnables de
Si vous gagnez toutes les parties auxquelles vous jouez, oui, votre cote deviendra assez élevée même si vous ne jouez que contre des joueurs mal notés. La probabilité que vous gagniez chaque partie contre un tel adversaire est probablement à propos de ce quun joueur de classe A réaliserait (bien que je est un peu gonflé en raison de la RD relativement élevée, encore).
La meilleure façon de contrer, à mon avis, est de ne pas considérer une personne avec un RD supérieur à un certain montant comme une note stable – cest-à-dire. la considèrent comme « provisoire ». De plus, pour réellement gagner un titre, au moins à lUSCF, ils ont un système de normes, où vous devez jouer à un certain niveau dans un tournoi de 4 matchs ou plus (4 fois, je crois), ce qui rend la probabilité de jouer contre un ~ 1378 pendant tout le tournoi [quatre fois] très peu probable.
Votre objectif est-il de lutiliser pour les échecs? Quel est votre cas dutilisation?
Mise à jour: FICS le gère en ne considérant que les personnes avec une RD de < 80 active. (Ils utilisent encore Glicko-1, je crois.) http://www.freechess.org/Help/ficsfaq.html#Q005.003
Et par En fait, Glicko-1 utilise également la décroissance RD / temps. La principale amélioration de Glicko-2 était le facteur de «volatilité», qui permet aux personnes ayant des résultats irréguliers ou des résultats stables dêtre calculés très légèrement différemment. Je pense que cest une modification très mineure de Glicko-1 qui entraîne un calcul supplémentaire considérable – mais comme vous, jétais toujours intéressé à le calculer. Jai en fait demandé à Glickman lui-même des points de données supplémentaires à tester, mais il était trop occupé pour les fournir à lépoque.
Commentaires
- FYI, a Pour un titre de classe USCF, il faut gagner une norme dans 5 tournois.
Réponse
Tous les systèmes de classement ont des problèmes vrai vie. Au mieux, aucun dentre eux ne peut faire plus quévaluer approximativement votre capacité.
Ils feront mieux au niveau des MJ car ces joueurs sont plus cohérents et ont tendance à jouer plus de MJ; tandis que le reste dentre nous est plus incohérent et a tendance à jouer un plus large éventail de joueurs moins bien notés qui sont également plus incohérents. Et les nouveaux joueurs ont tendance à saméliorer beaucoup plus rapidement tout en jouant dans moins de tournois, ce qui faussent encore plus les notes. Et à tous les niveaux, certains joueurs ont des jours de congé ou nessaient pas aussi fort si cela ne change pas leur position dans les résultats finaux.
Essayer de peaufiner les notes à la manière de Glicko2 est une tâche insensée.
Un autre facteur aggravant le problème est que les joueurs ont tendance à jouer les mêmes joueurs. Sil y avait un système suisse obligatoire mondial qui jouait suffisamment de tours, il y aurait un gros bouleversement dans les cotes de la plupart des joueurs. Un double tournoi à la ronde dans le monde apporterait dautres changements, mais le Suisse serait un bon début pour corriger les erreurs de notation – du moins au milieu avec des joueurs établis. Vous avez toujours le problème avec les nouveaux joueurs qui déforment les notes.