Étiquettes
Ce n’est pas une bonne nouvelle mais ce sont encore les affaires de tricherie qui occupent le devant de la scène en cette période où les diverses compétitions essaient laborieusement de reprendre. Le titre ne fait pas référence à une association destinée à lutter contre une addiction pathologique, encore que la création d’un « Trianon » serait certainement une bonne idée, mais à la discrétion qui entoure ces affaires de tricherie. Comme cela se reproduit depuis une petite dizaine d’années, les autorités des fédérations ou organismes internationaux se révèlent incapables ou peu désireuses de sévir contre les malfrats et ce sont les individus de base qui se révoltent épisodiquement pour manifester leur mécontentement face au laxisme. Le dernier événement en date est le boycott des italiens par tous leurs concurrents lors des sélections européennes d’août 2021.
Le problème tiendrait à ce que ce sont des statistiques qu’il faut utiliser pour confondre les tricheurs, que les statistiques ce n’est forcément jamais du 100%, c’est à dire jamais une preuve absolue et que les autorités préfèrent absoudre tout le monde, plutôt que de prendre leurs responsabilités. D’où la création de moultes commissions, comités, groupes de travail, dont il ne sort jamais rien de visible et qui servent surtout à se donner bonne conscience pour étouffer toutes les affaires.
Comme je ne suis pas du genre à tout croire sur parole, pas plus que je ne signe des pétitions sans savoir de quoi il retourne, j’ai voulu me faire mon opinion sur l’usage qu’on peut faire des statistiques en matière de démasquage des tricheurs. J’ai d’abord essayé d’échanger avec d’autres sur le choix des protocoles à utiliser mais n’ayant reçu aucun écho, j’en ai été réduit à me débrouiller tout seul. Il existe les statistiques de Hammond mais, d’une part elles demandent beaucoup de ressources pour recueillir les données et pour les traiter automatiquement et, d’autre part, elles sont automatiques et demandent, une fois qu’elles ont permis de détecter des suspects, de passer à une 2e phase d’analyse plus fine.
Comme je ne dispose pas de ressources importantes (un PC et un stylo), ni de personnel (un temps partiel: moi), je me suis fixé un objectif modeste: acquérir des données de donnes jouées en ligne (sur BBO, et en utilisant l’utilitaire myhands) par un certain nombre de paires, à la fois des paires suspectées de mal se comporter et des paires ordinaires qui servent de placebo. Ensuite, le travail consiste à analyser manuellement et forcément de manière subjective, ces donnes. Ce que je voulais surtout éviter, c’était d’isoler des donnes « compromettantes » car on peut toujours trouver une explication à une bétise qui tourne bien, une inspiration opportune, un coup de Rueful Rabbit. Ce qui compte, c’est de dégager des tendances à long terme, faire des stats quoi. Je ne voulais pas tout réinventer non plus, alors j’ai repris la méthodologie de Woolsey, qui consiste à classer chaque donne analysée dans une catégorie, repérée par les lettres A,B,W,N,G,S,L:
G pour Good, correspond à une donne où il y avait un choix plus ou moins difficile à effectuer et où l’action choisie a été bénéfique.
B pour Bad: c’est exactement l’inverse, un choix qui tombe mal.
S pour Suspicious, c’est une action peu recommandable qui a réussi.
A pour Antisuspicious c’est l’inverse.
L pour Lazy, c’est un peu plus subtil, une action qui a réussi mais qui aurait pu échouer dans un contexte moins favorable, par exemple un jeu de sécurité qui a été omis mais qui n’était pas nécessaire.
N pour Normal, c’est toutes les donnes (la majorité d’ailleurs) où il n’y avait rien de particulier à faire.
W pour Weird, c’est la catégorie des donnes qu’on ne sait pas comment classer (peu, dans les faits).
Ensuite, j’ai voulu quantifier l’analyse et, pour cela, donné un poids à chacune des catégories: poids positif pour les catégories correspondant à des réussites (G,S,L) et négatif pour celles correspondant à des loupés (B,A), ce qui donne à l’arrivée un indice (moyenné sur l’ensemble des donnes analysées) qu’on peut interpréter comme un révélateur du degré d’honnêteté de la paire.
J’aurais bien voulu croiser des analyses réalisées par plusieurs enquêteurs mais, comme mes appels à assistance n’ont reçu aucun écho, je m’y suis collé tout seul. Avant que je m’y lance, ma curiosité portait déjà sur la portée des résultats: allait-il apparaître des écarts significatifs, ou le bruit masquerait-il tout? Surtout que, tout seul, je n’allais pas traiter des Peta-octets! Jusque là, j’ai analysé un millier de donnes jouées par 7 paires différentes, soit entre 100 et 200 chacune. Il m’a aussi fallu faire une hypothèse sur chaque paire, entre les 2 modes possibles de tricherie en-ligne, soit la collusion (2 partenaires qui se montrent leur jeu), soit l’auto-kibbitz (un joueur qui a accès aux 4 mains).
Voilà pour la méthodologie, ensuite les résultats ont été encourageants, dans la mesure où ils ont montré une discrimination significative entre les différentes paires: aucune n’a un indice entre -0,6 et 0,4; les paires placebo, manifestement blanc-bleu, sont autour de -0,6 et celles suspectes sont entre 1 et 2. Deux autres, pour lesquelles il faudrait probablement poursuivre les recherches se trouvent autour de 0,5.
Il est intéressant de se focaliser sur la catégorie N: elle est majoritaire pour toutes les paires, mais plus ou moins fréquente: de l’ordre de 60-70% pour le mode « collusion » mais plutôt 50% pour le mode « auto-kibbitz » qui permet de sévir aussi quand on joue avec le mort; et pas d’écart significatif entre les placebos et les activistes.
Un autre marqueur inattendu est apparu, l’une des paires a été maladroitement accusée publiquement par des adversaires; il semble que cela ne soit pas tombé dans l’oreille de sourds puisqu’ils n’ont pas manqué de s’indigner et de crier à la calomnie, mais ils ont dû vouloir s’acheter une conduite car leur indice qui était de 1,65 avant est tombé à -1,25 après!
Ma conclusion même si mon échantillon est réduit est que les statistiques sont parlantes et que si les personnes qui ont été chargées de traiter le problème et dotées de ressources, voulaient bien s’en donner la peine, leur traque devrait aboutir. Avis aux professionnels.