Le dénominateur — où arrive « Due »
 
 

Voici une traduction d’un texte écrit par James Grosjean en 2013. Grosjean est reconnu comme l’un des meilleurs experts au monde. Il est le plus jeune AP introduit au Blackjack Hall of Fame et auteur des classiques Beyond Counting et Exhibit CAA acclamés par les pros.

Traduit par Monsieur G.
 
 

"Après un week-end d’écoute des diffuseurs de football, j’ai besoin de désintoxication. Je ressens encore ce malaise d’il y a quelques semaines lors de la diffusion du Sunday Night Football: le commentateur a indiqué qu’Adam Vinatieri, le botteur de précision des Colts d’Indianapolis, avait un dossier en carrière de 18 en 36 dans ses tentatives de botté de placement de plus de 50 verges et un résultat pour la saison en cours de 2 en 4 à cette même distance. Peu importe comment vous le regardez, dit-il, c’est une proposition de 50-50. Puis Vinatieri a réussi son botté de placement et fait monter son résultat de cette saison à 3 en 5.  Juste après, le commentateur dit en plaisantant, « je parie donc qu’il ratera la prochaine tentative! »


Il est ironique de constater que le monde du sport, bien qu’ayant enfin embrassé la méthode scientifique d’analyse numérique, le département marketing expose et va jusqu’à célébrer la stupidité statistique. Les grosses têtes nous donnent tous les détails statistiques du quart arrière Peyton Manning, de même que les distances lancées de Yasiel Puig (baseball) ou toutes autres mesures avancées, mais soudainement on entend que Vinatieri ratera son prochain essai sous entendant qu’avec un registre de 3 en 5 il est au-dessus de sa moyenne.
Si, comme moi, vous grincer des dents lorsque vous entendez le commentateur dire que Vinatieri devrait rater la prochaine tentative parce qu’il est « dû », vous n’avez probablement pas besoin de lire le reste de cet exposé, mais vous devriez quand même, puisque je vais vous donner l’explication de quelque chose que vous savez peut-être déjà, mais que la majorité des fans ignorent ou seraient incapables d’expliquer correctement.


Tout d’abord, nous allons devoir poursuivre cette discussion en s’aidant du lancer d’une pièce de monnaie. La raison pour laquelle nous utiliserons une pièce de monnaie dans notre discussion, c’est que dans le cas de Vinatieri, le commentateur suppose que la probabilité de Vinatieri de réussir son botté de placement est de 0,5 (50%) alors qu’en fait la probabilité de succès de Vinatieri (noté p) est un paramètre inconnu qu’il nous faut deviner. La logique du commentateur est que si nous savons que la probabilité de succès p = 0,5 alors un botté raté sur la prochaine occasion modifierait le dossier de 3 en 5 à 3 en 6, c'est-à-dire un taux de réussite de 50 %.


Oublions la « théorie due » pendant une seconde, un flagrant problème ici est que l’argument n’est pas logique. La seule raison pour laquelle le commentateur pense que Vinatieri est un botteur de placement de 50 % provient des données historiques de Vinatieri. Mais maintenant que nous voyons Vinatieri avec 3 en 5 pour la saison (60 %) ou 19 en 37 (51.35 %) en carrière, nous devrions mettre à jour notre estimation de sa probabilité de succès « p ». Sa vraie probabilité de succès est très certainement inconnue, mais on pourrait maintenant penser à quelque chose entre 51.35 % et 60 % (si nous pensons que les résultats récents sont une meilleure mesure de sa capacité actuelle), auquel cas le commentateur devrait annoncer que Vinatieri est favori pour réussir sa prochaine tentative. De toute façon, cette avenue nous mène à des débats philosophiques sur des statistiques bayésiennes, distributions antérieures (esp. empirique Bayes a priori), et autres concepts profonds qui nous détournent de notre mission: démontrer pour quelle simple et bonne raison la « théorie due » est fausse, et réconcilier ce « bourbier » avec d’autres croyances apparemment contradictoires.


Nous allons donc garder notre exemple simple en utilisant une pièce de monnaie ayant une probabilité de succès connus de p = 0,5. Supposons que nous avons procédé à 100 tirages et obtenu 65 faces et 35 piles. Présenter ces données à un civil lambda ou à un AP en le laissant même inspecter la pièce. Demandez-lui de décrire ses observations sur la situation actuelle. Il mentionnera trois croyances et nous préciserons que ce sont des faits :


1.    La pièce de monnaie est équitable, ce qui donne une probabilité d’obtenir pile ou face dans une proportion de 0,5.

2.    Chaque lancé de la pièce n’a aucun effet sur n’importe quel autre lancé. Parce que les lancés sont indépendants, les résultats antérieurs ne nous aident pas à prédire le résultat du prochain lancé.

3.    Si nous lançons la pièce plusieurs fois, la proportion de faces (ou pile) observées doit converger vers 0,5 (la probabilité de réussite indiquée au point 1).

Fait intéressant, ces trois notions courantes constituent le fondement d’une grande partie des travaux statistiques et ont donc des définitions et une terminologie technique précise. Les deux premiers points sont ce qu’un statisticien signifie lorsqu’il dit que les tirages sont i.i.d. - indépendant et identiquement distribués. Le troisième point est ce qu’il veut dire quand il dit que notre estimation est conforme. Une « estimation » est une règle ou un moyen d’en venir à une « supposition ». Dans ce cas, si nous devions supposer le taux de réussite de Vinatieri ou celui du résultat « face » lors du lancer de la pièce de monnaie, notre hypothèse correspondrait au nombre de succès comme étant une fraction du nombre total de tentatives. Ainsi, notre règle génère l’estimation de 65/100 = 0,65 pour la probabilité de voir « face » sur la pièce, dont nous savons qu’elle a une probabilité de 0,5 (issue du point 1). Dire de notre estimation ou de notre règle qu’elle est « cohérente » signifie que, si nous collectons des données d’un grand nombre d’essais, notre estimation tendra de plus en plus vers la bonne réponse. Donc, la cohérence signifie que la fraction des « faces » se rapprochera de plus en plus de 0,5 alors que nous continuons de lancer cette pièce.


Alors maintenant nous connaissons ces trois faits et que nous avons aussi devant nous un échantillon de 65 faces sur 100 lancés, que se passera-t ’il  lors des 100 prochains lancers? La plupart des gens, même APs, sont incapables de réconcilier l’indépendance des lancers précédents (point 2) avec la nécessité de convergence vers la fraction 0.5 (point 3). Ils disent qu’ils ne croient pas au « due », mais aussi « savent » que la fraction doit graviter autour de 0.5 et si vous regardez réellement leur activité d’AP, vous verrez que leurs actions démentent leurs véritables convictions. J’ai vu des APs sur des machines qui ne croient pas au « due », mais qui change de machine pour jouer sur celle qui n’a pas frappée la Quinte Flush royale depuis un certain temps. J’ai vu des compteurs de cartes qui sont sur une série de victoires dans un casino avoir peur d’y rejouer, parce qu’ils sentent qu’ils sont « dus » pour une perte, même s’ils affirment ne pas croire au « due ». Bien que nous n’ayons pas éliminé totalement la superstition dans le monde des APs, au moins l’embarras sur la superstition servira de début.


Bien qu’ils disent qu’ils savent que la pièce n’est pas «due », en leur for intérieur, ils s’attendent à ce que la pièce restaure la fraction de 50 % de la façon suivante : au cours des 100 prochains lancers, si « pile » est censément « due », nous rétablirons la fraction de 65/100 en mettant à jour à (65+35)/(100+100) = 100/200 = 0.5. Maintenant,  bien sûr ils se rendent compte que c’est idiot d’attendre 65 « piles » dans les prochain 100 lancers. Après tout, c’est 15 « piles » supplémentaires en seulement 100 lancers. Ils raisonnent ensuite que « face » avait été chanceux dans les 100 premiers lancers, alors il n’est pas inconcevable que « pile » ait cette chance dans les 100 prochains. Pourtant, ils se sentent généralement coupables d’adorer l’idole Due, et ils savent aussi que le point 3 appel en quelque sorte le « long terme », alors pour se convaincre ils décident que la meilleure façon de restaurer l’ordre dans l’univers est que « pile » soit « due » au cours des prochains 10000 lancers. Si nous obtenons seulement 5015  « piles » , ou 15 de plus que « prévu », au cours des prochains 10000 lancers, alors notre fraction globale de « face » est (65+4985)/(100+10000) = 0,5. De cette façon il suffit seulement que « pile » soit un peu chanceux pendant un certain temps pour rétablir l’ordre.
Quoi qu’il en soit, ce que ces gens essaient de faire est de fixer la fraction de « faces » dans le numérateur. Ils essaient d’annuler les 15 « faces » supplémentaires en insérant 15 « piles » supplémentaires dans le numérateur pour que la fraction devienne 0.5.


Voici le secret sur « Due » : la fraction de « face » se corrige dans le dénominateur, pas le numérateur. Alors que le résultat indique 15 « faces » supplémentaires dans les 100 premiers lancers, qu’advient-il de notre fraction 0.65 si les 100 prochains lancers montrent une égalité (50-50) ? Alors la fraction devient (65+50)/(100+100) = 0,575. Puis elle devient (65+50+50)/(100+100+100) = 0,55 si les 100 prochains lancers sont encore équilibrés. Après 10000 lancers supplémentaires équilibrés ajoutés au 100 premiers, nous arriverions à (65+5000)/(100+10000) = 0,5015. Regardez à quel point nous sommes près du 50 % !


Pour corriger le fait que « face » était chanceuse  au début, nous n’avons pas besoin que « pile » soit chanceux à son tour pour restaurer le 0.5. Si dans les prochains lancers, la pièce de monnaie reste fidèle à sa nature, avec des « piles », obtenant seulement leurs justes parts, l’excès de 15 « faces » obtenu sera constamment dilué par le dénominateur en constante expansion. La fraction 0,65 ne peut être maintenu ; « face » ne peut pas rester extra chanceux étant donné les points 1 et 2. Aucun excès fixe de « faces » ne peut survivre puisque dilué vers le bas et donc vers le taux de 50% alors que le dénominateur s’accroit.


Vous n’aimerez peut être pas le fait que bien que nous nous rapprochions de plus en plus près de 50 % dans cet exemple, nous sommes toujours un peu au-dessus. J’ai deux réponses. Tout d’abord, c’est juste un exemple. Si vous collectiez des données réelles sur des millions de lancers, vous verriez la fraction rebondir autour du 50%, mais les rebonds seraient plus en plus petits et le dénominateur qui serait en pleine croissance éliminerait tout excès de pile ou face au numérateur. Les points 1 et 2 garantissent que l’équilibre futur des piles et face diluera tout excès préalable de pile ou face dans le numérateur alors que le dénominateur augmente. Deuxièmement, la principale priorité des statisticiens est d’avoir une garantie que lorsque la taille de l’échantillon de données se développe, notre supposition deviendra de plus en plus près de la vérité."

 

   
   

LogIn  

   

Qui est en ligne  

Nous avons 51 invités et aucun membre en ligne

   
© Blackjack-Square / administration@blackjack-square.com