calcul du CJP (coefficient de justesse des points)
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
Maintenant je suis tres content car toutes ces discussions ont permis d'arriver à un premier résultat, qui à mon avis est la base de tout, c'est le Coefficient de Justesse des Points. Je l'ai appelé comme ca car c'est beaucoup plus parlant pour Monsieur tout le monde que Indice de dispersion ou coefficient de correlation course/classement.
[img4s]http://ffckdbase.free.fr/cjp.gif[/img4s]
Maintenant, plus le CJP est petit, plus les points attribués aux compétiteur "correspondent" à leur niveau au classement.
Il faut encore determiner les bateaux qu'on fait rentrer dans ce coeff (elimination des ceux qui font des 50, etc...)
C'est la base de tout car c'est ce qui va nous permettre de comparer les différentes méthodes explorées. Au final, la méthode qui donnera un CJP minimal sur l'ensemble des courses sera considérée comme la meilleure. Cette indicateur nous permettra aussi de voir à quel point on a reussi sur une course a faire "coller" les points de course avec ceux du classement. On pourra dire: tiens, sur cette course-là les gens ont globalement navigué à leur niveau (le cjp est petit) par contre sur celle-ci pas du tout (le cjp est grand, il y a eu beaucoup de contre/sur performance).
Maintenant, dans toutes les etapes des methodes de calcul (choix du temps de base, correction de la dispersion, etc..) l'objectif sera de toujours de minimiser le CJP.
En ce qui me concerne, je vais faire des simulations sur toutes les courses des 2 dernieres années en modifiant dans un premier temps le calcul du temps de base, c'est à dire que pour l'instant:
1. je garde le système de coefficient intercategorie (pour l'instant. on verra apres pour les supprimer)
2. je change la methode de calcul du temps de base en ne prenant plus 3 bateaux parmi 5 en tete de course mais en prenant le temps de base du bateau qui minimise le CJP.
3. je continue ensuite de corriger la dispersion grace au coefficient correcteur tel qu'il est calculé ajourd'hui (pour diminuer encore plus le CJP)
En parallele, je fais une deuxieme simulation exactement identique sauf que pour le temps de base je fais la moyenne des temps fictifs de tous les competiteurs (moins ceux qui ont fait des 50).
Je vous montre mes resultats quand c'est fini.
[img4s]http://ffckdbase.free.fr/cjp.gif[/img4s]
Maintenant, plus le CJP est petit, plus les points attribués aux compétiteur "correspondent" à leur niveau au classement.
Il faut encore determiner les bateaux qu'on fait rentrer dans ce coeff (elimination des ceux qui font des 50, etc...)
C'est la base de tout car c'est ce qui va nous permettre de comparer les différentes méthodes explorées. Au final, la méthode qui donnera un CJP minimal sur l'ensemble des courses sera considérée comme la meilleure. Cette indicateur nous permettra aussi de voir à quel point on a reussi sur une course a faire "coller" les points de course avec ceux du classement. On pourra dire: tiens, sur cette course-là les gens ont globalement navigué à leur niveau (le cjp est petit) par contre sur celle-ci pas du tout (le cjp est grand, il y a eu beaucoup de contre/sur performance).
Maintenant, dans toutes les etapes des methodes de calcul (choix du temps de base, correction de la dispersion, etc..) l'objectif sera de toujours de minimiser le CJP.
En ce qui me concerne, je vais faire des simulations sur toutes les courses des 2 dernieres années en modifiant dans un premier temps le calcul du temps de base, c'est à dire que pour l'instant:
1. je garde le système de coefficient intercategorie (pour l'instant. on verra apres pour les supprimer)
2. je change la methode de calcul du temps de base en ne prenant plus 3 bateaux parmi 5 en tete de course mais en prenant le temps de base du bateau qui minimise le CJP.
3. je continue ensuite de corriger la dispersion grace au coefficient correcteur tel qu'il est calculé ajourd'hui (pour diminuer encore plus le CJP)
En parallele, je fais une deuxieme simulation exactement identique sauf que pour le temps de base je fais la moyenne des temps fictifs de tous les competiteurs (moins ceux qui ont fait des 50).
Je vous montre mes resultats quand c'est fini.
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- hugues
- Messages : 1524
- Inscription : lun. nov. 05, 2001 20:15
- ville : Metz Tessy
- Navigue avec (bateau) : Vajda 360 L, Clipper
- département : 74
- club : BASE DE LOISIRS LOIRE FOREZ
- Rivière(s) sur laquelle je peux donner des infos : Fier
- Localisation : Annecy
quote:De mon coté j'ai vite écrit un script qui génére le graph des points attribués et des points au classement pour chaque course.
http://reflexion.classement.free.fr/sim ... ection.php
Pour l'instant je ne trace que les K1H, et j'élimine ceux dont le total des pénalités est >= 20.
Cool, sur la course de BSM je suis LE compétiteur parfait8) (écart points course / classement = 0). Par contre je ne sais pas si ça veut sire grand chose car venant de débuter le kayak j'ai très peu de courses qui comptent pour mon classement. Ceci dit, avec 2 manches très régulières (mêmes temps) et sans pénalité, c'est sûrement un bon signe que ça tombe sur moi.
Petite réflexion par rapport aux compétiteurs à éliminer (je m'étonne d'ailleurs que vous n'en ayez pas parlé plus tôt car pour moi c'est un point central du problème).
Le problème est qu'au classement les athlètes n'ont que des bonnes courses, donc déjà je trouve difficile de comparer les points avant course et les points de la course car on ne sait pas qui a fait une course "référenceé. Je pense donc que, tout en veillant à conserver un nombre de compétiteurs suffisants pour le calcul des points, il faut en éliminer un maximum qui n'ont pas fait de course "référence".
Exemple concret : sur une course N1 un compétiteur fait 10 de pénalité. Il reste tout de même à moins de 100 points de son niveau, donc il comptera pour le coeff correcteur : il contribuera donc à faire baisser fortement le coeff correcteur. C'est la raison pour laquelle on a souvent des coeff dans les 0,6 sur les N1. Alors qu'en toute logique, un N1 qui fait 10 de pénalité, c'est comme un N3 qui fait un 50, on ne devrait en aucun cas prendre sa perf en compte pour calculer les points de la course.
Je pense donc (et je l'avais déjà proposé à la commission il y a au moins 3 ou 4 ans) qu'au lieu de prendre "un écart de 100 points" pour éliminer les perf anormales, on devrait plutôt prendre un pourcentage du temps réaliser (pourcentage à simuler pour obtenir, comme je l'écrivais plus haut, pour "conserver un nombre de compétiteurs suffisants pour le calcul des points, en éliminant un maximum qui n'ont pas fait de course "référence").
http://reflexion.classement.free.fr/sim ... ection.php
Pour l'instant je ne trace que les K1H, et j'élimine ceux dont le total des pénalités est >= 20.
Cool, sur la course de BSM je suis LE compétiteur parfait8) (écart points course / classement = 0). Par contre je ne sais pas si ça veut sire grand chose car venant de débuter le kayak j'ai très peu de courses qui comptent pour mon classement. Ceci dit, avec 2 manches très régulières (mêmes temps) et sans pénalité, c'est sûrement un bon signe que ça tombe sur moi.
Petite réflexion par rapport aux compétiteurs à éliminer (je m'étonne d'ailleurs que vous n'en ayez pas parlé plus tôt car pour moi c'est un point central du problème).
Le problème est qu'au classement les athlètes n'ont que des bonnes courses, donc déjà je trouve difficile de comparer les points avant course et les points de la course car on ne sait pas qui a fait une course "référenceé. Je pense donc que, tout en veillant à conserver un nombre de compétiteurs suffisants pour le calcul des points, il faut en éliminer un maximum qui n'ont pas fait de course "référence".
Exemple concret : sur une course N1 un compétiteur fait 10 de pénalité. Il reste tout de même à moins de 100 points de son niveau, donc il comptera pour le coeff correcteur : il contribuera donc à faire baisser fortement le coeff correcteur. C'est la raison pour laquelle on a souvent des coeff dans les 0,6 sur les N1. Alors qu'en toute logique, un N1 qui fait 10 de pénalité, c'est comme un N3 qui fait un 50, on ne devrait en aucun cas prendre sa perf en compte pour calculer les points de la course.
Je pense donc (et je l'avais déjà proposé à la commission il y a au moins 3 ou 4 ans) qu'au lieu de prendre "un écart de 100 points" pour éliminer les perf anormales, on devrait plutôt prendre un pourcentage du temps réaliser (pourcentage à simuler pour obtenir, comme je l'écrivais plus haut, pour "conserver un nombre de compétiteurs suffisants pour le calcul des points, en éliminant un maximum qui n'ont pas fait de course "référence").
- hugues
- Messages : 1524
- Inscription : lun. nov. 05, 2001 20:15
- ville : Metz Tessy
- Navigue avec (bateau) : Vajda 360 L, Clipper
- département : 74
- club : BASE DE LOISIRS LOIRE FOREZ
- Rivière(s) sur laquelle je peux donner des infos : Fier
- Localisation : Annecy
quote:Posté par Joker-eph
propose un pourcentage
Essayons de mener la réflexion :
Sur une course avec un TB à 200
Un N1 avec une perf d'environ 220 (soit 100 pts) aura vraiment foiré sa course s'il fait (sur les deux manches), disons + 3 s par manche soit +6 s au total, soit +30 pts (30 %)
Un N3 comme moi avec une perf d'environ 280 (soit 400 points) aura vraiment foiré sa course s'il fait +15 s au total, soit + 75 points (20 %)
.... je ne vais pas arriver à conclure car il faudrait toujours des pourcentages plus élevés pour les forts et moins élevés pur les moins forts.
Ceci dit un pourcentage autour de 30 % me paraîtrait pas mal à vue de nez.
propose un pourcentage
Essayons de mener la réflexion :
Sur une course avec un TB à 200
Un N1 avec une perf d'environ 220 (soit 100 pts) aura vraiment foiré sa course s'il fait (sur les deux manches), disons + 3 s par manche soit +6 s au total, soit +30 pts (30 %)
Un N3 comme moi avec une perf d'environ 280 (soit 400 points) aura vraiment foiré sa course s'il fait +15 s au total, soit + 75 points (20 %)
.... je ne vais pas arriver à conclure car il faudrait toujours des pourcentages plus élevés pour les forts et moins élevés pur les moins forts.
Ceci dit un pourcentage autour de 30 % me paraîtrait pas mal à vue de nez.
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
Pur supprimer les ecarts trop grands, plutot que de prendre un pourcentage, je me demande s'il ne faudrait pas prendre les ecarts tel qu'on les calcule dans le CJP:
|P-V|/(1000+(P+V)/2)
c'est la dessus qu'il faut se baser pour savoir on le compte ou non.
Quand cette valeur est supérieur à 0.04, on ne la prend pas.
Pourquoi 0.04 me direz-vous ? parce que ca represente un ecart de 50 points pour quelqu'un qui a 200 au classement... et j'ai trouvé que c'etait la limite acceptable...
|P-V|/(1000+(P+V)/2)
c'est la dessus qu'il faut se baser pour savoir on le compte ou non.
Quand cette valeur est supérieur à 0.04, on ne la prend pas.
Pourquoi 0.04 me direz-vous ? parce que ca represente un ecart de 50 points pour quelqu'un qui a 200 au classement... et j'ai trouvé que c'etait la limite acceptable...
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
Brice75, j'ai une remarque à propos de notre calcul de CJP:
en mettant Pi et Vi dans la ponderation, l'écart n'est pas le meme selon son sens: Un ecart de 50 pts en mieux pour quelqu'un qui vaut 200 sera:
|150-200|/(1000+(150+200)/2) = 0.0425
et un de 50 pts en moins bien vaudra:
|250-200|/(1000+(250+200)/2) = 0.0410
Il n'y a pas de raison que la valeur de l'ecart soit different selon le sens dans lequel il se fait par rapport à la valeur de classement.
On aurait pas ce probleme si on prenait pour l'ecart:
|Pi-Vi|/(1000+Vi)
... What do you think ?
en mettant Pi et Vi dans la ponderation, l'écart n'est pas le meme selon son sens: Un ecart de 50 pts en mieux pour quelqu'un qui vaut 200 sera:
|150-200|/(1000+(150+200)/2) = 0.0425
et un de 50 pts en moins bien vaudra:
|250-200|/(1000+(250+200)/2) = 0.0410
Il n'y a pas de raison que la valeur de l'ecart soit different selon le sens dans lequel il se fait par rapport à la valeur de classement.
On aurait pas ce probleme si on prenait pour l'ecart:
|Pi-Vi|/(1000+Vi)
... What do you think ?
-
brice75
- Messages : 74
- Inscription : mar. oct. 11, 2005 22:15
- ville : paris
- Navigue avec (bateau) :
- département :
- Rivière(s) sur laquelle je peux donner des infos :
euh je ne pense pas qu'il soit idiot de considerer que ton premier competiteur vaut 175 points et que ton 2eme vaut 225 points, auquel cas les ecarts pondérés ne sont pas les memes.
Dans le cas d'un pagayeur en progression, la moyenne entre Pi et Vi donne une meilleure idée du niveau reel, enfin je pense
Pour un pagayeur qui stagne, et bien c'est du pareil au meme (puisque Pi = Vi = moyenne, a peu de choses pres).
Enfin ce n'est qu'un point de detail, que l'on divise par la moyenne ou par la valeur ou par les points, ca ne change finalement pas grand chose au calcul. ( et ton exemple le prouve )
Dans le cas d'un pagayeur en progression, la moyenne entre Pi et Vi donne une meilleure idée du niveau reel, enfin je pense
Pour un pagayeur qui stagne, et bien c'est du pareil au meme (puisque Pi = Vi = moyenne, a peu de choses pres).
Enfin ce n'est qu'un point de detail, que l'on divise par la moyenne ou par la valeur ou par les points, ca ne change finalement pas grand chose au calcul. ( et ton exemple le prouve )
-
brice75
- Messages : 74
- Inscription : mar. oct. 11, 2005 22:15
- ville : paris
- Navigue avec (bateau) :
- département :
- Rivière(s) sur laquelle je peux donner des infos :
autre chose:
pour calculer le CJP, on pourrait sommer les carrés des Idi plutot que les Idi, comme dans un calcul d'ecart type.
avantage: moins sensible aux valeurs "normales", c.a.d aux ecarts qui ne refletent pas un mauvais calcul de points.
inconvenient: plus sensible aux valeurs aberrantes, d'ou la necessite de mieux filtrer avant le calcul.
pour calculer le CJP, on pourrait sommer les carrés des Idi plutot que les Idi, comme dans un calcul d'ecart type.
avantage: moins sensible aux valeurs "normales", c.a.d aux ecarts qui ne refletent pas un mauvais calcul de points.
inconvenient: plus sensible aux valeurs aberrantes, d'ou la necessite de mieux filtrer avant le calcul.
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
quote:Posté par brice75
Enfin ce n'est qu'un point de detail, que l'on divise par la moyenne ou par la valeur ou par les points, ca ne change finalement pas grand chose au calcul.
Ca ne change rien à la philosophie du calcul, mais il y a bien un moment ou il faudra choisir...
je ne crois pas qu'un type qui a 200 pts au classement et qui fait 250 a la course devrait etre considere comme quelqu'un ayant une valeur de 225, car ses 200 points de classement sont deja une moyenne de 3 de ses courses, c'est donc une valeur plus sure. A la limite, si on faisait
|Pi-Vi|/(1000+(3*Vi+Pi)/4)
ca me paraitrait acceptable.
Enfin ce n'est qu'un point de detail, que l'on divise par la moyenne ou par la valeur ou par les points, ca ne change finalement pas grand chose au calcul.
Ca ne change rien à la philosophie du calcul, mais il y a bien un moment ou il faudra choisir...
je ne crois pas qu'un type qui a 200 pts au classement et qui fait 250 a la course devrait etre considere comme quelqu'un ayant une valeur de 225, car ses 200 points de classement sont deja une moyenne de 3 de ses courses, c'est donc une valeur plus sure. A la limite, si on faisait
|Pi-Vi|/(1000+(3*Vi+Pi)/4)
ca me paraitrait acceptable.
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
- harrypotter
- Messages : 343
- Inscription : ven. oct. 24, 2003 20:17
- club : 0
-
brice75
- Messages : 74
- Inscription : mar. oct. 11, 2005 22:15
- ville : paris
- Navigue avec (bateau) :
- département :
- Rivière(s) sur laquelle je peux donner des infos :
Joker: excellent le truc pour faire varier la limite du DJPpourcent 
(j'allais justement demander un truc comparable)
D'autre part, je maintiens et je repete qu'il faudrait mieux mesurer les écarts pondérés au carré (CPJi)².
C'est plus revelateur de la dispersion, donc de la justesse des points.
ex:
2 competiteurs de valeurs Va=1040 points et Vb=960 points, réalisent tout deux un temps identique, pour lequel une technique ideale leur attriburait 1000 points.
CJPa=40/2020=2.0202% CJPa²=4.0912
CJPb=40/1980=1.9801% CJPb²=3.9208
CJPglobal= 2.0001 CJP²global= 4.006
une mauvaise methode leur attribue 980 points, on a :
CJPa=60/2010=2.9851 CJPa²= 8.9108
CJPb=20/1970=1.0152 CJPb²= 1.0306
CJP global= 2.0001 CJP² global = 4.9707
le cjp ne permet pas de faire la difference entre les 2 calculs de points (le mauvais et l'optimal), le CJP² le fait.
le cjp mesure la moyenne des ecarts, le cjp² mesure la DISPERSION.
(j'allais justement demander un truc comparable)
D'autre part, je maintiens et je repete qu'il faudrait mieux mesurer les écarts pondérés au carré (CPJi)².
C'est plus revelateur de la dispersion, donc de la justesse des points.
ex:
2 competiteurs de valeurs Va=1040 points et Vb=960 points, réalisent tout deux un temps identique, pour lequel une technique ideale leur attriburait 1000 points.
CJPa=40/2020=2.0202% CJPa²=4.0912
CJPb=40/1980=1.9801% CJPb²=3.9208
CJPglobal= 2.0001 CJP²global= 4.006
une mauvaise methode leur attribue 980 points, on a :
CJPa=60/2010=2.9851 CJPa²= 8.9108
CJPb=20/1970=1.0152 CJPb²= 1.0306
CJP global= 2.0001 CJP² global = 4.9707
le cjp ne permet pas de faire la difference entre les 2 calculs de points (le mauvais et l'optimal), le CJP² le fait.
le cjp mesure la moyenne des ecarts, le cjp² mesure la DISPERSION.