Imaginez que quelqu'un prenne une bande de film photographique de N cm de long et décide d'observer comment des particules venant de l'espace y laisseront leurs traces. L'échelle de densité de probabilité expérimentale film tombant sur les particules sera décrite dans une répartition uniforme sur l'intervalle de 0 à N . Dans cette expérience, l'expérimentateur vous indique la distance k entre le bord gauche du film et le point où la première particule enregistrée a frappé. Comme précédemment, vous devez donner une estimation raisonnable pour l'inconnu vous de N .
Pour résoudre ce problème, l'hypothèse suivante a été émise:
Imaginez maintenant que dans une expérience, la distance entre le point d'impact de la particule et le bord gauche du film photographique soit égale à P1 , et dans une autre expérience - P2 , avec P1 <P2 . Ne serait-il pas raisonnable alors de donner une estimation plus petite de la longueur du film photographique dans la première expérience que dans la seconde?
Je me suis demandé en chiffres - est-ce toujours et dans quelle mesure est-il raisonnable?
Ces notes ne sont pas une continuation et une discussion de l'article dont la citation est tirée, c'est une tentative de voir comment la formulation du problème lui-même, les restrictions introduites, les hypothèses et conditions adoptées au stade de la formalisation seront reflétées dans la réponse reçue. Je ne donnerai pas de formules et essaierai de ne pas utiliser de termes spéciaux, il me semble que le problème même de la dépendance du résultat sur les hypothèses acceptées ou non acceptées sera plus clairement visible.
Pour commencer, je vais modifier, simplifier et ancrer l'expérience.
Le destin ou notre assistant a un sac dans lequel il y a des barils numérotés dans l'ordre, comme dans un loto. L'assistant (c'est plus facile pour moi de l'imaginer que le destin) nous sort secrètement un fût au hasard et verse dans le premier coffre des boules numérotées en fonction du nombre sur le fût. Ensuite, il répète la procédure de retrait aléatoire du fût et verse le nombre approprié de balles numérotées dans le deuxième coffre. Il y a deux coffres devant nous avec un nombre inconnu de balles dans chacun d'eux. Nous tirons au hasard une balle du premier et une balle du deuxième coffre, et faisons une hypothèse raisonnable que la balle à numéro élevé correspond au coffre avec un grand nombre de balles.
Estimons à quel point l'hypothèse est raisonnable?
Formalisons et affinons le problème
1. Les fûts étant dans le sac, ils doivent être limités à un certain nombre. En gardant à l'esprit la source originale concernant le nombre de lignes de tram, jusqu'à présent, le nombre de barils est limité à 30.
2. Mais que devons-nous faire si nous sortons des balles avec les mêmes numéros des coffres? Nous avons des options:
2.1 admettre que le résultat est infructueux, ne pas prendre de décisions et demander à l'assistant de remplir à nouveau les coffres.
2.2 lancez une pièce et décidez au hasard quel coffre a le plus de balles. Il n'y aura pas de résultats malheureux dans cette option.
2.3 décide que puisque les nombres sont les mêmes, alors le nombre de balles dans les coffres est également le même. Il n'y aura pas non plus de résultats infructueux dans cette option.
Ici, je tiens à noter que je ne choisis pas quelle option est la meilleure. Mon objectif est de voir comment différentes options affecteront la réponse.
3. Comme nous avons un nombre différent de résultats, la question se pose: "Et à partir de quel nombre de résultats compter la part de bonnes réponses?" De toutes les expériences ou seulement des résultats positifs? Comptons les deux options.
4. L'assistant a sorti le premier baril, a regardé le nombre, a versé le nombre correspondant de balles dans le premier coffre. Arrêtez! Et puis qu'a-t-il fait avec le fût retiré? Il a deux options: remettre le fût dans le sac ou ne pas le remettre dans le sac. Ou qu'est-ce qui est pareil - l'assistant pourrait obtenir deux barils à la fois et verser des balles dans les coffres en fonction des nombres sortis sur les barils, les assistants sont paresseux, mais nous ne voyons pas ce qu'il fait là-bas. Dans ce cas, nous n'aurons jamais un nombre égal de balles dans les coffres, et donc des résultats infructueux. Ce point s'écarte clairement de la tâche du devis, où le fût retourne dans le sac, mais j'ai d'autres objectifs, et ne pas retourner le fût est une situation typique de la vie, nous calculerons cette option.
Nous avons donc trois options pour compter les résultats de l'expérience dans laquelle les nombres de balles sont les mêmes, deux options pour calculer la proportion de réponses correctes et deux options pour remplir les coffres avec des balles. Un total de 12 variantes des résultats de l'expérience!
Comment la probabilité de la bonne réponse dépendra-t-elle du nombre de barils dans le sac du destin, c'est-à-dire du nombre maximum possible de balles dans le coffre? Peut-être que toutes les options seront les mêmes? Peut-être que les options auront la même tendance? C'est à ce moment que j'ai essayé de tester mon intuition en remplissant la plaque suivante:
Il s'est avéré, en courant, que je devais entraîner et entraîner mon intuition. J'ai nettoyé l'assiette de plusieurs de mes considérations.
Afin de ne pas me lasser de formules qui, bien que belles, sont récurrentes, et je ne peux pas réduire les formules récurrentes à des formules fermées, je décrirai l'algorithme de calcul général:
1. Pour chaque nombre de barils dans un sac, nous pouvons faire une liste de toutes les options pour remplir les coffres avec des balles.
Exemple: Si le nombre de barils est de 4, alors nous obtenons 16 options pour remplir deux coffres par le nombre de balles: 1 et 1, 1 et 2, 1 et 3, 2 et 1, 2 et 2 ... 4 et 4.
2. Pour chaque variante de remplissage des coffres, nous comptons le nombre de réponses correctes pour trois variantes de comptage de boules égales.
Exemple: Pour remplir les coffres 2 et 3, (dans le premier coffre il y a 2 balles, dans le second 3), le tableau suivant se révélera.
3. Pour le nombre de barils sélectionné, additionnez toutes les bonnes réponses pour chaque option de remplissage des coffres.
4. Nous calculons la proportion de bonnes pour les deux options de comptage (par rapport au nombre total d'expériences et au nombre d'expériences réussies).
5. Nous comptons également des points de 3 à 4 pour l'option lorsque le fût ne retourne pas dans le sac, c'est-à-dire lorsque nous ne pouvons pas avoir un nombre égal de balles dans les coffres.
J'ai compté pour le nombre de fûts de 1 à 8 et 30 pour montrer la tendance. Voici les graphiques.
D'abord pour l'option lorsque le fût est remis dans le sac
Avec une augmentation du nombre de barils dans le sac, et par conséquent une augmentation du nombre possible de balles dans les coffres, la probabilité d'une évaluation correcte augmente et la différence entre les options diminue. Curieusement, la probabilité n'est pas toujours supérieure à 0,5. Le graphique jaune est également curieux, il y a une baisse et ensuite seulement une hausse. En général, la plage de 1 à 7 n'était pas évidente pour moi.
Il s'avère que s'il y a moins de 8 balles, alors pour la variante de comptage «les égaux sont considérés comme un échec. Le pourcentage de bonnes est compté à partir de toutes les expériences "une réponse aléatoire donnera un meilleur résultat que de suivre la règle" Plus de nombre de balles signifie que le coffre contient plus de balles. "
Graphiques pour l'option lorsque le fût ne retourne pas dans le sac et qu'il ne peut donc pas y avoir le même nombre de balles dans les coffres
Les graphiques sont au nombre de trois, puisque les deux sont identiques, ils sont marqués en rouge.
Pour quatre options, la probabilité d'une réponse correcte tombe et tend, apparemment, à 0,5! (?) En d'autres termes, dans ces options pour un grand nombre de balles dans les coffres, vous ne pouvez pas du tout réaliser l'expérience, mais simplement lancer une pièce - le résultat est le même. En fait, pour cela, j'ai décidé de calculer différentes options, je m'attendais à des surprises. Je n'ai aucune preuve rigoureuse que la probabilité tend exactement à 0,5. C'est encore mon intuition, et cela échoue souvent.
Je tiens à souligner à nouveau que ces notes ne concernent pas le choix de la bonne stratégie ou l’évaluation de la meilleure option. L'intérêt était de voir l'effet des différentes options de mise en conditions sur le résultat.
PS Comme je le voulais, j'ai réussi à ne pas utiliser de formules et à utiliser un terme spécial - une formule récurrente une seule fois.
PPS Si vous êtes trop paresseux pour regarder Wikipédia, la formule récurrente est lorsque vous devez vous rendre à la maison numéro 30, mais vous devez d'abord visiter toutes les maisons précédentes avec des numéros de 1 à 29.