🕯️ 🧢 🤲🏿 Approximations simples et rapides des fonctions statistiques 🐷 👎 👏🏿

Tâche. Il y a une calculatrice , mais pas de tableaux statistiques à portée de main . Par exemple, vous avez besoin de tableaux de points critiques de la distribution de Student pour calculer l' intervalle de confiance. Obtenir un ordinateur avec Excel? Pas athlétique.

Une grande précision n'est pas nécessaire, vous pouvez utiliser des formules approximatives. L'idée des formules ci-dessous est qu'en transformant l'argument, toutes les distributions peuvent être en quelque sorte réduites à la normale. Les approximations devraient fournir à la fois le calcul de la fonction de distribution cumulative et le calcul de sa fonction inverse.

Commençons par la distribution normale.

Φ (z) = P = \frac{1}{2} [1 + e r f (\frac{z}{\sqrt{2}})]

z = Φ^{- 1} (P) = \sqrt{2} \cdot {e r f}^{- 1} (2 P - 1)

Il faut calculer la fonction $e r f (x)$ et l'inverse. J'ai utilisé l'approximation [1]:

e r f (x) = s i g n (x) \cdot \sqrt{1 - \exp (- x^{2} \cdot \frac{\frac{4}{π} + a x^{2}}{1 + a x^{2}})}

{e r f}^{- 1} (x) = s i g n (x) \cdot \sqrt{- t_{2} + \sqrt{t_{2}^{2} - \frac{1}{a} \cdot \ln t_{1}}}

Où $t_{1}$ et $t_{2}$ - variables auxiliaires:

t_{1} = 1 - x^{2}, t_{2} = \frac{2}{π a} + \frac{\ln t_{1}}{2}

et la constante $a = 0.147$ ... Voici le code en langue Octave.

function y = erfa(x)
  a  = 0.147;
  x2 = x**2; t = x2*(4/pi + a*x2)/(1 + a*x2);
  y  = sign(x)*sqrt(1 - exp(-t));
endfunction

function y = erfinva(x)
  a  = 0.147; 
  t1 = 1 - x**2; t2 = 2/pi/a + log(t1)/2;
  y  = sign(x)*sqrt(-t2 + sqrt(t2**2 - log(t1)/a));
endfunction

function y = normcdfa(x)
  y = 1/2*(1 + erfa(x/sqrt(2)));
endfunction

function y = norminva(x)
  y = sqrt(2)*erfinva(2*x - 1);
endfunction

Maintenant, quand il y a des fonctions de distribution normales, nous donnons un argument et calculons la distribution t de Student [2]:

F_{t} (x, n) = Φ (\sqrt{\frac{1}{t_{1}} \cdot \ln (1 + \frac{x^{2}}{n})})

t = F_{t}^{- 1} (P, n) = \sqrt{n \cdot \exp (Φ^{- 1} (P)^{2} \cdot t_{1}) - n}

où variable auxiliaire $t_{1}$ il y a

t_{1} = \frac{n - 1.5}{(n - 1)^{2}}

function y = tcdfa(x,n)
  t1 = (n - 1.5)/(n - 1)**2;
 y = normcdfa(sqrt(1/t1*log(1 + x**2/n)));
endfunction

function y = tinva(x,n)
  t1 = (n - 1.5)/(n - 1)**2;
  y  = sqrt(n*exp(t1*norminva(x)**2) - n);
endfunction

L'idée de calculer la distribution grossièrement $χ^{2}$ est clairement représenté par des formules [3]:

σ^{2} = \frac{2}{9 n}, μ = 1 - σ^{2}

F_{χ^{2}} (x, n) = Φ (\frac{{(\frac{x}{n})}^{1 / 3} - μ}{σ})

χ^{2} = F_{χ^{2}}^{- 1} (P, n) = n \cdot {(Φ^{- 1} (P) \cdot σ + μ)}^{3}

function y = chi2cdfa(x,n)
  s2 = 2/9/n; mu = 1 - s2;
  y  = normcdfa(((x/n)**(1/3) - mu)/sqrt(s2));
endfunction

function y = chi2inva(x,n)
 s2 = 2/9/n; mu = 1 - s2;
  y = n*(norminva(x)*sqrt(s2) + mu)**3;
endfunction

( $n / k \geq 3$ $n \geq 3$ ) . $χ^{2}$ [4], , .

σ^{2} = \frac{2}{9 n}, μ = 1 - σ^{2}

λ = \frac{2 n + k \cdot x / 3 + (k - 2)}{2 n + 4 k \cdot x / 3}

F_{f} (x; k, n) = Φ (\frac{{(λ \cdot x)}^{1 / 3} - μ}{σ})

, .

q = {(Φ^{- 1} (P) \cdot σ + μ)}^{3}

b = 2 n + k - 2 - 4 / 3 \cdot k q

D = b^{2} + 8 / 3 \cdot k n q

x = F_{f}^{- 1} (P; k, n) = \frac{- b + \sqrt{D}}{2 k / 3}

function y = fcdfa(x,k,n)
  mu = 1-2/9/k; s = sqrt(2/9/k);
  lambda = (2*n + k*x/3 + k-2)/(2*n + 4*k*x/3);
  normcdfa(((lambda*x)**(1/3)-mu)/s)
endfunction

function y = finva(x,k,n)
  mu = 1-2/9/k; s = sqrt(2/9/k);
  q = (norminva(x)*s + mu)**3;
  b = 2*n + k-2 -4/3*k*q;
  d = b**2 + 8/3*k*n*q;
  y = (sqrt(d) - b)/(2*k/3);
endfunction

Sergei Winitzki. A handy approximation for the error function and its inverse. February 6, 2008.
Gleason J.R. A note on a proposed Student t approximation // Computational statistics & data analysis. – 2000. – Vol. 34. – №. 1. – Pp. 63-66.
Wilson E.B., Hilferty M.M. The distribution of chi-square // Proceedings of the National Academy of Sciences. – 1931. – Vol. 17. – №. 12. – Pp. 684-688.
Li B. and Martin E.B. An approximation to the F-distribution using the chi-square distribution. Computational statistics & data analysis. – 2002. Vol. 40. – №. 1. pp. 21-26.

Approximations simples et rapides des fonctions statistiques

More articles: