Dans la pratique du traitement des résultats d'observation, la distribution de la population générale est inconnue ou (pour les variables aléatoires continues) diffère de la distribution normale, de sorte que l'utilisation de méthodes statistiques classiques est déraisonnable et peut entraîner des erreurs. Dans ce cas, on utilise des méthodes indépendantes (ou libres) de la distribution de la population générale - méthodes non paramétriques.
L'article aborde d'un point de vue unifié trois tests à échantillon unique fréquemment rencontrés dans la pratique: le test de signe, le test t et le test de Wilcoxon de rang signé, une procédure non paramétrique dont la puissance est comparable à la puissance du test t dans le cas d'un échantillon normalement distribué, et dépasse la puissance du test t si la distribution de l'échantillon a des "queues plus lourdes" par rapport à la distribution normale.
1. Définissez un modèle pour le modèle d'emplacement comme suit. Soit - un échantillon aléatoire obtenu selon la loi suivante
où l'on suppose que les erreurs aléatoires sont des variables aléatoires indépendantes et également distribuées avec une densité de distribution continue symétrique autour de zéro.
2 . Sous la condition de symétrie, tout paramètre de position , y compris la moyenne et la médiane, est égal à . Considérez l'hypothèse
3. Pour tester cette hypothèse, considérons trois tests souvent utilisés dans la pratique: le test des signes, le test t et le test de Wilcoxon.
3.1. Le test des signes classiques ( test des signes) est basé sur des statistiques
où pour, respectivement. Laisser être
. , ( , , ). , . – p-value , – (R pbinom
cdf ).
, () .
3.2. t- (t-test) .
, . t- t-
, . , t- . . p-value t- , – t- c (R pt
cdf t-). p-value , .
3.3. t- , t- .
(signed-rank Wilcoxon test) , . , .
t-, , .
. , , ,
p-value , – (R psignrank
cdf ).
4. . : , t- . .
4.1. ,
, – - , – . . , - .
4.2. , t- . , – t- . .
4.3. , - (Hodges-Lehmann)
, (Walsh averages) . . , – signed-rank Wilcoxon . . , – . , , , .
5. ( ) A B . , ?
, A B. . R t-
> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B
> wilcox.test(response, alternative = "greater", conf.int = TRUE)
Wilcoxon signed rank exact test
data: response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
1 Inf
sample estimates:
(pseudo)median
7.75
> t.test(response, alternative = "greater", conf.int = TRUE)
One Sample t-test
data: response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
1.781971 Inf
sample estimates:
mean of x
8.75
wilcox.test()
, p-value , - . - t.test()
. , , , A .
, . , t- t- « » .