A28 |
Aivazian, S. Elements de modelisation et traitement primaire des donnees [Текст] = Прикладная статистика. Основы моделирования и первичная обработка данных / S. Aivazian, I. Enukov, L. Mechalkine. – Moscou : Editions mir, 1986. – 392 с.
TABLE DES MATIERES
Avant-propos 12
PREMIERE PARTIE. STATISTIQUE APPLIQUEE: ESSENCE ET OBJECTIF (principes methodiques generaux) 15
CHAPITRE PREMIER. La statistique appliquee: une discipline scien-
tifique autonome 15
1.1. Lien entre la statistique appliquee et les autres disciplines
statistiques et principales etapes de la recherche statistique 15
1.1.1. Definition de la statistique appliquee 15
1.1.2. Deux fagons d'interpreter les donnees initiales et deux approchesdeleurtraitement statistique 16
1.1.3. Principales etapes du traitement statistique des donnees initiales 20
1.2. Formulation d'optimisation des principaux problemes de
statistique appliquee et stabilite des inferences statistiques 27
1.2.1. Lien entre la formulation d'optimisation des principaux problemes de statistique appliquee et la stabilite des inferences statistiques 27
1.2.2. Etude statistique des dependences des variables . . 28
1.2.3. Classification des objets ou des variables 31
1.2.4. Abaissement de la dimension de l'espace factoriel et selection des variables les plus informatives ... 32
Conclusions 33
CHAPITRE 2. Methode de raisonnement probabiliste en statistique ap
pliquee 35
2.1. Theorie des probabilites et conditions de son application . . 35
2.1.1. Ensemble statistique et " jeu du hasard " 35
2.1.2. Theorie des probabilites et conditions d'ensemble statistique 36
2.1.3. Classification des situations reelles par les conditions d'ensemble statistique 37
2.2. " Rapports " entre la theorie des probabilites et la statistique
mathematique 40
2.2.1. Mode statistique de prise de decision 40
2.2.2. Mode probabiliste de raisonnement 40
2.2.3. Mode probabilisto-statistique (ou mathematico-sta-tistique) de prise de decision 41
Conclusions 43
CHAPITRE 3. Modeles mathematiques en statistique appliquee ... 45
3.1. A quoi servent les modeles mathematiques? 45
3.1.1. Deux facons de voir la modelisation statistique ... 45
3.1.2. Notion de modele mathematique 46
3.2. Schema logique general et principales etapes de modelisation
mathematique 48
3.2.1. Principales etapes de modelisation 48
3.2.2. Modelisation du mecanisme d'un evenement au lieu d'une photographie statistique formelle 50
3.3. Notion de simulation statistique 52
3.4. Objections contre les modeles mathematiques 53
3.5. Types de modeles mathematiques les plus souvent utilises
en statistique appliquee 54
3.5.1. Modeles des lois de probabilite de variables aleatoires 54
3.5.2. Modeles probabilistes lineaires 54
3.5.3. Generalisation des modeles lineaires 56
3.5.4. Modeles geometriques 57
3.5.5. Modeles markoviens 58
Conclusions 58
DEUXIEME PARTIE. FONDEMENTS MATHEMATIQUES DE LA ТНЁОШЕ DES PROBABILITES 60
CHAPITRE 4. Operations sur les evenements aleatoires et les probabilites
de leur realisation 60
4.1. Espace probabilise discret 60
4.1.1. Experience aleatoire 60
4.1.2. Evenements aleatoires et operations sur eux .... 61
4.1.3. Espace probabilise. Probabilites et operations sur elles 65
4.2. Espace probabilise contiiiu (axiomatique do Kolmogorov) 74
4.2.1. Specificite du cas general (continu) do l'espace probabilise 74
4.2.2. Evenements aleatoires, probabilites et operations (approche axiomatique de Kolmogorov) 76
Conclusions 79
CHAPITRE 5. Variables aleatoires 81
5.1. Definition et exemples de variables aleatoires 81
5.2. Valeurs possibles et observees d'une variable aleatoire ... 83
5.3. Types de variables aleatoires 83
5.4. Loi de probabilite d'une variable aleatoire. Population generale et eehantillon 86
5.4.1. Loi de probabilite 86
5.4.2. Population generate et eehantillon 90
5.4.3. Principales methodes d'organisation de l'echantillon-nage 93
5.5. Methodes de definition de la loi de probabilite: fo net ion de
repartition, densite de probabilite et leurs analogues empi-
riques 95
5.5.1. Fonction de repartition d'une variable aleatoire a une dimension 95
5.5.2. Densite de probabilite d'une variable aleatoire a
une dimension 98
5.5.3. Fonction de repartition et densite de probabilite
conjointes. Independance statistique des variables
aleatoires 101
5.6. Principales caracteristiques numeriques des variables alea
toires et leurs analogues empiriques 106
5.6.1. Notion d'esperance mathematique et de moment . . 107
5.6.2. Caracteristiques du centre de groupement des valeurs
de la variable aleatoire 109
5.6.3. Caracteristiques du degre de dispersion d'une variable aleatoire 112
5.6.4. Serie variationnelle et statistiques de rang .... 114
5.6.5. Quantiles et points de pourcentage d'une repartition 117
5.6.6. Dissymetrie et aplatissement 118
5.6.7. Principales caracteristiques des repartitions multi-dimensionnelles (covariance, correlation, variance generalisee, etc.) 120
Conclusions 123
CHAPITRE 6. Les lois de probabilite modeles les plus couramment uti-
lisees dans les recherches statistiques 126
6.1. Lois de probabilite servant a decrire les mecanismes de pro
cessus ou de systemes reels 126
6.1.1. Lois decrivant une suite d'epreuves de Bernoulli:
la loi binomiale et la loi binomiale negative . . . 126
6.1.2. Loi hypergeometrique 129
6.1.3. Loi de Poisson 131
6.1.4. Loi polynomiale 132
6.1.5. Loi normale (de Gauss) 133
6.1.6. Loi lognormale 137
6.1.7. Loi uniforme (rectangulaire) 141
6.1.8. Loi de Weibull et loi exponentielle 143
6.1.9. Loi de Pareto 147
6.1.10.Loi deCauchy 147
6.1-ll.Quelques combinaisons des principales lois de pro
babilite modeles utilisees en statistique appliquoe 148
6.2. Lois de probabilite utilisees dans les calculs statistiques . . 150
6.2.1. Loi du ?2 150
6.2.2. Loi t de Student 153
6.2.3. Loi F (loi du rapport dispersionnel) 154
6.2.4. Remarque sur les lois non centrees du ?2, F et t . . 157
6.2.5. Loi gamma 157
6.2.6. Loi beta 158
6.3. Technique de simulation statistique d'observations suivant
une loi donnee 160
6.3.1. Generation de nombres aleatoires uniformement re-partis sur l'intervalle [0, 1] 160
6.3.2. Simulation des variables aleatoires discretes. Me-thode standard 162
6.3.3. Simulation de lois continues 163
Conclusions 165
CHAPITRE 7. Resultats fondamentaux de la theorie des probabilites . 184
7.1. Inegalite de Tchebychev 184
7.2. Propriete de stabilite statistique des caracteristiques empi-riques : loi des grands nombres et see consequences 185
7.2.1. Loi des grands nombres 186
7.2.2. Theoreme de J. Bernoulli 187
7.2.3. Stabilite statistique des caracteristiques empiriques 187
7.3. Role particulier de la loi normale: theoreme limite central 189
7.3.1. Theoreme limite central 190
7.3.2. Theoreme limite central multidimensionnel .... 190
7.4. Loi de probabilite de variables aleatoires qui sont fonctions de variables aleatoires connues 193
Conclusions 197
TROISIEME PARTIE. ELEMENTS DE STATISTIQUE МАТНЁМА-TIQUE 199
CHAPITRE 8. Estimation statistique des parametres 199
8.1. Notions preliminaires d'estimation statistique des
parametres … 200
8.1.1. Position du probleme 200
8.1.2. Statistiques, estimations statistiques et leurs principals proprietes 201
8.1.3. Estimation convergente 202
8.1.4. Estimation sans biais 202
8.1.5. Estimation efficace 204
8.2. Fonction de vraisemblance. Quantite d'information con-tenue dans n observations independantes par rapport a la valeur inconnue du parametre 206
8.3. Inegalite de Rao-Cramer-Frechet et mesure de l'efficacite des estimations 208
8.4. Proprietes asymptotiques des estimations 212
8.5. Notion d'estimation par intervalles. Construction des regions de confiance 214
8.6. Methodes d'estimations statistiques des parametres inconnus 215
8.6.1. Methode du maximum de vraisemblance 215
8.6.2. Methode des moments 223
8.6.3. Methode des moindres carres 226
8.6.4. Estimation par les statistiques " ponderees "; censure, troncature des echantillons et statistiques de rang
comme cas particulier de ponderation 231
8.6.5. Construction des intervalles de confiance (regions de
confiance) 235
8.6.6. Approche bayesienne de Г estimation statistique . 239
Conclusions……………………………………………………….. 242
CHAPITRE 9. Test d'hypotheses statistiques 245
9.1. Principaux types d'hypotheses testees 245
9.1.1. Hypotheses relatives au type de loi de probabilite de
la variable aleatoire etudiee 245
9.1.2. Hypotheses d'homogeneite de deux ou plusieurs echantillons ou de certaines caracteristiques des populations analysees 246
9.1.3. Hypotheses concernant les valeurs numeriques des parametres de la population generale etudiee 247
9.1.4. Hypotheses concernant le type de dependence entre les composantes de la variable multidimensionnelle
etudiee 247
9.1.5. Hypotheses concernant Г independence et la station-narite des observations traitees 248
9.2. Principe logique general d'un test statistique 248
9.3. Construction d'un test statistique; principe du rapport de
vraisemblance . 250
9.3.1. Essence du principe du rapport de vraisemblance . 251
9.3.2. Test d'une hypothese simple par le logarithme du rapport de vraisemblance 253
9.3.3. Test d'une hypothese multiple 254
9.4. Criteres de " qualite " d'un test statistique 254
9.5. Procedure sequentielle de prise de decision (tests sequentiels) 257
9.5.1. Procedure sequentielle d'observation 257
9.5.2. Test sequentiel du rapport de vraisemblance (test de Wald) et ses proprietes 258
9.5.3. Test sequentiel generalise entre hypotheses multiples 260
Conclusions 262
QUATRIEME PARTIE. TRAITEMENT STATISTIQUE PRIMAIRE
DES DONNEES 264
CHAPITRE 10. Statistique descriptive 264
10.1. Dossier de l'analyse; introduction et memorisation des don
nees ; inspection des donnees 264
10.1.1. Dossier d'etude 264
10.1.2. Introduction et stockage des donnees 265
10.1.3. Inspection des donnees 265
10.2. Echelles de mesuros 266
10.2.1. Echelle nominale 267
10.2.2. Echelle ordinale 267
10.2.3. Echelles quantitatives 268
10.2.4. Unification des donnees 269
10.3. Lois empiriques 271
10.3.1. Histogramme . . . 271
10.3.2. Estimations non parametriques de la densite . . . 273
10.3.3. Estimation de la fonction de repartition 273-
10.3.4. Transformation des variables 274
10.3.5. Tableaux de contingence 275
10.4. Estimation des parametres de localisation et d'echelle . . 276
10.4.1. Position du probleme 276
10.4.2. Estimation des parametres de la loi normale . . . 277
10.4.3. Methode graphique d'estimation 277
10.4.4. Stabilite des estimations pour de petits ecarts de la repartition par rapport a la normale 278
10.4.5. Estimation de la position du centre des lois symetri-ques 280
10.4.6. Parametrisation a l'aide des estimations exponen-
tiellement ponderer (EEP) 282
10.5. Visualisation des donnees multidimensionnelles 285
10.5.1. Position du probleme 285
10.5.2. Composantes principales 287
10.5.3. Proprietes de la plus petite deformation de la structure geometrique
des composantes principales 289
10.5.4. Applications non lineaires dans un espace de moindre dimension 290
10.5.5. Analyse des proximites lineaire 293
Conclusions 294
CHAPITRE 11. Analyse preliminaire de la nature des donnees .... 297
11.1. Test d'ajustement du modele de loi choisi avec les donnees
initiales 297
11.1.1. Test du ?2 de Pearson 298
11.1.2. Test de la normalite dI'une repartition d'apres son coefficient de dissymetrie, son coefficient d'aplatis-sement et ses ecarts moyens 300
11.1.3. Test de Kolmogorov-Smirnov et son application a la
construction de la region de confiance pour la foaction
de repartition inconnue 304
11.1.4. Test du со2 (Cramer-Mises-Smirnov) 306
11.1.5. Modifications des statistiques des tests de Kolmo-gorov-Smirnov et du ?2 pour Les echantillons de petite taille 306
11.1.6. Technique statistique de realisation pratique des
tests non parametriques 307
11.1.7. Application des tests de Kolmogorov et du со2 pour
verifier la normalite d'une fonction de repartition
dependant de parametres inconnus 308
11.2. Test des hypotheses d'homogeneite et de symetrie d'une re
partition 310
11.2.1. Tests d'homogeneite bases sur les fonctions de repartition empiriques 310
11.2.2. Test d'homogeneite du ?2 314
11.2.3. Tests de rang d'homogeneite 315
11.2.4. Test non parametrique de l'hypothese d'egalite des variances 319
11.2.5. Tests de rang pour k > 2 321
11.2.6. Test de symetrie des repartitions 322
11.2.7. Traitement des coincidences 324
11.2.8. Test d'homogeneite des populations normales (cas scalaire) 326
11.2.9. Test d'homogeneite de populations normales multi-dimensionnelles 329
11.3. Test d'independance et de stationnarite d'une serie d'obser-
vations 332
11.3.1. Test des blocs, base sur la mediane de l'echantillon 332
11.3.2. Test des series " ascendantes " et " descendantes " 334
11.3.3. Test des carres des differences sequentielles (test d'Abbe) 335
11.4. Methodes de traitement statistique des donnees manquantes 336
11.4.1. Estimation des parametres inconnus en cas d'obser-vations manquantes 337
11.4.2. Utilisation des composantes principales 339
11.4.3. Reconstitution des donnees manquantes et estimation des parametres par la methode du maximum de vraisemblance. Estimations du " point fixe " 340
11.4.4. Methode non parametrique d'estimation des donnees
manquantes 343
11.5. Analyse des observations anomales 344
11.5.1. Position du ргоЬІадіе 344
11.5.2. Methodes graphiques 345
11.5.3. Methode analytique d'exclusion d'une observation extreme 346
11.5.4. Test analytique d'elimination simultanee de plusieurs
observations extremes 346
Conclusions 347
oCHAPITRE 12. Logiciel de la statistique appliquee et quetques problemes
relatifs a la technique de calcul 350
12.1. Logiciel de la statistique appliquee 350
12.1.1. Organisation des paquets de programmes 351
12.1.2. Problemes d'organisation et possibilites de gestion
des donnees 353
12.1.3. Methodes de traitement preliminaire (manipulation)
des donnees 355
12.1.4. Traitement des donnees manquantes 355
12.1.5. Traitement primaire des donnees qualitatives . . 357
12.1.6. Methodes de visualisation des donnees 359
12.1.7. Estimation des parametres et localisation des observations
anomales 360
12.2. Calcul des functions de repartition et de leurs inverses . . . 361
12.2.1. Loi normale 362
12.2.2. Loi du ?2 364
12.2.3. Loi beta 366
12.2.4. Loi de Fisher 367
12.2.5. Loi t de Student 367
12.2.6. Lois non centrees 368
12.2.7. Approximation des ailes des lois de type ?2 . . . 369
12.2.8. Loi normale multidimensionnelle 370
12.2.9. Lois discretes 373
12.2.10. Calcul de l'esperance mathemalique des statistiques de rang 373
Conclusions 375
Notations 375
Observations primaires 375
Notions de theorie des probabilites 376
Notions de statistique mathematique 377
Bibliographie 378
Index terminologique 384
|