Dans des recherches de type expérimental, on peut souvent individualiser des sous-systèmes caractérisés par deux ou plusieurs groupes de variables qui jouent des rôles différents. Des approches comme la corrélation canonique de Hotteling (1936) et ses généralisations de Carrol (1968) et Ketterning (1971) ne s'adaptent pas, puisque la symétrie entre les groupes de variables peut ne pas être toujours justifiée; il est plus vraisemblable qu'un groupe de variables se trouve à la base du comportement d'un autre ou des autres. La résolution des problèmes des relations de type asymétrique, en ce qui concerne la présence de deux groupes de variables de type quantitatif, a été introduit par Rao (1964) dans le cadre de la régression multivariée. D'autres proposition ont été formulées avec différentes approches: par exemple, Wollenberg (1977) en maximisant l'indice de redondance de Stewart-Lowe; Robert et Escoufier (1976) par le coefficient RV; Sabatier (1983,1987) avec la recherche d'une métrique qui minimise l'inertie intra-factorielle; Schektman et al. (1984); D'Ambra et Lauro (1982, 1983) dans un contexte de type géométrique pour des données quantitatives et qualitatives et étudient par la suite (1988) un tableau de contingence à deux ou trois voies. Dans une approche équivalente, Lebart (1979), avait déjà employé la technique des points supplémentaires qui consiste en la projection, à posteriori dans le sous-espace vectoriel associé au deuxième sous-système, des variables du sous-système dont on veut expliquer le comportement. Cette approche présente l'inconvénient de ne pas considérer la structure de corrélation entre les deux ensembles. Si on envisage une Analyse en Composantes Principales qui considère une structure factorielle sur les unités statistiques (vue comme information à priori). Nous proposons d'introduire, dans ce contexte, des techniques de validation susceptibles de tester la significativité des différents facteurs structurant à priori. Dans la première partie du rapport, après avoir introduit des notions de base et avoir précisé la notation qui sera utilisée dans la suite, on abordera la problématique de l'Anova en termes de projecteurs, dans laquelle les décompositions de l'espace de référence par les facteurs seront mises en évidence. Dans la deuxième partie, on introduira deux techniques factorielles de type asymétrique: l'Analyse en Composantes Principales par rapport à Variables Instrumentales et l'Analyse Factorielle des Correspondances par rapport à Variables Instrumentales et on montrera comment ces deux techniques permettent d'introduire des opérateurs de produits scalaires entre les unités statistiques qui tiennent compte d'une structure factorielle de type Anova. Le choix d'une métrique qui minimise l'inertie intra-factorielle permettra de retrouver des réultats classiques de Manova. Dans la trosième partie on abordera la problématique de la validation factorielle à un ou à deux facteeurs orthogonaux et non-orthogonaux, soit dans le domaine de l'Anova soit dans le domaine de l'Acpvi. Dans ce contexte, on proposera des algorithmes pour les différents types de structure qu'il faut considérer.

Analyse factorielles et tests de permutation - Mémoire de stage de Diplome d'Ecole Advancée (DEA) en Biostatistiques - options Statistique Mathematiques

AMENTA P
1991-01-01

Abstract

Dans des recherches de type expérimental, on peut souvent individualiser des sous-systèmes caractérisés par deux ou plusieurs groupes de variables qui jouent des rôles différents. Des approches comme la corrélation canonique de Hotteling (1936) et ses généralisations de Carrol (1968) et Ketterning (1971) ne s'adaptent pas, puisque la symétrie entre les groupes de variables peut ne pas être toujours justifiée; il est plus vraisemblable qu'un groupe de variables se trouve à la base du comportement d'un autre ou des autres. La résolution des problèmes des relations de type asymétrique, en ce qui concerne la présence de deux groupes de variables de type quantitatif, a été introduit par Rao (1964) dans le cadre de la régression multivariée. D'autres proposition ont été formulées avec différentes approches: par exemple, Wollenberg (1977) en maximisant l'indice de redondance de Stewart-Lowe; Robert et Escoufier (1976) par le coefficient RV; Sabatier (1983,1987) avec la recherche d'une métrique qui minimise l'inertie intra-factorielle; Schektman et al. (1984); D'Ambra et Lauro (1982, 1983) dans un contexte de type géométrique pour des données quantitatives et qualitatives et étudient par la suite (1988) un tableau de contingence à deux ou trois voies. Dans une approche équivalente, Lebart (1979), avait déjà employé la technique des points supplémentaires qui consiste en la projection, à posteriori dans le sous-espace vectoriel associé au deuxième sous-système, des variables du sous-système dont on veut expliquer le comportement. Cette approche présente l'inconvénient de ne pas considérer la structure de corrélation entre les deux ensembles. Si on envisage une Analyse en Composantes Principales qui considère une structure factorielle sur les unités statistiques (vue comme information à priori). Nous proposons d'introduire, dans ce contexte, des techniques de validation susceptibles de tester la significativité des différents facteurs structurant à priori. Dans la première partie du rapport, après avoir introduit des notions de base et avoir précisé la notation qui sera utilisée dans la suite, on abordera la problématique de l'Anova en termes de projecteurs, dans laquelle les décompositions de l'espace de référence par les facteurs seront mises en évidence. Dans la deuxième partie, on introduira deux techniques factorielles de type asymétrique: l'Analyse en Composantes Principales par rapport à Variables Instrumentales et l'Analyse Factorielle des Correspondances par rapport à Variables Instrumentales et on montrera comment ces deux techniques permettent d'introduire des opérateurs de produits scalaires entre les unités statistiques qui tiennent compte d'une structure factorielle de type Anova. Le choix d'une métrique qui minimise l'inertie intra-factorielle permettra de retrouver des réultats classiques de Manova. Dans la trosième partie on abordera la problématique de la validation factorielle à un ou à deux facteeurs orthogonaux et non-orthogonaux, soit dans le domaine de l'Anova soit dans le domaine de l'Acpvi. Dans ce contexte, on proposera des algorithmes pour les différents types de structure qu'il faut considérer.
File in questo prodotto:
File Dimensione Formato  
DEA_TESI.pdf

non disponibili

Licenza: Non specificato
Dimensione 413.06 kB
Formato Adobe PDF
413.06 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12070/14356
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact