Claude Deniau : « Statistiques et sciences sociales »

samedi 20 décembre 2008
popularité : 1%

Résumé de l’exposé

Cette expérience, vécue a l’université de Paris V, date des années 70. Suite à l’exposé de P.Verges et à partir de la dite expérience, je vais essentiellement me concentrer sur les statistiques du point de vue des enseignements et de la recherche en liaison avec les Sciences Sociales (j’exclus moi aussi l’économie de ma liste, car à ce moment là elle était étrangère à mes pratiques). Enseignements. L’Université de Paris V a été pilote pour une introduction de programmes de mathématique volumineux dans la formation des étudiants en sciences sociales (à cette époque on parlait de sciences humaines). La statistique (descriptive ou inférentielle) tenait un rôle essentiel dans cette formation. Indépendamment des DEUG-MASS (assez ambitieux) qui pouvaient conduire les étudiants vers des second cycles de sciences humaines (essentiellement la psychologie, la sociologie, la géographie et ensuite l’économie) ou MASS, existait un enseignement de math. ; destiné aux étudiants en DEUG de sciences humaines, organise en commun avec les disciplines concernées. Ces enseignements étaient suivis, en second cycle de sciences humaines, par des cours assez spécialisés, de bon niveau mais adaptés à un public non mathématicien. Ces collaborations pédagogiques débouchaient parfois sur des collaborations scientifiques comme la mise en place de séminaires méthodologiques, des codirections de thèse et des travaux de recherche rassemblant mathématiciens et géographes par exemple.

Les méthodes

Années 70

Les outils statistiques et probabilistes (appliques) utilisés au cours des années 70 dépendaient des disciplines. L’analyse des données (méthodes factorielles et de classification) sous l’impulsion de J.P.Benzecri et de son laboratoire tenait une place importante dans la plupart des disciplines et permettait de nombreuses avancées méthodologiques....qui conduisaient parfois à des dérives dont j’ai parlé au cours de mon exposé. C’est en psychologie expérimentale que les méthodes stochastiques jouaient le rôle le plus important. Les travaux de recherche de cette discipline s’appuyaient par exemple sur l’analyse de la variance , les chaînes de Markov (sur le plan inférentiel) mais aussi sur les méthodes descriptives d’analyse des données toujours avec le souci de validation lie aux pratiques expérimentales. La psychologie expérimentale a contribué au développement de certaines méthodes statistiques, probabilistes et informatiques comme par exemple :

- L’analyse de la variance (comme méthode de planification expérimentale).
- Les méthodes factorielles d’analyse des données (inspirées de l’analyse factorielle des psychologues).
- La reconnaissance des formes (dont de nombreux algorithmes sont liés à la psychologie expérimentale).
- Algorithmes stochastiques ( certains inspirés des processus d’apprentissage).

Actuellement.

Il semble que les rôles des mathématiques et de la statistique en particulier se soient réduits ces dernières années dans les sciences sociales. Je reprends d’une part les affirmations de P.Verges et d’autres de collègues chercheurs de différentes disciplines car je ne suis plus directement « dans le coup ». Par exemple, il semble qu’en géographie et en sociologie le nombre d’utilisateurs d’outils mathématiques connaisse un important recul (pourtant des logiciels sont maintenant performants et conviviaux) et que l’écart entre l’économie et ces sciences sociales se soit creusé. Dans ces disciplines, sur le plan statistique l’inférence joue maintenant un rôle plus important par l’intermédiaire des modèles logit, de la régression logistique,... de même que sont utilisées les méthodes « à la mode » comme les réseaux neuronaux, les fractals,... Dans les années 70-85 la communauté statistique n’appréciait et ne valorisait pas toujours les collaborations « Mathématiques-Sciences Sociales » basées sur les méthodologies orientées analyse des données. L’évolution de la recherche dans ces disciplines statistiques (qui ont joué un rôle important dans certaines sciences sociales) a conduit des probabilistes, des théoriciens de la statistique et des informaticiens à s’intéresser conjointement a l’évaluation à la validation et au développement de certaines techniques d’analyse des données comme les méthodes de classification connues à l’origine sous le nom de segmentation ou celles de discrimination.

Quelques références bibliographiques (recherche).

Les années 70.

C’est le début de l’analyse des données au sens français (assez restrictif) comme au sens anglo-saxon du terme. Voici un petit échantillon d’ouvrages méthodologiques ayant joue un rôle important au cours de cette période.

- Benzécri J.P. L’analyses des données .(deux tomes) Dunod (1973).
- Box G.E.P, Jenkins G. Time Series Analysis Forecasring and Control. Holden-Day (1969).
- Sheffe W. The Analysis of Variance . Wiley (1959)
- Tuckey J.W.Exploratory Data Analysis .Addison Wesley (1977).

Les années 90.

L’inférence gagne les méthodes d’analyse des données au sens français. Les idées et les méthodes présentées dans ces livres sont en vogue actuellement dans les sciences sociales et économiques.

- Dacunha-Castelle D. Les chemins de l’aléatoire. Flammarion (1996).
- Efron B., Tibshirani R.J. An introduction to Bootstrap. Chapman-Hall (1993).
- Hardle W. Applied nonparametric regression. Cambridge U.P. (1991).
- Hastie T.J., Tibishrani T.J. Generalized Additive Models. Chapman-Hall (1990).
- Lebart L., Morineau A., Piron M. Statistique Exploratoire Multidimensionnelle. Dunod (1995).
- McCullagh P., Nelder J.A. Generalized Linear Models . Chapman-Hall (1993).   

Discussion suivant l’exposé de Claude Deniau

Un des points de la discussion qui a suivi l’exposé de Claude Deniau a été l’attitude des statisticiens dans ces années 60-70, (notamment Ben Zekri) qui poursuivait la recherche d’une vision géométrique de l’analyse des données et qui délibérément voulaient éviter le recours aux modèles.

A été également souligné combien le problème reste actuel de ce que trop souvent les utilisateurs ne s’interrogent pas sur la pertinence des méthodes et des outils et seuls les statisticiens s’intéressent à la validation.

Par ailleurs le fait a été rappelé que les pistes d’utilisation des mathématiques telles que par exemple l’algèbre (groupes, groupes finis, treillis) pour reproduire la parenté avaient été abandonnées.

Parallèlement dans l’enseignement universitaire de la sociologie seule l’analyse des correspondances est enseignée. Or il est important de montrer aux étudiants que les statistiques ne sont pas la seule partie des mathématiques utilisées en Sciences Humaines.