Article body

Introduction

À condition de s’en expliquer, la pénurie de prises de position théoriques en matière d’évaluation en éducation pourrait se révéler un faux problème ; il est possible même d’avancer qu’un corps théorique important a été constitué dans ce domaine, au cours de cet « intersiècle » écoulé. Certes éclaté, à l’image de l’évolution des sciences sociales dans leur ensemble, ce corps théorique ne s’est pas nettement affirmé ni revendiqué en tant que tel. C’est cette idée que l’auteur a l’intention de soutenir plutôt que de retomber dans un débat marxien opposant nécessité de théorie et nécessité de pratique, idéalisme et matérialisme.

En effet, comment expliquer l’abondance et la virulence de critiques qui se manifestent de manière endémique vis-à-vis des pratiques d’évaluation généralisées par les institutions et les entreprises, aujourd’hui, sinon par le manque de clarté du message d’ensemble que délivrent les décideurs, les spécialistes et même les chercheurs, en ce qui concerne la description et l’explication de leur objet ? Ces critiques, émanent aussi bien de la presse (2013[1]), que de publications diverses qui dénoncent les défauts de l’évaluation, ses dérives, ses dangers, tant du point de vue psychanalytique que du point de vue politique. En témoigne ce colloque de psychologues ayant pour thème « l’évaluation, culture de mort » comportant le point d’orgue suivant : « l’évaluation est un négationnisme de l’être qui vise l’effet goudron et plumes, c’est-à-dire l’humiliation » (Pfauwadel, 2010). En témoigne, aussi, cette critique de Del Rey (2013) : « le rationalisme évaluateur, véritable tyrannie du visible et de l’explicite, manifeste un processus de déterritorialisation de la mesure et du jugement présents dans l’évaluation » (p. 9). Ces diatribes, parmi d’autres, ainsi que les échos qu’elles suscitent dans les milieux de l’éducation et de la formation montrent que, si l’on juge aussi mal l’évaluation comme pratique sociale et même cognitive, c’est peut-être que les concepts employés pour la justifier ne sont pas clairs et, en tous cas, ne sont pas compris du public, faute de discours théorique construit et cohérent.

L’évaluation en éducation ne disposerait donc pas de fondements lisibles et ne serait pas légitimée par une théorie reconnue ? La question vaut, au moins, d’être posée même si seule une réponse aporétique peut lui être apportée, opposant et reliant, à la fois, la tentation technicienne (Ellul, 2012) qui gouverne souvent les pratiques évaluatives spontanées, et l’aspiration à une théorie de l’évaluation (émergente mais rarement réalisée), génératrice de sens. Pour développer cette aporie et tenter, sinon de la résoudre, au moins de la neutraliser, le présent article partira de l’évaluation technicienne et de ses hésitations entre « auto-nomie » et « maîtrise technologique ». Il posera, en contrepoint, une certaine avancée de la « pensée théorique » qui se construit autour de l’évaluation, en questionnant les écrits de chercheurs qui, faute de « théorie générale », s’efforcent de construire des « théorisations ». Enfin, une dernième partie cherchera une voie de sortie de l’aporie soulignée d’entrée de jeu, entre système technicien et pensée théorique, en établissant le postulat d’une « préthéorie » de l’évaluation constituée de configurations de plus en plus organisées. Le problème des relations entre théorie et pratique posé ici est tellement large qu’il paraît difficile de faire une grande différence, dans cette réflexion tout au moins, entre les applications variées de l’évaluation : aux compétences, aux apprentissages, aux programmes, etc.

L’évaluation technicienne

Évaluation et « système technicien »

La pratique évaluative, dans son contexte scolaire et éducatif, a, de tout temps, utilisé des instruments d’observation ou d’enquête considérés comme des allants de soi. Mais, à la faveur du développement des supports numériques de traitement de l’information, un bouleversement progressif du travail de l’évaluateur s’est manifesté, passant du traitement manuel au traitement informatique, puis du traitement classique des données à des formes de traitement de plus en plus sophistiquées, comme en témoignent des numéros de la revue Mesure et évaluation en éducation des années 2000 (par ex., Lafontaine & Simon, 2008 ; le numéro thématique Méthodologie de la mesure, 2008[2]). Les contenus de ces publications ouvrent des perspectives importantes au développement de techniques nouvelles, comme celle résultant de l’adoption des Modèles de réponse aux items (Glas, 2008) souvent citée. Elles montrent la variété des choix méthodologiques disponibles aujourd’hui pour mesurer et tester les phénomènes éducatifs (apprentissages, acquisition de compétences, efficacité des écoles et des dispositifs, etc.). Il est possible de voir ainsi, chez Lafontaine et Simon (2008), au nom de quelles logiques se construisent les choix méthodologiques prévalant dans les différentes enquêtes internationales de comparaison du niveau des élèves, comme PISA (pour ne rappeler que le dispositif le plus connu). Par exemple, les auteurs expliquent comment, pour des raisons de commodité de traitement quantitatif, il faut parfois enfermer des réponses construites à des questions ouvertes dans des catégories de réponses limitées au moyen de sous-échelles et même transposables dans des formulations de type QCM. En poursuivant cette lecture, d’article en article, il est possible d’intégrer un univers de plus en plus technicien, au sens qu’Ellul (2012) donne à ce mot, c’est-à-dire de plus en plus régi par un véritable système qui organise l’activité d’évaluation (comme d’autres activités humaines et sociales) autour du développement des techniques.

Quant à Martin et Blais (2011), en analysant les changements produits par l’introduction de tests assistés par ordinateur dans les enquêtes internationales de l’OCDE, ils émettent, parmi leurs critiques, celle de l’insuffisance de « modèles de mesure adéquats » (p. 109) pour interpréter les réponses obtenues. Il existerait, selon eux, un « risque d’introduire, d’une manière précoce, des mesures qui paraissent réalisables et innovantes, d’un point de vue technique ... mais en négligeant … le point de vue psychométrique … et la compréhension théorique des processus cognitifs … impliqués » (p. 109). Les auteurs illustrent très clairement, par leurs propos, la dérive possible que fait courir à l’évaluation en général la technicisation progressive qui la gagne, si cette dernière se développe selon une logique qui lui est propre et sans aucun lien avec un cadre qui la gouverne. La posture radicale qu’Ellul (2012) avait prise, en son temps, a été de dénoncer l’emprise progressive du « système technicien » qui, selon lui, vit à l’intérieur de la société, la pilote, la dirige, la transforme, en même temps qu’il « s’auto-engendre ». Cette idée a été peu relayée par la suite, mais elle reste, selon l’auteur, étonnamment moderne, dans le contexte de l’explosion informatique et de son introduction systématique dans les activités professionnelles et sociales. Elle a cependant été étudiée par Latour (2010) qui pointe « l’autonomie » acquise par la technique : « Certaines techniques finissent par envahir tout l’horizon des fins en se donnant à elles-mêmes leurs propre lois, en devenant auto-nomes et non plus seulement automatiques » (p. 15).

Les technologues étant tentés de se transformer en évaluateurs par la magie de l’instrument sophistiqué qu’ils peuvent créer, de toutes pièces, au service d’une activité de formation individualisée ou à distance, il en résulte, de façon évidente, ici, la dérive que constitueraient des pratiques évaluatives pilotées par la technique.

Technique et théorisation

Mais, pour parodier certains dictons, il est possible de dire que la « technique de l’évaluation » est par ailleurs un objet trop important pour être laissé aux seuls techniciens. Des voies de théorisation y sont déjà ouvertes par le biais de tentatives de couplage entre technique et activité humaine.

L’« objet technique » évaluatif

Ainsi, avec le concept d’objet technique (Simondon, 1958/2001), des auteurs comme Albero (2010) dépassent la technophobie d’Ellul (2012) en proposant une « approche sociotechnique des environnements de formation » qui peut éclairer différemment le débat sur la place de la technique dans l’instrumentation de l’évaluation. Cette théorisation définit, en effet, le recours à la technique non seulement comme « fonctionnel », mais aussi dans « son interdépendance avec l’activité humaine ». La technique est devenue « technologie », c’est-à-dire « une relation organique entre la technè (relative aux outils et savoir-faire spécifiques) et le logos en tant que connaissance rationnelle » (Albero, 2010, p. 7). Tout se passe comme si, faute d’une théorie générale, on pouvait se retourner vers une théorie technique de l’évaluation.

Le dispositif évaluatif

Ainsi, la proposition d’Albero (2010) concernant la conception de l’objet technique offre une autre manière de théoriser l’évaluation technicienne. En effet, il est possible d’importer sa conceptualisation du « dispositif » (anciennement défini comme une « organisation rationnelle de moyens » et devenant une « construction interdépendante de sujets et d’objets déterminée par les modèles des concepteurs mais aussi par ceux des utilisateurs » (p. 9). Dans ce sens, appliqué au sujet traité, un dispositif d’évaluation peut être d’abord conçu, lui aussi, comme un « dispositif idéel » (comportant des « idées, modèles et valeurs »), prenant la forme d’un « dispositif fonctionnel » (gérant la mise en pratique de la planification et de l’instrumentation) pour s’intégrer dans un « dispositif vécu » (correspondant à « l’expérience personnelle des différents acteurs »). Mais une telle théorisation du dispositif d’évaluation ne pourrait faire progresser vers le dépassement de l’aporie initiale de notre propos qu’à condition que se réalise le couplage envisagé entre technique et activité humaine, c’est-à-dire, dans ce cas, l’interrelation entre idéel et fonctionnel, entre fonctionnel et vécu et entre vécu et fonctionnel. Mais ce travail d’analyse, selon l’auteur, reste à faire.

La conclusion d’un débat sur l’approche technicienne versus sociotechnique d’une conception de l’évaluation amène à reconnaître que l’opposition pratique/théorie qui avait été mise en scène conduit, pour l’instant, à un non-lieu : les évaluateurs tentés par la technicité des nouveaux outils qui apparaissent sur leurs écrans ne sont invités qu’à recourir à des microthéorisations accumulées ou successives. Ce n’est pas dans ces espaces très spécifiques que pourra se trouver, selon l’auteur, l’émergence d’une théorie générale de l’évaluation.

À la recherche des traces d’une pensée théorique de l’évaluation

Des pensées théoriques sur l’évaluation ont toujours existé

Les travaux qui ont fondé la psychométrie ou construit ce qui a été appelé « docimologie », comme les nombreux écrits ayant jalonné l’histoire récente de l’évaluation des apprentissages ainsi que celle de l’évaluation de programme (et des recherches qui les ont observées), se sont appuyés sur des théories comme celles, classiques, de la mesure, complétées par la théorie de la généralisabilité, reprise par Cardinet (1997) puis par Laveault et Grégoire (2002). D’autres théorisations ont été empruntées à la psychologie cognitive (en ce qui concerne la mesure des résultats des apprentissages ainsi que les phénomènes décrivant l’évaluation formative ou relevant de la métacognition), à la psychologie sociale (en ce qui concerne le fonctionnement du jugement évaluatif), à la sociologie (en ce qui concerne l’influence des déterminismes sociaux dans la mesure de la réussite scolaire)[3] ou encore à l’analyse ethnographique des parcours aboutissant à des validations d’acquis et de compétences, à l’évaluation de programme elle-même qui a donné lieu sinon à des théorisations spécifiques, du moins à de nombreuses études sur les liens entre théorie et pratique passées en revue, par ailleurs, dans différents articles de cette livraison (par ex., Christie, 2003 ; Mark, 2003 ; et d’autres). Mais ces théorisations (qu’il est impossible de citer ici de manière exhaustive), pour puissantes qu’elles aient été, ne constituent pas et n’ont pas prétendu constituer, même mises bout à bout, une théorie d’ensemble de l’évaluation.

Des publications ont déjà argumenté en faveur d’une plus grande théorisation de l’évaluation

Des travaux aujourd’hui connus ont ouvert la voie : peut-être peu nombreux, souvent collectifs, ils ont néanmoins émis l’idée que les pratiques d’évaluation sont redevables d’un recours à des théorisations (Shadish, Cook, & Leviton, 1991, déjà cités et commentés par Tourmen et Droyer, dans ce numéro), à des recherches contributives (Figari & Mottier Lopez, 2006), et même, à une appartenance disciplinaire (Dubois & Marceau, 2005). Une fois ces publications rassemblées et adjointes à quelques autres qui s’orientent dans le même sens (par ex., Chen, 1990), il devient évident qu’un nombre progressivement plus important d’auteurs acceptent de se prêter à un débat sur la nature scientifique des activités d’évaluation. Enfin, le présent numéro thématique de Mesure et évaluation en éducation prend l’initiative de provoquer une réflexion sur le nécessaire rééquilibrage entre théorie et pratique en matière d’évaluation de programme. On peut donc (on doit même) enfin, ici, traiter de théorie : qu’elle soit « académique », « spontanée » ou « générale », comme Tourmen la décline dans cette livraison. Une définition générale de ce qui pourrait être appelé théorie de l’évaluation n’ayant pas encore été énoncée, la littérature est souvent en présence de démarches intellectuelles consistant à conceptualiser les processus d’évaluation. Ainsi, par exemple, celle qui consiste à en repérer, sinon des lois, du moins des régularités caractéristiques, à les relier avec des phénomènes relevant de situations éducatives d’apprentissage, de fonctionnement de systèmes ou de dispositifs et, enfin, à tenter de les expliquer à travers des lectures interprétatives utilisant des modèles et des méthodes scientifiques reconnues des sciences humaines et sociales. De telles approches théoriques ont inspiré et inspirent certains travaux sur l’évaluation en éducation, mais il est vrai que les auteurs concernés n’ont pas fréquemment considéré ces lectures comme relevant d’une théorisation spécifique, donnant plutôt à voir une interprétation scientifique, souvent monodisciplinaire, des données recueillies à l’occasion d’activités d’évaluation. Il est possible de trouver des exemples caractéristiques de ce type de travaux dans les nombreuses thèses de doctorat de psychologie et de sociologie.

Les traces d’une théorie sont repérables chez les auteurs

Ces préalables étant posés, il semble possible, maintenant, de rassembler des traces de constructions théoriques ayant pour vocation d’expliquer le fonctionnement, répété et en boucle, de nombreux processus d’évaluation, et de les configurer autour d’un schéma organisateur qui en ferait apparaître la continuité théorique d’ensemble.

Ce parti étant pris, posons que trois éléments émergent de la littérature spécialisée de ces 20 dernières années comme étant aptes à favoriser une théorisation de l’évaluation :

  1. un carrefour de disciplines de sciences sociales s’est nettement constitué autour de l’évaluation en éducation comme objet d’étude et de son organisation autour d’un noyau dur interdisciplinaire ;

  2. l’élément catalyseur d’un phénomène fondateur est en place : celui de la mesure (avec ses modèles et ses méthodes), recourant aux nouvelles technologies informatiques ;

  3. il apparaît une configuration de paradigmes construits tout au long des travaux sur l’évaluation et qui ont contribué à théoriser, progressivement, peu ou prou, les processus en question.

Les traces de ces trois éléments constitutifs, selon l’auteur, d’une théorisation de l’évaluation vont être recherchées dans les travaux publiés dans des recueils clairement identifiés comme participant à une étude des phénomènes liés à l’évaluation, auprès d’auteurs appartenant à une communauté de chercheurs connus dans ce champ. Dans cette perspective, l’auteur se limitera à convoquer, parmi eux, des contributeurs à trois ouvrages (ou publications) récents : Recherches sur l’évaluation en éducation (édité par Figari & Mottier Lopez, 2006) ; Modélisations de l’évaluation en éducation (édité par Mottier Lopez & Figari, 2012) ; Un état des lieux théoriques de l’évaluation : une discipline à la remorque d’une révolution scientifique qui n’en finit pas (Dubois & Marceau, 2005).

L’objet d’étude « évaluation » observé à partir d’un carrefour de disciplines de sciences sociales

Tout d’abord, un lot important de travaux ayant marqué un intérêt manifeste à l’évaluation est constitué par des études prenant origine dans les sciences cognitives et sociales. C’est ainsi que se retrouvent, en effet, successivement :

  • dans la sphère cognitive : la psychologie cognitive, la psychologie des apprentissages dont les disciplines constitutives contribuent à théoriser l’évaluation des phénomènes psychiques en jeu dans la relation enseignement/apprentissage. Ainsi, des « théories » et des modèles (comme celui de l’autoefficacité) qui en relèvent sont invoqués pour observer les processus métacognitifs (Noël, 2006). Mottier Lopez (2006), à propos de l’évaluation située des apprentissages, invoque la « théorie d’une cognition distribuée », citant Salomon (1993). Laveault (2012) inscrit son analyse de l’autorégulation en matière « d’évaluation comme soutien d’apprentissage » dans les « théories socioconstructivistes », citant notamment Allal (2010). Pour Vergnaud (2006) enfin, qui attribue à l’évaluation un rôle de guide pour l’action du maître, « encore faut-il qu’il puisse interpréter les données … recueillies : il lui faut, pour cela, un cadre théorique, dans une perspective de psychologie développementale » (p. 168).

  • dans le domaine de la psychologie socialeet de la sociologie : Dubois (2006, p. 181) traitant de la « valeur sociale » à propos d’évaluation, mobilise une « approche sociocognitive des normes de jugement », dans la construction théorique des « normes d’internalité, d’autosuffisance, d’ancrage individuel », etc. Merle (2012) inscrit son étude sur les activités d’évaluation en classe dans une perspective de « modélisation interactionniste » elle-même intégrée à une « théorie weberienne de l’interprétation de l’activité sociale versus une approche plus déterministe » (comme celles de Durkheim et de Bourdieu). Sa conclusion redonne toute sa place à l’interaction entre théorie sociologique et théorie évaluative : « La diversité des modèles sociologiques (déterministe, interactionniste), loin d’être un obstacle à la connaissance ou à la constitution d’une science de l’évaluation, est un gage de richesses… » (p. 81). Dans le même domaine, Duru-Bellat (2006) ne dit pas autre chose au sujet de la contribution de la sociologie à l’évaluation : celle-ci « comporte une fonction de production de connaissances » et peut utiliser une approche sociologique de la même façon que la sociologie peut adopter une approche évaluative (p. 183). On va plus loin, ici, que l’habituelle limite que se fixent eux-mêmes de nombreux chercheurs, considérant que l’influence scientifique ne peut fonctionner que dans un seul sens : de la sociologie à l’évaluation et non dans le sens inverse.

La mesure et les nouvelles technologies informatiques comme catalyseurs d’une refondation théorique

Un champ de pratiques, de méthodes et de théorisations diverses de la mesure s’est constitué depuis l’époque du testing (Nadeau, 1990) et de la psychométrie, dont il ne s’agit pas ici de refaire l’histoire. Disons, simplement, que la docimologie, puis l’édumétrie ont donné lieu à une succession de théorisations d’une « science de la notation » (Crahay, 2006). On sait que ces mouvements d’idées ont laissé la place à des théories plus élaborées comme celle de la généralisabilité, révélée, notamment, par Cardinet (1988) et qui semble tout particulièrement intéresser l’évaluation.

En tous cas, c’est assurément la composante « mesure » du processus d’évaluation qui donne lieu à l’affirmation la plus fréquente de l’existence ou de la nécessité de théories, comme semblent le laisser penser plusieurs auteurs :

  1. Lafontaine et Monseur (2012), présentant leurs travaux d’évaluation dans le cadre des enquêtes internationales sur le niveau des élèves (à l’OCDE), commencent par reconnaître, tout en le déplorant, que « les théories au fondement même de la mesure font rarement l’objet d’une explicitation dans les documents qui accompagnent ces enquêtes » (p. 48) ;

  2. Valois, Houssemand et De Leuw (2012), après avoir étudié le concept de mesure, au long de l’histoire des idées qui ont contribué à le forger, et examiné les caractéristiques épistémologiques des différentes phases de la mesure des attitudes, en arrivent à affirmer que « la mesure fait partie intégrante de la théorie » (p. 99) ;

  3. Blais (2006), dans son article portant sur « la mesure pour la recherche … en éducation », convoque, lui aussi, des théories spécifiques à l’approche métrique de l’évaluation en rappelant la « théorie de réponse aux items », utilisant une « modélisation formelle de la mesure en éducation couplée à celles de la technologie » (p. 127) ainsi que la « théorie de la mesure conjointe additive » (citant Luce & Tuckey, 1964), ouvrant des perspectives à la recherche en matière d’évaluation quantitative ;

  4. Enfin, si l’analyse de l’évolution des pratiques d’évaluation assistée par ordinateur, réalisée par Burton et Martin (2006), contribue aussi à argumenter en faveur d’une inscription dans des cadres théoriques comme la psychométrie cognitive (Martin, 1999), elle retiendra ici notre attention sur une autre dimension de plus en plus développée : celle de l’influence grandissante des nouvelles technologies sur la construction d’un système conceptuel cohérent et global de description d’un processus évaluatif intégrant méthode et théorisation. Burton et Martin (2006) avertissent, cependant, que des travaux restent à faire pour pouvoir « diagnostiquer, d’une manière précise, le fonctionnement cognitif d’un sujet, à un moment donné, qui puisse alors être relié d’une manière théoriquement fondée à des interventions pédagogiques adéquates » (p. 161) et, l’auteur rajoute « à des formes d’évaluation intégrées ».

Une configuration de paradigmes en lieu et place d’une théorie ?

Le concept de paradigme a été examiné par Allal (2012) dans son utilisation spécifique au sujet de l’activité évaluative. Citant l’ouvrage connu de Kuhn (2008), l’auteur définit le paradigme comme « un exemple prototypique … qui constitue une référence partagée, unanimement admise par les membres d’une communauté scientifique, assurant ainsi l’unification de leurs travaux » (p. 183). Utilisé par des chercheurs en sciences de l’éducation (De Ketele, 1993) pour définir des modèles ou des conceptualisations représentant des formes semblables ou différentes de l’évaluation, le concept de paradigme ainsi emprunté a pu donner l’idée d’une propédeutique de théorisation à défaut d’une véritable théorie. Mais, en même temps, cette démarche intellectuelle témoigne du cheminement d’un besoin important des spécialistes de l’évaluation en éducation : celui d’arriver à cerner un ou des systèmes d’explication de cette activité, un ou des « modes de pensée » comme les nomme Vial (2012), reconnaissables par la communauté des chercheurs en évaluation. Plusieurs configurations de paradigmes discriminants sont sous-jacentes chez les auteurs :

  • la configuration de Rodrigues (2006) qui propose de classer les différentes façons de penser l’évaluation en approches « objectivistes », centrées sur l’objet à évaluer (générant une relation de pouvoir asymétrique, corrélative d’une relation entre théorie et pratique, envisagée en termes d’application autoritaire et prescriptive) ; « subjectivistes », centrées sur l’apprenant et, par conséquent, sur le sujet évalué devenant évaluant ; « dialectiques », enfin, pour lesquels « le dualisme traditionnel entre sujet et objet » est « ainsi dépassé », ouvert à la négociation et au dialogue entre les acteurs/partenaires ;

  • la configuration que l’on trouve chez Cardinet (1990) lorsqu’il distingue entre évaluation externe, interne ou négociée, configuration qui rejoint celle de Rodrigues ;

  • la configuration de Vial (2012) qui distingue entre sept modes de pensée (ou « systèmes d’idées ») comme le déterminisme, le fonctionnalisme, le structuralisme, le systémisme, etc. auxquels il associe des « modèles » comme ceux de la mesure, des objectifs, de l’aide à la décision, de l’évaluation formatrice, etc.

  • les configurations successivement proposées par De Ketele (1993, 2001, 2012), qui constituent des analyseurs intéressants, du fait qu’elles aient été énoncées à des périodes espacées, pouvant ainsi représenter l’évolution de la position de l’auteur mais aussi refléter celle d’une communauté scientifique. Sans entrer dans le détail des trois textes, il faut remarquer, tout de même, que le dernier en date (celui de 2012) constitue une avancée importante : l’auteur est passé de dix paradigmes dans sa première liste à quatre dans la dernière. D’autre part, d’une accumulation de paradigmes à poids équivalent, on est passé à une configuration de « quatre paradigmes princeps » organisée autour du croisement de « deux axes d’analyse : les savoirs produits et les normes de référence » (p. 196). Les quatre paradigmes retenus, paraissant alors pouvoir occuper l’ensemble du paysage théorique ainsi argumenté, sont formulés ainsi : « le paradigme de l’intuition pragmatique …, le paradigme de l’évaluation mesure …, le paradigme de l’évaluation de la maîtrise des apprentissages …, le paradigme de l’évaluation pour les apprentissages » (pp. 197-198). Enfin, le texte se termine par la présentation d’un tableau de « synthèse comparative des dimensions épistémologiques des quatre paradigmes » (p. 199) et par l’évocation d’un possible « paradigme unificateur et intégrateur » que l’auteur récuse certes prudemment, mais qui transparaît dans la synthèse qui suit. In fine, la démonstration est faite que, même si « les modèles d’analyse produits par l’évaluation ne sont pas les mêmes que dans la recherche scientifique » (ce qui resterait à prouver, dans certains cas), la construction élaborée, ici, par De Ketele (2012), contribue à doter l’objet « évaluation » d’un statut théorique indéniable.

L’évaluation en quête d’un statut disciplinaire

La dernière façon de considérer la place de la théorie dans le domaine de l’évaluation sera celle de la discipline. De même que la question de savoir si les sciences de l’éducation constituaient vraiment une discipline ou seulement un « champ (pluri)disciplinaire » s’est posée dans certains pays, dans les années 70-80 (voir Hofstetter & Schneuwly, 2002), la même question concerne, aujourd’hui, les différents savoirs produits et enseignés en matière d’évaluation en éducation. Deux arguments pourraient être avancés pour répondre affirmativement :

  • d’abord, il faut bien reconnaître, avec ces derniers auteurs, que « l’observation des faits sociaux montre que les disciplines sont le mode d’organisation de la production des connaissances scientifiques dans notre société ». Les disciplines attestent, au moins, de deux dimensions constitutives :

    • une professionnalisation de la recherche comme production suivie de connaissances sur un ensemble identifié ;

    • un enseignement curriculaire en harmonie avec cette recherche.

      En ce qui concerne l’évaluation en éducation, un certain nombre d’universités ont fait ce choix, avec des fortunes diverses, et leur expérience a débouché sur des doctorats reconnus par la communauté universitaire internationale.

  • ensuite, si l’on se cantonne à l’évaluation de programme, les travaux de Dubois et Marceau (2005) contribuent au débat sur le caractère disciplinaire de ce champ de recherche. Les auteurs ont élaboré un modèle d’analyse[4], inspiré des travaux de Kuhn (2008) et de Lakatos (1970), et qu’ils ont appliqué à l’évaluation de programme. « L’exercice permet d’identifier et de schématiser les composantes théoriques… de la discipline » (p. 2). Comme d’autres auteurs précédents, ils confirment que « sans l’appui de connaissances théoriques, méthodologiques et empiriques …, évaluer un programme devient un exercice périlleux … réalisé sans point de repère » (p. 2). Ils établissent ensuite que « l’évaluation de programme obéit aux mêmes méthodes et aux mêmes techniques que celles associées à la recherche sociale : elle doit relier les fondements théoriques à la pratique » (p. 23). Que l’évaluation puisse se situer « au troisième stade du développement des disciplines, celui de la révolution scientifique » leur semble acceptable. En accédant au statut de discipline, selon Dubois et Marceau (2005), l’évaluation est perçue, là plus qu’ailleurs, comme dotée d’un corps théorique suffisamment fort.

Conclusion

La « pratique » de l’évaluation (dans toutes ses formes, y compris « techniciennes ») semble évidente et n’est pas à opposer à son éventuelle « théorie ». En effet, à la suite de ces publications, une autre vision possible du problème se présente. La question ne serait ni de les opposer ni de tenter de les équilibrer dans un compromis pragmatique sans grand intérêt, mais, peut-être, d’en apercevoir les imbrications qu’une théorisation de plus en plus apparente semble pouvoir révéler. L’analyse de la littérature proposée ici a mis en valeur une configuration épistémologique qui, tout en rappelant la diversité des approches de l’évaluation, illustre également leurs nombreux liens et leurs nombreuses cohérences. Cette configuration peut se résumer ainsi :

  • un faisceau interdisciplinaire établi, connu et reconnu, qui contribue à décrire les phénomènes psychologiques et sociologiques affectant une grande part des transactions évaluatives ;

  • un tissu méthodologique construit spécialement pour mesurer le matériau humain et social en question et qui est interrogé par les chercheurs dans le sens de son inscription dans un champ théorique ;

  • le début de consensus d’un nombre croissant de chercheurs autour de paradigmes stabilisés comme ceux que nous venons de relever, autour de quelques « unifications » ou « intégrations » esquissées plus haut.

Ainsi, des théorisations de l’évaluation rassemblées sur un panel relativement restreint de publications apparaissent néanmoins, en présentant des complémentarités et des convergences. Elles nous semblent dépasser une simple accumulation informative de références et inviter à définir la sphère « théorisatrice » émergente de cette activité : celle-ci serait, d’ailleurs, de plus en plus confortée et reliée par des concepts intégrateurs comme ceux de « situation », « d’interaction », de « réflexivité », disponibles aujourd’hui. Une préthéorie de l’évaluation serait-elle en train de naître ?