Istituto Scienze Religiose di Oristano

LA VALUTAZIONE NEGLI ESAMI. COSA, COME, PERCHÉ VALUTARE

della Prof. Giovannina Masala

La problematica della valutazione, nelle differenti modalità e caratteristiche che può assumere a seconda dell'ambito in cui la si consideri, ha acquistato da tempo un preciso rilievo nel dibattito educativo internazionale e va rivestendo un ruolo chiave nelle politiche scolastiche in Europa. In Italia si è imposta all'attenzione di docimologi e insegnanti alla fine degli anni '60 con la messa in crisi del modello scolastico tradizionale e la denuncia dell'aleatorietà e dei limiti dei sistemi di valutazione correnti. Viene altresì inclinandosi, in questi anni, l'equazione idealista che sapere e saper insegnare si identificano: che il bravo insegnante è quello meglio preparato nella sua disciplina e che il possesso della materia crea, automaticamente, la capacità di insegnarla. Sulle indicazioni del positivismo sperimentalista viene affermandosi, di contro, l'esigenza di una nuova didattica che, più ispirata a criteri oggettivi ed empirici, valorizzi l'educazione anche nei suoi aspetti tecnici e consenta di realizzare un controllo più accurato dei processi di istruzione. Oggi, l'interesse per l'aspetto metodologico-didattico è ancora più vivo che nel passato ed è altresì cresciuta la consapevolezza che non si dà insegnamento efficace e degno di questo nome senza la capacità di pianificare e controllare i processi formativi. A questa consapevolezza tuttavia non ha corrisposto finora nessuna concreta modificazione dei Piani di preparazione accademica, col risultato che la scuola di oggi - la secondaria superiore, almeno - sul piano della metodologia didattica non è molto diversa da quella di cinquant'anni fa, e che la preparazione in questo settore è ancora prevalentemente lasciata al buon senso, alla buona volontà e alle intuizioni pedagogiche del singolo insegnante.

Questa relazione, per la natura specifica del suo oggetto, avrà un approccio segnatamente tecnico-strumentale e poco legato alla riflessione educativa.

Ciò non esclude però che il fatto valutativo abbia sempre anche una rilevanza educativa: a) perché interessa e coinvolge dinamicamente soggetti in formazione, prima ancora che apprendimenti, abilità e comportamenti; b) perché nell'ottica di una piena assunzione di responsabilità educativa, espressa nel concetto di metavalutazione, ciò che si valuta non è mai solo il profitto dell'allievo ma anche la qualità e l'efficacia della proposta educativo-didattica nel suo complesso; c) non ultimo perché la valutazione, anche negli esami, non può avere mai un carattere semplicemente sanzionatorio, come è accaduto nel passato, ma il compito di orientare l'allievo verso tappe ulteriori in ordine allo sviluppo del sapere e all'affinamento delle sue stesse competenze metodologiche ed ermeneutiche.

Poiché lo scopo di questa relazione è approfondire la problematica della valutazione negli esami, cominciamo col dire che esistono diverse forme o funzioni della valutazione, a seconda delle esigenze che essa soddisfa. Una prima funzione è quella diagnostica, finalizzata ad acquisire informazioni sulla situazione dell'alunno prima dell'intervento didattico. La sua utilità è nel far conoscere gli apprendimenti da lui posseduti, le sue difficoltà e debolezze, consentendo così di predisporre le strategie di intervento più mirate e rispondenti ai suoi bisogni formativi.

Una seconda funzione è quella formativa, ed interviene nel corso dell'apprendimento. Consiste nel controllare in itinere il percorso didattico in tutti i suoi aspetti, così da rendere possibile qualsiasi correzione e modifica al fine di renderlo più idoneo a raggiungere gli obiettivi prefissati.

Una terza funzione è quella cosiddetta sommativa, o funzione di giudizio conclusivo. É quella realizzata al termine di un programma, di un anno scolastico o di un intero ciclo di studi allo scopo di valutare il profitto raggiunto; ed è quella che a noi maggiormente interessa, visto l'ambito della nostra conversazione.

Un'altra distinzione che normalmente viene fatta è quella tra valutazione interna e valutazione esterna: la prima realizzata dagli stessi insegnanti che hanno tenuto il corso, la seconda invece da valutatori esterni, come avviene attualmente negli esami di maturità. Il nostro discorso mira ad approfondire la problematica della valutazione sommativa interna, quella espressa dallo stesso docente che ha tenuto il corso in un esame conclusivo al termine delle lezioni.

Chiarite le ragioni per cui si valuta, facciamo un'ulteriore distizione, anche questa della massima importanza perché ci aiuta a fare chiarezza sull'intero discorso: quella tra misurazione e valutazione. La vecchia didattica non ha sufficientemente distinto il concetto di misura da quello di giudizio, per cui anche oggi, erroneamente, noi chiamiamo valutazione l'insieme di tutte le operazioni che costituiscono il controllo scolastico. La valutazione, invece, è soltanto il momento conclusivo, il giudizio espresso sul profitto scolastico al termine di un anno, di un corso o di un ciclo di studi. Ora, ogni giudizio sul profitto richiede due operazioni previe:

1°) un accertamento circa la presenza o meno di quegli elementi sui quali si deve esprimere il giudizio, quantificando anche l'entità di quella presenza o assenza;

2°) la definizione dei criteri oggettivi che guideranno l'espressione della valutazione. La prima operazione consiste nell'accertare, la seconda nel valutare il profitto.

Questa distinzione non è sempre compresa con chiarezza dagli insegnanti, per cui a volte si producono nella pratica didattica travisamenti e distorsioni. Un segnale di questa ambiguità di fondo, di questa confusione cioè tra i due momenti del controllo del profitto, è costituito dall'uso indebito che talora viene fatto della scala di valutazione in decimi. Detta scala, costruita per valutare il profitto, viene usata spesso anche per misurarlo, come se fosse una scala di misurazione a intervallo.

Questo uso però è assolutamente improprio. Infatti, mentre in una scala a intervallo le distanze tra un numero e l'altro (solitamente da 1 a 10) sono costanti, di modo che ci è dato conoscere quanta differenza c'è tra due elementi ed è possibile stabilire uno zero arbitrario, nella scala di valutazione ciò non è possibile, perché questa non ha suddette caratteristiche: questa è semplicemente una scala ordinale, che ci dà l'ordine cioè, la posizione degli alunni nella graduatoria. Il fatto che noi la usiamo per misurare il profitto, come se 8 fosse il doppio di 4, dimostra che confondiamo regolarmente, senza saperlo, le due operazioni di misurare e di valutare. C'è un unico caso in cui possiamo utilizzare la scala in decimi anche per misurare, ed è il caso dei test: qui è possibile somministrare 10 domande, fissare uno zero arbitrario (nel caso in cui non si risponda ad alcuna di esse) e attribuire la valutazione massima qualora si risponda alla totalità delle domande.

▲

Fatta questa digressione, riprendendo il discorso laddove lo abbiamo interrotto, possiamo dire così: ogni controllo del profitto consta di tre momenti distinti:

1. scelta dell'oggetto che deve essere misurato e valutato;

2. misurazione dell'oggetto;

3. valutazione dell'oggetto misurato.

Sono questi tre aspetti che ora illustreremo nel dettaglio.

La prima operazione è sempre la scelta dell'oggetto, del «che cosa» deve essere misurato e valutato. Perché questo sia possibile è necessario che l'insegnante abbia definito in maniera chiara, precisa e non ambigua i comportamenti di cui vuole misurare la presenza o assenza, quelle abilità cioè che si aspetta di trovare negli alunni in termini di comportamenti osservabili. Questo momento è anche chiamato della definizione degli obiettivi e serve proprio a far chiarezza sull'entità delle acquisizioni che gli allievi devono far mostra di possedere. In questo lavoro di chiarificazione e definizione degli obiettivi l'insegnante può essere aiutato da numerose proposte tassonomiche che hanno visto la luce a partire dagli anni cinquanta, la più nota delle quali in Italia è quella di Bloom. Questa prevede 6 obiettivi specifici: conoscenza, comprensione, applicazione, analisi, sintesi, valutazione. Qual è il senso di una gamma così ampia di obiettivi in ordine ai contenuti? Il presupposto di base è che la semplice conoscenza, posta all'inizio della scala gerarchica, è condizione necessaria per superare l'esame ma non sufficiente. Tutti noi, d'altra parte, abbiamo conosciuto degli allievi che, per mancanza di metodo o altri limiti personali, apprendono i contenuti in maniera meccanica, prevalentemente mnemonica, e si mostrano pertanto incapaci di ragionare su livelli diversi di astrazione e di operare confronti e significative integrazioni sulle conoscenze possedute. É necessario perciò considerare, quando si valuta la prestazione, non solo la conoscenza di determinate informazioni ma anche l'adeguatezza con cui l'alunno le interpreta; la capacità di applicare quei contenuti a situazioni nuove e di saper fare previsioni; di scomporre quei dati nei suoi elementi o principi peculiari e di ricomporli in una sintesi efficace, come anche di esprimere una valutazione personale su quanto ha appreso. Conoscere, infatti, non è solo tenere a mente, ricordare, ma è molto di più: è ristrutturare il proprio sapere e la propria concezione della realtà a partire dalle nuove acquisizioni.

Il secondo momento concerne la misurazione dell'oggetto prescelto, che consiste nel rilevare in che misura questo è presente nell'allievo. La misurazione prevede a sua volta tre momenti distinti:

1. la stimolazione dell'esaminatore

2. la registrazione delle risposte degli alunni

3. la «lettura» complessiva di quanto è emerso

Vediamo di chiarire, anzitutto, a quali esigenze deve rispondere una buona stimolazione, illustrando parimenti i criteri di una buona misurazione. Gli studiosi ne hanno individuato parecchi, che tuttavia possiamo raggruppare, anche in vista degli scopi del nostro lavoro, nei seguenti:

a) validità;

b) rappresentatività;

c) attendibilità;

d) selettività;

e) comparabilità.

È il rispetto di questi criteri nel loro insieme ad attestare se un esame è stato condotto bene oppure no.

▲

a) Validità: un esame è valido se misura effettivamente tutto e solo quello che ci si era proposti di misurare. La misurazione della preparazione in filosofia sarà valida se ciò che viene misurato è realmente la preparazione in filosofia e non altre cose, come l'intelligenza dello studente, la memoria, il controllo di sé, il modo positivo di instaurare il rapporto con l'esaminatore, ecc., elementi che sempre emergono durante il colloquio. Questa forma di validità dell'esame si chiama "validità del contenuto", nel senso che l'esame controlla effettivamente solo il contenuto del corso, e in questo senso diciamo che è valido.

b) Rappresentatività: le domande poste dall'esaminatore devono essere rappresentative dell'intero corso di studio, non solo di una parte di esso. Per misurare il profitto dell'alunno non ci si può limitare a domande su una parte ristretta del programma o su argomenti secondari e poco significativi. In questo caso, infatti, superarlo o meno diventerà una questione di fortuna e l'alunno stesso, come osserva Panizza, si darà pensiero di conoscere più l'insegnante che lo esaminerà che il programma sul quale deve essere esaminato.

c) Attendibilità: un esame è attendibile quando i risulatati di una misurazione sono precisi e coerenti, quando l'esame cioè è capace "di rilevare una certa qualità del soggetto tutte le volte che questo si presenta, anche a distanza di tempo o in condizioni diverse" (Boncori). L'attendibilità di un esame è il risultato di numerosi fattori:

- della rappresentatività dei contenuti richiesti, di cui abbiamo detto poc'anzi;

- della costanza dello stimolo, ovvero del fatto che vengano poste agli allievi domande con lo stesso grado di difficoltà, il più possibile cioè uniformi ed equivalenti;

- della chiarezza nella formulazione delle domande, ovvero nell'assenza di ambiguità;

- delle buone condizioni fisiche ed emotive del candidato;

- di un ambiente fisico adeguato, privo cioè di elementi disturbanti;

- infine, di un tempo sufficiente ad espletare l'esame, il quale è vero che per essere accurato non dev'essere frettoloso e tuttavia non deve prolungarsi oltre un tempo ragionevole, per evitare non solo una naturale stanchezza e demotivazione ma anche la percezione di un qualche senso di accanimento.

d) Selettività: l'esame ha anche il fine di stabilire, alla fine del corso, diversi livelli di profitto. Ciò richiede all'esaminatore la capacità di accertare livelli di profitto differenti, utilizzando l'intera gamma dei punteggi. É questo che intendiamo per selettività: la possibilità di stabilire una graduatoria il più possibile fedele dei valori espressi dai candidati. Sbaglia così l'esaminatore che non utilizza mai i punteggi più alti della scala ma anche colui che li utilizza troppo, rinunciando a quelli più bassi. A tutti noi credo sia capitato di incontrare qualcuno che non utilizza una scala che va dall'1 al 10, ma dal 5 all'8, o dal 4 al 7; che utilizza cioè una gamma di punteggi che è meno della metà di quella che ha a disposizione. Ciò ha come conseguenza un eccessivo appiattimento dei valori e una sostanziale assenza di selettività e attendibilità.

e) Comparabilità: è un'altra importante caratteristica di un buon esame, che è condotto bene qualora i risultati ottenuti siano gli stessi a prescindere dal docente che lo effettua. Perché ciò sia possibile è necessaria, tra docenti diversi, una sostanziale uniformità di criteri. Qualora questi non siano condivisi non fa meraviglia che lo studente "scelga" di dare l'esame con quel professore della terna esaminatrice col quale ritiene di superarlo con maggiore facilità o successo.

Studi docimologici anche recenti hanno mostrato che gli errori più diffusi nelle prove d'esame tradizionali toccano un pò tutti questi aspetti:

* a danno della selettività è frequente un utilizzo parziale della gamma dei punteggi a disposizione, a seconda che l'insegnante voglia apparire indulgente o severo;

* a danno dell'attendibilità, accade che le domande dell'insegnante non siano affatto costanti, uniformi, ma presentino diversi livelli di difficoltà;

* a danno della validità, pare molto frequente la discrepanza tra ciò che l'insegnante sostiene di voler valutare e ciò che poi valuta effettivamente. Questo è un rischio davvero incombente. Non a caso una delle critiche più frequenti che gli alunni rivolgono agli insegnanti è di essere parziali, non obiettivi. É il caso dell'insegnante che, nella migliore delle ipotesi, valuta non il profitto ma l'impegno e la costanza nello studio, utilizzando così i voti per incoraggiare e premiare; e, nella peggiore delle ipotesi, magari inconsapevolmente, ora l'educazione e il buon carattere, ora la grazia e la simpatia dell'allievo;

* minano la validità e l'attendibilità dei giudizi anche altri due errori molto diffusi, conosciuti come "effetto Pigmalione" ed "effetto alone". Il primo consiste nella tendenza ad attribuire giudizi stereotipati: in base alle prove già sostenute nel passato e a seconda che siano state più o meno positive, l'insegnante formula i suoi giudizi attuali. L'"effetto alone" invece consiste nel sopravvalutare una caratteristica dell'allievo particolarmente apprezzata o rigettata, per cui alla fine ciò che si valuta maggiormente è quel tratto singolo e non la prestazione complessiva.

Fino a questo momento abbiamo chiarito le caratteristiche di una buona misurazione in ordine esclusivamente al modo in cui l'esaminatore deve porre le domande. L'esame però richiede che questi faccia qualcos'altro: registri parimenti i comportamenti dell'alunno, le risposte da lui fornite alle sollecitazioni. Tale registrazione può avvenire sia mediante strumenti appositamente costruiti (è il caso delle prove scritte e grafiche), sia mediante l'insegnante: negli esami orali è infatti l'insegnante che funge da strumento di misurazione, pur non registrando immediatamente le risposte. Ciò che più importa al fine di una misurazione rigorosa e precisa è che l'insegnante sappia registrare fedelmente le risposte e sappia individuare, tra i tanti comportamenti posti in essere dall'allievo, quelli che hanno rilevanza e significato in ordine al contenuto del corso. Uno dei limiti più grossi del colloquio orale è che la registrazione delle risposte è in genere a carico della memoria: ciò non solo rende problematico un ricordo completo e circostanziato, ma espone lo stesso ricordo a distorsioni talora notevoli per l'influenza di fattori logici e affettivi, com'è ampiamente dimostrato da studi sperimentali.

Compiuta questa operazione, si procede alla "lettura" di ciò che è stato registrato: nel caso delle prove scritte è il momento della correzione degli elaborati; nel caso delle prove orali è il momento in cui ci si forma una visione d'insieme delle risposte e dei comportamenti posti in essere dal candidato. La precisione nella lettura è direttamente proporzionale alla precisione dei momenti precedenti, in cui cioè per un verso si sono stabiliti i comportamenti di cui si vuole accertare la presenza o assenza, e per un altro si è proceduto a una registrazione accurata e fedele.

L'insieme di queste operazioni non è tuttavia sufficiente. É necessario che, antecedentemente alla prova d'esame, gli insegnanti abbiano fissato dei criteri oggettivi tali da consentire, relativamente ai livelli della presenza o assenza dei contenuti ovvero ai diversi gradi di preparazione, la formulazione di punteggi intermedi. Solitamente si individuano da tre a cinque livelli - scarso/sufficiente/buono/ottimo/eccellente- e si fissano anche i punteggi da attribuire ad ogni grado della scala. È il caso della proposta di valutazione che stiamo tentando di adottare in Istituto. Qui infatti vediamo che figurano:

1. L'indicazione dell'oggetto da misurare e valutare anche se in senso solo generale. È compito di ciascun insegnante tradurre poi quell'indicazione generale in obiettivi comportamentali o specifici, inerenti alla propria disciplina. Tale oggetto è articolato in tre classi di obiettivi: conoscenza dei contenuti - orientamento metodologico - qualità espositiva e linguistica.

2. Cinque livelli o gradi, relativi a ciascuno dei tre obiettivi specificati, che vanno dalla mediocrità all'eccellenza.

Conoscenza dei contenuti	insuff.	framment.	suffic.	apprezzabile	eccellente
Orientamento metodologico	inesistente	confuso	corretto	positivo	maturo
Qualità espositiva	negativa	confusa	accetabile	convincente	brillante

3. Ciascun livello è contrassegnato da un aggettivo e, anche se non vi figura, da un numero: appare chiaro infatti, anche per l'assenza di indicazioni diverse, che lo schema è costruito per una valutazione tutta in trentesimi e che le condizioni minime per superare l'esame sono una sufficiente conoscenza dei contenuti, un corretto orientamento metodologico e una qualità espositiva e linguistica accettabile.

Da quanto abbiamo detto finora si evince che la modalità orale della prova d'esame è di gran lunga la più difficile e quella che richiede maggiore professionalità e competenza. In essa sono implicate fondamentali dinamiche affettive, emotive e di difesa, ed è più difficile conferire uniformità e chiarezza alle domande. Nel tentativo di sopperire a questi limiti i docimologi hanno messo a punto, negli ultimi decenni, tecniche e criteri di accertamento un pò più obiettivi e attendibili. Hanno visto così la luce i test oggettivi di profitto che offrono, rispetto alla valutazione tradizionale, maggiori garanzie di uniformità e di oggettività scientifica: di uniformità in quanto la valutazione avviene nelle stesse condizioni per tutti i soggetti; di obiettività in quanto la prova non è inficiata dal giudizio dell'esaminatore. Per essere davvero valide, tuttavia, queste prove devono essere stilate dagli stessi insegnanti che hanno tenuto il corso, perché solo essi conoscono gli obiettivi cui esso mira e sono in grado di accertare se sono stati raggiunti oppure no. La preparazione dei test criteriali di accertamento del profitto richiede tuttavia notevole precisione, accuratezza e competenza e l'insegnante da solo, senza la consulenza di uno o più esperti, difficilmente può metterli a punto.

La valutazione, o giudizio finale, è l'ultimo momento della prova d'esame. Essa procede all'apprezzamento e conferimento di valore di tutti i dati emersi durante il colloquio, e inerenti ai comportamenti individuati come desiderabili e significativi perché rispondenti allo scopo dell'accertamento (stabilire il profitto). La valutazione del profitto può essere espressa, di fatto, sia in base a un criterio assoluto, in base cioè a un modello ideale di preparazione che ciascun insegnante ha in mente e che costituisce il suo riferimento esclusivo; sia in base a un criterio di preparazione relativo al rendimento espresso dagli altri allievi; sia, infine, a un criterio di preparazione relativo al soggetto, in base cioè ai progressi da lui compiuti rispetto alle prove precedenti. Quest'ultimo criterio, piuttosto usato nel curricolo e nell'ottica della programmazione, si utilizza invece molto meno negli esami, per ragioni che appaiono evidenti.

La valutazione può essere espressa in forme diverse: uno dei sistemi più usati è quello dei voti, vigente nella secondaria superiore e all'Università.

Un altro sistema è quello degli aggettivi: di tipo globale, come avviene all'esame di licenza media (sufficiente/buono/distinto/ottimo), o di tipo analitico, che esprime l'apprezzamento di singole caratteristiche (originale, creativo, critico, ecc.). Un uso valido e corretto degli aggettivi richiede numerose avvertenze, prime fra tutte quelle di selezionare aggettivi: a) di uso frequente; b) di significato preciso; c) equidistanti tra loro; d) di utilizzarli in maniera univoca e coerente a una scala di misura, con livelli determinati.

Anche nel modello di valutazione che abbiamo adottato di recente compaiono aggettivi. Questi, tuttavia, hanno solo la funzione di rendere più consapevole l'atto valutativo e più visibile il livello delle abilità nei tre settori distinti dei contenuti, del metodo e dell'esposizione, fermo restando che l'esame mantiene la sua valutazione ufficiale in trentesimi, quella che contraddistingue tutto il settore universitario.

C'è infine una valutazione che può esprimersi in giudizi o profili, in forma cioè più discorsiva: è quella adottata nella scuola di base, a cui si accompagnava, fino allo scorso anno, un sistema di lettere: la A, legata a un giudizio ottimo, la E a un giudizio insufficiente. Alcuni mesi fa, come sappiamo, le lettere sono state sostituite da aggettivi globali (ottimo, distinto, buono, ecc.) per renderne più immediata e univoca la lettura. Il vantaggio di questa forma di valutazione è la possibilità di illustrare, in maniera analitica ed esplicita, tutte le componenti del giudizio stesso.

▲