Verifica di efficacia della formazione: cosa è, come si fa, come si dimostra
Guida operativa alla verifica di efficacia formativa nella sicurezza sul lavoro: differenza con la verifica finale di apprendimento, modelli Kirkpatrick e Kaufman, modalità ammesse dall'Accordo Stato-Regioni 2025, esempi di scenari conversazionali, quiz con tassonomia di Bloom, follow-up a 6 mesi, documentazione richiesta in ispezione.
La verifica di efficacia formativa è il punto su cui si gioca la conformità reale all'Accordo Stato-Regioni del 17 aprile 2025. La verifica finale del corso, con il suo test da 30 domande e soglia al 70%, dimostra l'apprendimento al giorno X. La verifica di efficacia dimostra che quell'apprendimento è rimasto, è diventato comportamento, ha avuto effetti misurabili. È la differenza tra "formazione fatta" e "formazione che funziona", ed è quella che gli ispettori INL stanno cercando dopo la Circolare 1/2026.
Questa guida copre i sei aspetti operativi: cosa è la verifica di efficacia, come si distingue dalla verifica finale, quali modelli teorici reggono in audit (Kirkpatrick, Kaufman), come costruire test e scenari che misurino davvero apprendimento, come somministrare una verifica a 6-12 mesi, e quali documenti devono finire nel fascicolo decennale.
Cosa significa esattamente "verifica di efficacia della formazione"?
La verifica di efficacia della formazione è la valutazione, condotta a distanza dal corso, se la formazione ha prodotto un cambiamento misurabile nelle conoscenze, nelle competenze o nei comportamenti del lavoratore. Non sostituisce la verifica finale di apprendimento, la integra.
Il principio operativo è semplice. Una persona può rispondere correttamente a 28 domande su 30 il giorno del test e dimenticare tutto nel mese successivo. Oppure può applicare le procedure formali a un audit programmato ma improvvisare al primo turno di notte. La verifica finale cattura il primo problema (apprendimento sul momento), la verifica di efficacia cattura il secondo (persistenza e trasferimento sul lavoro).
L'Accordo del 17 aprile 2025 menziona esplicitamente la verifica di efficacia come obbligo del datore di lavoro, lasciando però aperto il "come". Le modalità ammesse, sintetizzate nelle FAQ del Ministero del Lavoro, sono quattro e si possono combinare:
- Questionari valutativi somministrati a 6-12 mesi dalla formazione.
- Analisi degli infortuni e dei near-miss prima e dopo l'erogazione del corso.
- Check-list di osservazione compilate da preposti o RSPP durante l'attività ordinaria.
- Colloqui o interviste strutturate con lavoratori e preposti.
La responsabilità ricade sul datore di lavoro, non sull'ente di formazione. In ispezione è il datore che deve poter mostrare evidenze. Per approfondire le tempistiche e gli obblighi del periodo transitorio fino al 24 maggio 2026 vedi la guida completa all'Accordo Stato-Regioni 2025.
Qual è la differenza tra verifica finale di apprendimento e verifica di efficacia?
La verifica finale misura l'apprendimento il giorno del corso (cosa il lavoratore sa al test), la verifica di efficacia misura la persistenza e il trasferimento sul lavoro (cosa il lavoratore applica nei mesi successivi).
| Aspetto | Verifica finale (Art. 7) | Verifica di efficacia |
|---|---|---|
| Quando si fa | Alla fine del corso | A 3-12 mesi dal corso |
| Cosa misura | Apprendimento immediato | Persistenza, comportamento, risultati |
| Strumenti | Test scritto 30 dom/70%, colloquio, simulazione, prova pratica | Questionari ritardati, analisi infortuni, check-list di osservazione, colloqui |
| Responsabile | Ente di formazione (durante l'erogazione) | Datore di lavoro (su base continuativa) |
| Conseguenza in caso di fallimento | Mancata emissione attestato | Necessità di ripianificare la formazione, possibile responsabilità penale ex DLgs 81/08 |
| Conservazione documenti | 10 anni nel fascicolo formativo | 10 anni nel fascicolo formativo (allegato) |
In termini pratici: la verifica finale è il presupposto per emettere l'attestato, la verifica di efficacia è il presupposto per dimostrare in ispezione che la formazione ha funzionato davvero. Entrambe servono. Una senza l'altra è un audit perso.
Quali sono i modelli di valutazione che reggono in audit?
I due modelli universalmente riconosciuti per valutare l'efficacia della formazione sono il modello di Kirkpatrick (quattro livelli: reazione, apprendimento, comportamento, risultati) e il modello di Kaufman (cinque livelli, estende Kirkpatrick aggiungendo l'impatto sociale).
Modello di Kirkpatrick applicato alla sicurezza
Donald Kirkpatrick ha proposto il modello nel 1959 e oggi è il framework standard per la valutazione della formazione. Quattro livelli di valutazione, in ordine crescente di difficoltà di misurazione:
| Livello | Cosa misura | Strumento tipico in sicurezza | Quando si misura |
|---|---|---|---|
| 1 — Reazione | Gradimento, percezione del corso | Questionario di soddisfazione fine corso | Subito dopo |
| 2 — Apprendimento | Conoscenze e abilità acquisite | Test finale 30 domande / scenari | Fine corso |
| 3 — Comportamento | Applicazione sul lavoro | Check-list di osservazione, interviste preposto | 3-6 mesi |
| 4 — Risultati | Impatto sull'organizzazione | Infortuni, near-miss, audit interni | 6-12 mesi |
In termini di Accordo 2025, i livelli 1 e 2 sono coperti dalla verifica finale ex Art. 7; i livelli 3 e 4 sono il dominio della verifica di efficacia. Un sistema di verifica completo li tocca tutti e quattro.
Modello di Kaufman: estensione utile per il settore HSE
Roger Kaufman ha esteso Kirkpatrick aggiungendo un quinto livello sopra "Risultati": Conseguenze sociali. Per la formazione sicurezza significa: ha contribuito a ridurre infortuni a livello settoriale, ha migliorato la cultura aziendale, ha generato un effetto domino su fornitori e subappaltatori. È più difficile da misurare ma utile per grandi committenti aziendali che vogliono raccontare risultati sostenibili.
Come si costruisce un test di verifica finale che dimostri vera competenza?
Un test che dimostra competenza vera ha tre caratteristiche: domande costruite sui contenuti specifici del corso (non generiche), distribuzione bilanciata sui livelli della tassonomia di Bloom, copertura di tutte le aree di competenza con almeno 3 domande approvate per area.
La tassonomia di Bloom come bussola
Benjamin Bloom ha classificato le domande secondo livelli cognitivi crescenti. La versione rivista (Anderson & Krathwohl, 2001) usa sei livelli: ricordare, comprendere, applicare, analizzare, valutare, creare. Per la formazione sicurezza i livelli rilevanti sono i primi quattro.
Una distribuzione tipica per un quiz di verifica finale ben fatto:
| Livello | Quota raccomandata | Esempio in sicurezza |
|---|---|---|
| Ricordare | 15-25% | "Qual è la distanza minima di sicurezza da una linea elettrica MT?" |
| Comprendere | 25-35% | "Perché un DPI di terza categoria richiede addestramento specifico?" |
| Applicare | 30-45% | "Un lavoratore segnala dispnea in spazio confinato. Cosa fai in primo luogo?" |
| Analizzare | 10-20% | "Confronta i rischi residui delle procedure A e B in questa situazione" |
Un quiz tutto su "ricordare" misura solo memoria a breve termine, esattamente quello che l'Accordo 2025 vuole superare. Un quiz con il 40% di domande di "applicare" misura giudizio in scenario, che è la competenza richiesta sul lavoro reale.
Cinque tipologie di domanda
Variare la tipologia evita che il lavoratore "impari il test" e produce dati di qualità diversa per livello cognitivo:
- Scelta singola (radio button, 1 risposta corretta su 4) — buono per ricordare e comprendere.
- Scelta multipla (checkbox, n risposte corrette su 4-5) — buono per analizzare.
- Vero/falso — utile per misconcezioni, evitarne abuso.
- Ordinamento (riordinare passaggi di una procedura) — buono per applicare procedure sequenziali.
- Completamento del testo (fill-in) — riduce il guessing, misura recall puro.
Saperia AI genera nativamente domande in tutte e cinque le tipologie a partire dai documenti del corso, con etichettatura automatica per area di competenza e per livello di Bloom, e con una matrice di copertura visibile al formatore: per ogni coppia (area × livello cognitivo) il sistema mostra quante domande approvate sono disponibili. Le caselle con meno di 3 domande approvate compaiono in arancione: è il segnale per chiedere al sistema di "completare la copertura" generando solo le domande mancanti.
Cosa sono gli scenari conversazionali e quando hanno senso?
Gli scenari conversazionali sono valutazioni dialogiche in cui un'AI espone una situazione lavorativa al lavoratore, attende la sua risposta, fa 1-2 follow-up, poi passa allo scenario successivo. Misurano come il lavoratore applica giudizio in tempo reale, non solo cosa ricorda.
Un esempio concreto per un corso preposti:
Scenario. Stai supervisionando il montaggio di un ponteggio a 8 metri. Un operatore ti dice che il suo imbraco è scaduto da due mesi ma "tanto sale solo per 10 minuti". Il caposquadra è in pausa pranzo. Cosa fai e in che ordine?
Il lavoratore risponde liberamente. L'AI valuta sulla base dei materiali del corso (RAG sui PDF normativi caricati dal formatore) la qualità della risposta: ha bloccato l'attività? Ha gestito il rapporto interpersonale? Ha tracciato l'episodio? Poi pone un follow-up: "L'operatore insiste che è urgente. Come gestisci?". Dopo 6 scenari su aree diverse, l'AI produce un punteggio per area con motivazione, punti di forza, criticità.
Quando hanno senso e quando no.
Hanno senso per: corsi preposti, dirigenti, RSPP, situazioni di emergenza, gestione team, comunicazione del rischio. Tutti contesti dove il giudizio e l'ordine delle azioni contano più della conoscenza fattuale.
Non hanno senso (da soli) per: corsi tecnici puri dove la conoscenza fattuale è dirimente (es. uso di sostanze chimiche specifiche, normativa procedurale puntuale). Lì serve il quiz strutturato.
Modalità ibrida = il meglio dei due mondi. La valutazione ibrida combina quiz strutturato (es. 60% del punteggio) e scenari conversazionali (es. 40%). Misura insieme conoscenze fattuali e capacità di applicarle. È quella raccomandata per la maggior parte dei corsi sulla sicurezza dopo l'Accordo 2025. Saperia gestisce il calcolo del punteggio ibrido come media pesata per area, e fa una cosa importante: se un'area ha meno di 3 domande quiz approvate, il peso quiz su quella area scende automaticamente a zero e lo scenario la copre al 100%.
Per le situazioni in cui leggere e scrivere risulta limitante (lavoratori non italofoni, contesti operativi senza accesso a tastiera), gli stessi scenari possono essere erogati in modalità vocale: il lavoratore parla, l'AI ascolta e risponde con voce sintetica di livello professionale. La verifica linguistica preventiva A2/B1 CEFR garantisce che il lavoratore comprenda i contenuti prima della valutazione.
Cosa sono le aree critiche e perché contano per la pass/fail decision?
Le aree critiche sono aree di competenza marcate come "must-pass": il lavoratore deve raggiungere la soglia minima su ogni area critica individualmente, indipendentemente dal punteggio complessivo. Servono a evitare che un punteggio aggregato alto nasconda buchi pericolosi in un'area chiave.
Esempio concreto. Un corso antincendio rischio alto ha quattro aree di competenza: "Comportamento in caso di emergenza", "Uso degli estintori", "Evacuazione e PEI", "Comunicazione con i soccorsi". Un lavoratore prende 90% globale ma nelle "Evacuazione e PEI" raggiunge solo il 45%. In un sistema senza must-pass passa. In un sistema con must-pass viene rifiutato perché un buco del genere, in un incendio reale, costa vite.
L'Accordo 2025 non richiede esplicitamente le aree critiche, ma la responsabilità di prevenzione del datore di lavoro (Art. 18 DLgs 81/08) implica che la formazione "garantisca un adeguato livello di formazione" su ogni rischio. Tradotto: se a un audit dopo un incendio si scopre che un lavoratore aveva preso il 45% sull'evacuazione, l'attestato non protegge.
Tre raccomandazioni operative:
- Per ogni corso definire al massimo 2-3 aree come critiche (più di 3 e perdi il senso del "critico").
- La soglia su area critica può essere più alta del 70% complessivo (es. 80% per "uso DPI" in lavori in quota).
- Comunicare chiaramente al lavoratore quali aree sono critiche prima della valutazione, e prevedere un percorso di rinforzo prima del retest in caso di fallimento.
Come si fa concretamente una verifica di efficacia a 6 mesi?
Una verifica di efficacia a 6 mesi si costruisce su due piloni: un questionario online breve sui casi reali dell'azienda e una check-list di osservazione compilata dal preposto del lavoratore. I risultati vanno archiviati nel fascicolo formativo decennale come allegato all'attestato.
Il questionario a 6 mesi. Va costruito sui contenuti specifici del corso che il lavoratore ha frequentato, non su domande generiche. Tre regole pratiche:
- 8-12 domande, non di più (la fatica cognitiva fa crollare l'accuratezza).
- Almeno la metà delle domande devono essere di "applicare" (livello 3 di Bloom): scenari brevi che chiedono cosa fare in una situazione concreta.
- Le domande devono coprire le aree dove il lavoratore aveva mostrato lacune alla verifica iniziale, non quelle in cui era già forte.
Saperia AI gestisce nativamente queste campagne di follow-up: per ogni lavoratore che ha completato il corso, a 3-12 mesi (configurabile per corso) invia automaticamente l'invito al questionario, raccoglie i risultati, calcola il punteggio di retention (delta tra punteggio post-corso e punteggio follow-up) per area, e produce un rapporto comparativo pre/post/follow-up.
La check-list di osservazione del preposto. È più veloce e ha valore alto in ispezione. Il preposto compila una lista di 5-8 comportamenti osservabili sul lavoro reale ("Indossa correttamente il DPI di terza categoria? sì/no/parzialmente"), con la data dell'osservazione e una nota libera. Va fatta almeno una volta a semestre per ogni lavoratore con corso recente.
Quali sono i documenti che vanno nel fascicolo formativo per la verifica di efficacia?
Il fascicolo formativo del singolo lavoratore deve contenere, per la parte di verifica di efficacia, almeno cinque documenti conservati per 10 anni: rapporto della valutazione iniziale, attestato con punteggio post-corso, rapporto follow-up a 6-12 mesi, check-list di osservazione del preposto firmate, eventuali rapporti di re-formazione successiva.
| Documento | Quando si produce | Chi lo firma | Conservazione |
|---|---|---|---|
| Rapporto valutazione iniziale (pre-corso) | All'iscrizione al corso | Sistema + formatore | 10 anni |
| Verbale verifica finale + attestato | Fine corso | Formatore + lavoratore | 10 anni |
| Rapporto follow-up 6-12 mesi | A 6-12 mesi | Sistema + datore di lavoro | 10 anni |
| Check-list osservazione preposto | Ogni 6 mesi mentre attestato è valido | Preposto + lavoratore | 10 anni |
| Eventuali piani di re-formazione | In caso di lacune persistenti | Formatore + datore | 10 anni |
Saperia produce sette tipologie di rapporto esportabili da ogni assignment (assegnazione corso-cliente): panoramica corso, profilo di competenza per lavoratore, trascrizione della valutazione, certificato di verifica linguistica per lavoratori stranieri, rapporto di efficacia comparativo, log delle attività, pack completo ZIP che bundlea tutto il fascicolo. I rapporti sono firmati digitalmente, hanno un codice univoco verificabile, e sono direttamente archiviabili nel sistema documentale aziendale.
L'audit log decennale registra ogni azione del lavoratore e del formatore — accessi, attività completate, risposte date, tempi di risposta — e resta immutabile per 10 anni. È quello che, in ispezione, dimostra che la formazione è stata "vissuta" e non solo somministrata su carta.
Riferimenti normativi e bibliografia tecnica
- Accordo Stato-Regioni del 17 aprile 2025, in materia di formazione sulla sicurezza sul lavoro (pubblicato in Gazzetta Ufficiale il 24 maggio 2025).
- D.Lgs. 81/2008, art. 37, formazione dei lavoratori.
- Circolare INL n. 1 del 23 febbraio 2026.
- Kirkpatrick, D. L. (1959). Techniques for evaluating training programs. Journal of the American Society of Training and Development.
- Anderson, L. W. & Krathwohl, D. R. (2001). A Taxonomy for Learning, Teaching, and Assessing: A Revision of Bloom's Taxonomy of Educational Objectives.
- Kaufman, R. (1996). Strategic Thinking: A Guide to Identifying and Solving Problems. ISPI Press.
- INAIL, rapporti annuali sull'andamento infortunistico (2024-2025).
Per la procedura concreta di adeguamento entro il 24 maggio 2026, riferimento operativo alla guida completa all'Accordo Stato-Regioni 2025. Per richiedere una dimostrazione di Saperia su un corso reale, 15 minuti senza registrazione.
Le risposte alle domande più frequenti
Qual è la differenza tra verifica finale e verifica di efficacia?
La verifica finale misura cosa il lavoratore ha appreso il giorno del corso (test di 30 domande con soglia 70%, ex Art. 7 Accordo 2025). La verifica di efficacia misura se quell'apprendimento è rimasto, è diventato comportamento, ha prodotto effetti misurabili. Si fa a distanza dalla formazione, tipicamente a 6-12 mesi, ed è responsabilità del datore di lavoro.
Cosa è il modello di Kirkpatrick applicato alla formazione sicurezza?
Il modello di Kirkpatrick valuta la formazione su quattro livelli: reazione (gradimento del corso), apprendimento (quanto è stato imparato), comportamento (cosa si applica sul lavoro a 3-6 mesi), risultati (impatto su infortuni, near-miss, audit). I primi due livelli corrispondono alla verifica finale; gli ultimi due alla verifica di efficacia.
Quante domande deve contenere un test di verifica finale dopo l'Accordo 2025?
Almeno 30 domande nei corsi iniziali e 10 nei corsi di aggiornamento, ciascuna con minimo 3 alternative di risposta multiple. Si supera al 70% di risposte corrette. Le domande devono coprire tutti gli argomenti del corso ed essere costruite sui contenuti specifici, non su domande generiche prese da banche pubbliche.
Cosa è la tassonomia di Bloom e perché serve per i quiz di sicurezza?
La tassonomia di Bloom classifica le domande per livello cognitivo: conoscenza (ricordare), comprensione (spiegare), applicazione (usare in un caso pratico), analisi (collegare cause ed effetti). Un quiz tutto su 'conoscenza' misura solo memoria; un quiz con il 30-50% di domande di applicazione misura competenza vera, ed è quello che l'Accordo 2025 implicitamente richiede.
Come si fa una verifica di efficacia a 6 mesi dalla formazione?
Quattro modalità tipiche: somministrare un questionario online con domande applicate ai casi reali dell'azienda, analizzare infortuni e near-miss pre/post-corso, far compilare una check-list di osservazione al preposto, fare colloqui strutturati con lavoratori e preposti. Il risultato va archiviato nel fascicolo formativo decennale.
Cosa è la modalità ibrida di valutazione?
È una valutazione che combina due metodi con peso configurabile: una banca di domande chiuse (es. 60% del punteggio) e una serie di scenari conversazionali in cui il lavoratore dialoga con un caso pratico (es. 40%). Si usa per misurare insieme conoscenze fattuali e capacità di applicare giudizio in situazioni reali. È supportata nativamente da Saperia.
Cosa sono le 'aree critiche must-pass'?
Sono aree di competenza marcate come critiche per la sicurezza (es. 'gestione emergenze' in un corso antincendio). Per superare la valutazione il lavoratore deve raggiungere la soglia minima su ogni area critica individualmente, anche se il punteggio complessivo è alto. Senza must-pass un punteggio del 90% può nascondere un buco letale in un'area chiave.