Intelligenza artificiale e verifica dell'apprendimento: come funziona davvero nella formazione sicurezza
Come l'intelligenza artificiale genera domande, valuta risposte aperte e personalizza lo studio nella formazione sicurezza dopo l'Accordo Stato-Regioni 2025: cosa fa davvero, cosa non può fare, perché serve sempre la revisione umana e perché l'AI dà misurabilità ma non garantisce da sola la conformità.
L'intelligenza artificiale è entrata nella formazione sulla sicurezza da una porta precisa: la verifica dell'apprendimento. Dopo l'Accordo Stato-Regioni del 17 aprile 2025 non basta più erogare il corso e registrare il completamento — bisogna misurare cosa il lavoratore ha appreso e dimostrarlo. È un lavoro che, fatto a mano su centinaia di lavoratori, è insostenibile: ed è esattamente dove l'AI dà un vantaggio reale. Ma intorno al tema c'è molta confusione, tra chi promette che "l'AI fa tutto" e chi teme che produca quiz a caso. Questa guida spiega cosa l'intelligenza artificiale fa davvero nella verifica dell'apprendimento, cosa non può fare, e perché la supervisione umana non è un dettaglio ma il cuore del metodo. Per il quadro generale della verifica vedi la guida alla verifica di efficacia; per le regole della verifica finale, l'articolo sull'Accordo 2025.
L'intelligenza artificiale può fare la verifica dell'apprendimento richiesta dall'Accordo 2025?
Sì, l'AI può generare le domande dai materiali del corso, somministrare quiz e scenari, e produrre punteggi e rapporti per area di competenza. Ma la conformità resta una responsabilità umana: l'AI fornisce misurabilità e tracciabilità, non garantisce da sola che la verifica sia conforme.
È una distinzione che conviene fissare subito, perché separa l'uso serio dell'AI dal marketing. L'Accordo 2025 chiede una verifica finale strutturata (test scritto con almeno 30 domande nei corsi iniziali, 10 nell'aggiornamento, risposta multipla con almeno 3 alternative, soglia 70%) e, a carico del datore di lavoro, una verifica di efficacia nel tempo. L'AI accelera la parte meccanica di tutto questo: produrre le domande, somministrarle, correggerle, archiviare le evidenze. Ciò che non può fare è prendersi la responsabilità della verifica al posto di una persona. La conformità nasce dalla combinazione di tre cose: configurazione corretta della verifica, revisione umana, e firma di chi è responsabile (formatore per la verifica finale, datore di lavoro per l'efficacia).
In breve: l'AI è una leva di produttività e di misurabilità, non un timbro di conformità.
Come genera le domande l'AI a partire dai materiali del corso?
L'AI estrae il testo dai documenti del corso (PDF, slide, dispense), li indicizza e genera domande ancorate a quei contenuti specifici tramite tecniche di retrieval (RAG), non pescandole da banche dati generiche. Ogni domanda viene etichettata per area di competenza e per livello cognitivo.
La differenza tra una domanda generata "dal nulla" e una ancorata ai materiali è sostanziale per la conformità. L'Accordo 2025 vuole che le domande coprano gli argomenti effettivi del corso: un quiz preso da una banca pubblica generica non lo soddisfa. Il flusso corretto è:
- Estrazione e indicizzazione dei materiali caricati dal formatore.
- Generazione ancorata (RAG): il modello costruisce le domande recuperando i passaggi pertinenti dai documenti, così la domanda nasce dal contenuto reale del corso.
- Etichettatura per area di competenza e per livello della tassonomia di Bloom (ricordare, comprendere, applicare, analizzare).
- Revisione umana prima della pubblicazione: è il passaggio non negoziabile.
Su quest'ultimo punto, uno strumento serio espone una matrice di copertura — per ogni coppia (area × livello cognitivo) mostra quante domande approvate esistono — così il formatore vede a colpo d'occhio dove la verifica è solida e dove è scoperta, invece di fidarsi alla cieca. La distribuzione dei tipi di domanda e i criteri docimologici sono trattati nella guida alla verifica di efficacia.
Come valuta l'AI le risposte aperte e gli scenari?
L'AI valuta una risposta aperta confrontandola con una rubrica esplicita e con i materiali del corso, producendo un punteggio per area con motivazione. È affidabile solo se è vincolata a quella rubrica e se il suo comportamento è verificabile prima dell'uso reale.
Qui si trova il punto più delicato di tutta la materia, ed è bene affrontarlo senza giri di parole. Un modello linguistico, lasciato libero, tende a essere generoso e "disobbediente": può premiare una risposta ben scritta ma sbagliata, o ignorare un criterio. Per questo la valutazione automatica delle risposte aperte è seria solo a tre condizioni:
- Rubrica esplicita: i criteri di valutazione sono definiti dal formatore, non lasciati al modello.
- Ancoraggio ai materiali: l'AI valuta sulla base dei contenuti del corso, non del proprio "buon senso" generico.
- Anteprima e verifica: il formatore può provare la valutazione su risposte campione e controllare che il modello segua davvero la rubrica, prima di somministrarla ai lavoratori.
Negli scenari conversazionali — in cui l'AI espone una situazione di lavoro, il lavoratore risponde e l'AI fa uno o due follow-up — questo controllo è ancora più importante, perché si misura il giudizio applicato e non una risposta secca. Senza rubrica verificabile, lo scenario diventa una chiacchierata; con la rubrica, diventa una prova di competenza documentabile.
L'AI personalizza lo studio sulle aree deboli?
Sì: dalla valutazione iniziale l'AI individua le aree in cui il lavoratore è sotto soglia e concentra lì lo studio successivo, lasciando intatte le aree già padroneggiate. È il ciclo che trasforma la verifica da semplice voto a strumento di apprendimento.
Lo schema, applicato alla sicurezza, è un anello in quattro passaggi:
| Fase | Cosa fa l'AI | A cosa serve |
|---|---|---|
| Valutazione iniziale | Misura il punto di partenza per area di competenza | Sapere dove intervenire, non solo certificare |
| Studio mirato | Propone ripasso e quiz solo sulle aree deboli | Ridurre l'attrito: le aree forti non aggiungono lavoro |
| Verifica finale | Test conforme (≥30 domande, soglia 70%) | Documentare l'apprendimento raggiunto |
| Follow-up | Re-test a 6-12 mesi, misura la ritenzione | Dimostrare l'efficacia nel tempo |
Il valore per la conformità è doppio: il lavoratore studia meglio (sulle proprie lacune reali) e l'organizzazione ottiene un dato di ritenzione — il confronto tra punteggio post-corso e follow-up — che è esattamente l'evidenza di efficacia che gli ispettori cercano dopo la Circolare INL n. 1 del 23 febbraio 2026. Le modalità operative del follow-up sono nella guida alla verifica di efficacia.
Quali sono i limiti e i rischi dell'AI nella valutazione?
I rischi reali sono tre — allucinazioni, mancata aderenza alle istruzioni e trattamento dei dati personali — e ciascuno ha una mitigazione precisa. Ignorarli produce verifiche inaffidabili; gestirli rende l'AI uno strumento solido.
| Rischio | Cosa significa | Mitigazione |
|---|---|---|
| Allucinazione | Il modello produce una risposta plausibile ma errata | Ancorare l'AI ai soli materiali del corso (RAG); revisione umana delle domande |
| Mancata aderenza alla rubrica | Il modello non segue i criteri di valutazione | Rubrica esplicita + anteprima per verificare il comportamento prima dell'uso |
| Dati personali | Risposte e profili dei lavoratori sono dati personali | Infrastruttura conforme al GDPR, dati trattati in UE, minimizzazione |
| Bias del modello | Domande sbilanciate o non rappresentative | Matrice di copertura per area × Bloom; controllo del formatore |
Il filo comune è uno solo: la revisione umana non è eliminabile. L'AI riduce di ordini di grandezza il lavoro manuale, ma il giudizio docimologico — quali aree contano, quali sono critiche, cosa è una risposta corretta — resta una responsabilità della persona. Uno strumento che promette di togliere del tutto l'umano dal processo non sta descrivendo una verifica conforme, sta descrivendo un rischio.
L'AI garantisce la conformità all'Accordo Stato-Regioni 2025?
No. Nessuno strumento garantisce di per sé la conformità. L'AI rende la verifica misurabile, ripetibile e documentabile — quindi molto più facile da dimostrare in ispezione — ma la conformità dipende dalla configurazione corretta, dalla revisione umana e dalla responsabilità di chi eroga e di chi è datore di lavoro.
È la stessa distinzione del primo paragrafo, e vale la pena chiuderci la guida perché è il punto su cui si gioca la credibilità di tutto il settore. Un fornitore onesto promette misurabilità, non conformità: la conformità è un esito che dipende anche da come lo strumento viene usato. Concretamente, l'AI aiuta a essere conformi quando produce verifiche tracciabili e ancorate ai contenuti, copre i Learning Object in modo documentabile, conserva le evidenze per i dieci anni del fascicolo formativo e rende ripetibile la verifica di efficacia nel tempo. Tutto questo riduce il rischio in ispezione; non lo azzera al posto delle persone.
Chi vuole vedere come si traduce in pratica — generazione delle domande, scenari, rapporti per il fascicolo — può guardare un corso reale in una dimostrazione di 15 minuti. Per i criteri con cui scegliere uno strumento, la guida al software per la formazione sicurezza.
Riferimenti normativi
- Accordo Stato-Regioni del 17 aprile 2025 in materia di formazione alla sicurezza sul lavoro (Rep. atti n. 59/CSR, pubblicato in Gazzetta Ufficiale n. 119 del 24 maggio 2025); fine del periodo transitorio il 24 maggio 2026.
- D.Lgs. 81/2008, art. 37, formazione dei lavoratori.
- Circolare INL n. 1 del 23 febbraio 2026, sul riorientamento dei controlli verso la verifica sostanziale.
- Regolamento (UE) 2016/679 (GDPR) per il trattamento dei dati personali dei lavoratori.
Documento informativo, non costituisce parere legale.
Le risposte alle domande più frequenti
L'intelligenza artificiale può fare la verifica dell'apprendimento richiesta dall'Accordo 2025?
L'AI può generare le domande dai materiali del corso, somministrare quiz e scenari, e produrre punteggi e rapporti per area di competenza. Ma la conformità resta una responsabilità umana: l'AI fornisce misurabilità e tracciabilità, non garantisce da sola che la verifica sia conforme. Servono configurazione corretta, revisione delle domande e la firma del formatore o del datore di lavoro.
Come fa l'AI a generare domande dai materiali del corso?
Estrae il testo dai documenti caricati (PDF, slide, dispense), li indicizza, e genera domande ancorate a quei contenuti tramite tecniche di retrieval (RAG), non da banche dati generiche. Le domande vengono etichettate per area di competenza e per livello cognitivo (tassonomia di Bloom). Resta indispensabile la revisione umana prima della pubblicazione.
L'AI può valutare in modo affidabile le risposte aperte e gli scenari?
Sì, se è vincolata a una rubrica esplicita e ai materiali del corso. Il rischio reale è che il modello non segua le istruzioni di valutazione: per questo serve un controllo granulare dei criteri e una modalità di anteprima per verificare il comportamento prima di usarlo con i lavoratori. Senza rubrica e senza revisione, la valutazione automatica delle risposte aperte non è affidabile.
Quali sono i rischi dell'AI nella valutazione della formazione?
Tre principali: allucinazioni (il modello inventa una risposta plausibile ma errata), mancata aderenza alle istruzioni di valutazione, e trattamento di dati personali. Si mitigano ancorando l'AI ai soli materiali del corso, imponendo una rubrica verificabile con revisione umana, e usando un'infrastruttura conforme al GDPR con dati in UE.
L'AI garantisce la conformità all'Accordo Stato-Regioni 2025?
No. Nessuno strumento, AI inclusa, garantisce di per sé la conformità. L'AI rende la verifica misurabile, ripetibile e documentabile — cioè più facile da dimostrare in ispezione — ma la conformità dipende dalla corretta configurazione della verifica, dalla revisione umana e dalla responsabilità del datore di lavoro e dell'ente di formazione.
L'intelligenza artificiale sostituisce il formatore?
No. Sposta il lavoro del formatore dalla produzione manuale (scrivere domande, correggere test) alla supervisione (definire le aree, rivedere le domande, validare i criteri di valutazione). Il giudizio docimologico, la definizione delle aree critiche e la responsabilità della verifica restano umani.