CERT‑AgID: come orientare le decisioni dei modelli IA attraverso la “geometria del rifiuto”

Data:

26/03/26, 11:19

Autore:

Andrea Angelo Aronica

Tempo di lettura:

Il CERT‑AgID ha pubblicato un nuovo studio che analizza il meccanismo con cui i modelli di Intelligenza Artificiale decidono di rifiutare alcune richieste degli utenti, il cosiddetto refusal. La ricerca mostra che questo comportamento non è solo una regola astratta, ma assume una vera e propria forma geometrica all’interno dello spazio latente del modello, permettendo di studiarlo e modificarlo. 

Lo studio sottolinea l’importanza, per la Pubblica Amministrazione, dei modelli open‑weight, che consentono analisi indipendenti, maggiore trasparenza, possibilità di intervento diretto sui meccanismi decisionali e soprattutto una migliore protezione dei dati dei cittadini, grazie alla gestione interna delle informazioni. 

Per informazioni, visita la pagina: agid.gov.it