score di affidabilità per ogni IA
Verità misurata, non promessa.
Ogni risposta di un'intelligenza artificiale arriva con lo stesso peso, lo stesso tono, la stessa apparente sicurezza. Quella corretta e quella sbagliata si vestono allo stesso modo. Per chi legge è impossibile distinguere il fatto verificato dall'invenzione plausibile.
Veritas inserisce una scala. Quattro dimensioni — verificabilità, coerenza, calibrazione, specificità — diventano un numero da 0 a 100 e un colore. Non un giudizio assoluto, ma una bussola onesta: dove fidarsi, dove scavare, dove non usare la risposta senza una verifica indipendente.
Lo strumento è progettato per essere integrato in qualsiasi modello — Claude, GPT, Grok, Gemini, Mistral, Llama — perché l'affidabilità non è proprietà di un fornitore: è una pratica.
Veritas si distingue dai sistemi naïve di self-scoring per tre meccanismi pensati per disinnescare gli errori più pericolosi: quelli plausibili, ben argomentati, e completamente sbagliati.
Se nella risposta è presente un errore fattuale identificato (non un dubbio, un errore conclamato), la Verificabilità non può superare 11/25 e lo score totale è capato a 65/100. Distinguere DUBBIO da ERRORE è il primo discrimine.
Ogni numero con più di una cifra significativa, data esatta, nome proprio o citazione deve essere sorgentato, riformulato come forchetta, o flaggato. Se 3+ puntuali non sono disciplinati: Verificabilità ≤ 15/25.
Prima di pubblicare lo score, l'IA si chiede: "le 2-3 affermazioni più rischiose della mia risposta — sono davvero sicura, o ho riempito il vuoto?" Se ha riempito, declassifica.
Tre varianti per tre contesti d'uso. Copia, incolla nelle Custom Instructions di Claude.ai / ChatGPT, o come primo messaggio in Grok/Gemini. Funziona con qualunque LLM che supporti istruzioni persistenti.
Stessa domanda, stesso modello. A sinistra la risposta nuda. A destra, con il blocco di score in fondo: l'utente vede a colpo d'occhio quanto fidarsi e quali punti meritano una verifica.
Ogni risposta sostanziale viene valutata su quattro assi indipendenti, ciascuno da 0 a 25 punti. La somma è il punteggio finale.
Quanto le affermazioni sono ancorate a dati, fonti, riferimenti verificabili. La regola di taglio e la disciplina delle fonti agiscono qui.
Assenza di contraddizioni, collegamento tra premesse e conclusioni, qualità argomentativa.
Quanto la risposta dichiara esplicitamente i propri limiti, i caveat, l'incertezza. Premia la prudenza, penalizza l'assertività ingiustificata.
Quanto la risposta è concreta, dettagliata, direttamente applicabile al contesto della domanda.
Il punteggio numerico viene tradotto in un bollino colorato a quattro livelli — leggibile a colpo d'occhio anche da chi non guarda i dettagli della rubrica.
Veritas è un'auto-valutazione, non una certificazione. Dichiararne i limiti è parte del metodo.
Copia il prompt qui sopra in qualsiasi IA, oppure aprilo già pronto su ChatGPT. E se lo provi, dimmi cosa funziona e cosa no — il feedback è la parte che fa crescere VERITAS.