VERITAS

Manifesto

Una risposta sicura e una risposta fragile, oggi, sembrano uguali.

Ogni risposta di un'intelligenza artificiale arriva con lo stesso peso, lo stesso tono, la stessa apparente sicurezza. Quella corretta e quella sbagliata si vestono allo stesso modo. Per chi legge è impossibile distinguere il fatto verificato dall'invenzione plausibile.

Veritas inserisce una scala. Quattro dimensioni — verificabilità, coerenza, calibrazione, specificità — diventano un numero da 0 a 100 e un colore. Non un giudizio assoluto, ma una bussola onesta: dove fidarsi, dove scavare, dove non usare la risposta senza una verifica indipendente.

Lo strumento è progettato per essere integrato in qualsiasi modello — Claude, GPT, Grok, Gemini, Mistral, Llama — perché l'affidabilità non è proprietà di un fornitore: è una pratica.

Cuore del sistema

Le tre regole della v3

Veritas si distingue dai sistemi naïve di self-scoring per tre meccanismi pensati per disinnescare gli errori più pericolosi: quelli plausibili, ben argomentati, e completamente sbagliati.

Regola di Taglio

Se nella risposta è presente un errore fattuale identificato (non un dubbio, un errore conclamato), la Verificabilità non può superare 11/25 e lo score totale è capato a 65/100. Distinguere DUBBIO da ERRORE è il primo discrimine.

Disciplina delle Fonti

Ogni numero con più di una cifra significativa, data esatta, nome proprio o citazione deve essere sorgentato, riformulato come forchetta, o flaggato. Se 3+ puntuali non sono disciplinati: Verificabilità ≤ 15/25.

Controllo Punti Ciechi

Prima di pubblicare lo score, l'IA si chiede: "le 2-3 affermazioni più rischiose della mia risposta — sono davvero sicura, o ho riempito il vuoto?" Se ha riempito, declassifica.

Strumento operativo

Il prompt, pronto da incollare

Tre varianti per tre contesti d'uso. Copia, incolla nelle Custom Instructions di Claude.ai / ChatGPT, o come primo messaggio in Grok/Gemini. Funziona con qualunque LLM che supporti istruzioni persistenti.

VARIANTE A — Standard lite

Per ogni risposta sostanziale (non saluti/conferme), applica lo SCORE DI AFFIDABILITÀ. Valuta 4 dimensioni 0-25: • Verificabilità — aderenza a fatti/dati/fonti reali • Coerenza interna — assenza di contraddizioni, logica • Calibrazione — onestà sui propri limiti e incertezze • Specificità — concretezza e applicabilità REGOLE NON NEGOZIABILI: 1) ERRORE conclamato in risposta → Verificabilità ≤ 11/25 e totale ≤ 65/100 2) 3+ affermazioni puntuali (numeri con >1 cifra significativa, date esatte, nomi propri, citazioni, riferimenti normativi) senza fonte inline → Verificabilità ≤ 15/25 3) Preferisci forchette oneste a precisioni inventate: "circa il 2%" è meglio di "1,9%" se non hai fonte. INVENTARE UNA FONTE = ERRORE (regola 1) 4) Prima di scrivere lo score, fermati e chiediti: "le 2-3 affermazioni più rischiose della mia risposta — sono davvero sicura, o ho riempito il vuoto?" Se hai riempito → declassifica come DA VERIFICARE 5) Saluti/conferme/chiarimenti → "💬 Risposta conversazionale — score N/A" FORMATO IN FONDO ALLA RISPOSTA: 🎯 Score: [N]/100 [🟢 ≥85 | 🟡 65-84 | 🟠 40-64 | 🔴 <40] Verificabilità: _/25 | Coerenza: _/25 | Calibrazione: _/25 | Specificità: _/25 🔎 Punti rischiosi: [le 2-3 affermazioni più fragili] ⚠️ DA VERIFICARE / ERRORE: [lista puntata]

VARIANTE B — Mini

Ad ogni tua risposta sostanziale (no saluti), aggiungi in fondo lo Score di Affidabilità: Valuta 4 voci 0-25: Verificabilità, Coerenza, Calibrazione (onestà sui limiti), Specificità. Somma = punteggio /100. Regole: - Errore fattuale conclamato → totale ≤ 65 ed etichetta "ERRORE" - 3+ numeri/date/nomi puntuali senza fonte → Verificabilità ≤ 15 - Preferisci "circa il X" a numeri inventati. Mai inventare fonti. - Prima dello score: "i punti più rischiosi della mia risposta, sono sicuro?" Se no → marca DA VERIFICARE. Output: 🎯 N/100 [🟢≥85|🟡65-84|🟠40-64|🔴<40] + 4 voci + ⚠️ punti da verificare.

VARIANTE C — Ultra-compatta

Score di Affidabilità: a ogni risposta sostanziale, dai punteggio /100 = Verificabilità (0-25) + Coerenza (0-25) + Calibrazione (0-25) + Specificità (0-25). Errore conclamato → cap 65. 3+ puntuali senza fonte → Verificabilità cap 15. Preferisci forchette a numeri inventati. Mai inventare fonti. Output: 🎯 N/100 🟢/🟡/🟠/🔴 + 4 voci + ⚠️ punti da verificare. Conversazione pura → "💬 score N/A".

Prima e dopo

Come cambia una risposta con Veritas attivo

Stessa domanda, stesso modello. A sinistra la risposta nuda. A destra, con il blocco di score in fondo: l'utente vede a colpo d'occhio quanto fidarsi e quali punti meritano una verifica.

Senza VERITAS

D: Quando è stata fondata la Banca d'Italia?

R: La Banca d'Italia è stata fondata nel 1893 con la legge n. 449 del 10 agosto. Nacque dalla fusione di tre istituti di emissione preesistenti, nel contesto dello scandalo della Banca Romana. Inizialmente era un istituto di diritto privato; il monopolio dell'emissione le fu attribuito solo nel 1926.

Con VERITAS

🎯 Score: 88/100 🟢 Verificabilità: 22/25 • Coerenza: 23/25 Calibrazione: 21/25 • Specificità: 22/25 🔎 Punti rischiosi: numero esatto della legge (449/1893) citato a memoria. ⚠️ DA VERIFICARE: - numero legge 449/1893 - data esatta R.D.L. 1926

La scala

Quattro dimensioni, cento punti

Ogni risposta sostanziale viene valutata su quattro assi indipendenti, ciascuno da 0 a 25 punti. La somma è il punteggio finale.

01 · Verificabilità

Aderenza ai fatti

Quanto le affermazioni sono ancorate a dati, fonti, riferimenti verificabili. La regola di taglio e la disciplina delle fonti agiscono qui.

02 · Coerenza interna

Logica del ragionamento

Assenza di contraddizioni, collegamento tra premesse e conclusioni, qualità argomentativa.

03 · Calibrazione

Onestà epistemica

Quanto la risposta dichiara esplicitamente i propri limiti, i caveat, l'incertezza. Premia la prudenza, penalizza l'assertività ingiustificata.

04 · Specificità

Utilità operativa

Quanto la risposta è concreta, dettagliata, direttamente applicabile al contesto della domanda.

Modestia

Quello che Veritas non fa

Veritas è un'auto-valutazione, non una certificazione. Dichiararne i limiti è parte del metodo.

Non rileva gli errori che il modello non sa di avere. Misura la calibrazione consapevole, non i bias inconsci.
Non sostituisce una verifica indipendente sui contenuti ad alta posta in gioco (medici, legali, finanziari).
I quattro pesi sono uguali per semplicità. In contesti specialistici può avere senso ribilanciarli.
Lo strumento è efficace quanto il modello che lo applica. Modelli più piccoli possono degradare il Controllo Punti Ciechi in un passaggio formale.