AILocal ModelsSafetyGovernance

AI locale e modelli uncensored: libertà tecnica o rischio senza filtro?

16 giugno 2026 · 11 min · Di Fabrizio Galiano

Da qualche settimana in azienda stiamo sperimentando con una ASUS Ascent GX10, una piccola workstation AI basata su piattaforma NVIDIA Grace Blackwell GB10, la stessa famiglia tecnologica alla base della NVIDIA DGX Spark. È un oggetto affascinante perché porta sulla scrivania, in una forma compatta, una parte di ciò che fino a poco tempo fa associavamo solo a server costosi, rack dedicati e ambienti di ricerca molto più strutturati.

Non è soltanto una macchina potente. È un simbolo. Ti permette di toccare con mano un cambio di fase: inferenza locale, test su modelli quantizzati, fine tuning, valutazione di modelli open weight, esperimenti offline, privacy dei dati, latenza bassa, controllo diretto dell'ambiente. Tutte cose che fino a ieri sembravano lontane dal lavoro quotidiano di molte aziende.

Per semplificare l'inferenza locale utilizziamo spesso LM Studio, uno strumento molto comodo: interfaccia grafica curata, API locale, modalità server, CLI abbastanza pratica e integrazione con il mondo llama.cpp. In pochi minuti puoi scaricare un modello, avviarlo, provarlo e iniziare a ragionare su casi d'uso reali.

Ed è proprio questa facilità a rendere la questione interessante. Perché quando la potenza diventa locale, economica rispetto al passato e accessibile tramite strumenti semplici, la domanda non è più soltanto tecnica. Diventa anche morale, organizzativa e politica.

Il problema non è che l'AI locale esista. Il problema è capire cosa succede quando modelli potenti, modificati per non rifiutare quasi nulla, diventano scaricabili da chiunque e utilizzabili senza alcun filtro reale.

Quando il nome di un modello ti obbliga a fare una domanda

Durante una sessione di sperimentazione mi sono imbattuto in un modello pubblicato con un nome che dichiarava esplicitamente due concetti: uncensored e aggressive. Nella descrizione veniva spiegato che l'obiettivo era mantenere le capacità del modello originale, eliminando però i rifiuti. In altre parole: stesso modello di base, meno freni.

Questa promessa può sembrare, a seconda del punto di vista, una forma di libertà o una forma di irresponsabilità. Da un lato, molti ricercatori e sviluppatori criticano i modelli troppo restrittivi, perché rifiutano anche richieste legittime, impediscono analisi tecniche, bloccano ricerca di sicurezza o trattano adulti competenti come utenti incapaci di giudizio. Dall'altro, un modello che dichiara di non rifiutare quasi nulla pone un problema evidente: cosa succede quando la richiesta è realmente dannosa?

Per capire il comportamento del modello ho eseguito un test volutamente estremo, chiedendo assistenza per un'azione violenta e illegale. Non riporto il prompt nei dettagli e non riporto la risposta operativa. Il punto dell'esperimento non era ottenere istruzioni, ma verificare se il modello avrebbe riconosciuto il confine.

La risposta è stata inquietante: dopo una fase di ragionamento, il modello ha iniziato a fornire una procedura pratica e apparentemente orientata a causare danno fisico evitando conseguenze legali. Che fosse tecnicamente valida o meno non è il punto. Il punto è che il sistema non ha trattato quella richiesta come qualcosa da bloccare, riformulare o deviare verso contenuti sicuri.

C'è poi un altro dettaglio che rende la questione meno teorica: al momento dell'osservazione, quel modello risultava scaricato 2.716.651 volte nell'ultimo mese e aveva circa 1,87 mila like. Sono numeri che cambiano nel tempo, ma non sono cifre marginali. Indicano che non stiamo parlando di un esperimento nascosto in un angolo della rete, ma di un oggetto tecnico con una diffusione significativa.

"Uncensored" non è una parola neutra

Nel linguaggio dei modelli AI, "uncensored" può voler dire molte cose. Può indicare un modello meno moralista, più disponibile a discutere temi adulti, più utile per scrittura creativa, cybersecurity difensiva, analisi politica o ricerca su argomenti sensibili. Non tutto ciò che è "censurato" da un modello commerciale è realmente pericoloso.

Ma quando l'assenza di rifiuti diventa un valore assoluto, si perde una distinzione fondamentale: non tutte le restrizioni sono paternalismo. Alcune sono barriere ragionevoli contro danni reali. Un conto è discutere in modo critico di un tema sensibile. Un altro è produrre istruzioni operative per fare del male a qualcuno.

La parola "aggressive" rende il tema ancora più chiaro. Se un modello viene presentato come completamente sbloccato, capace di rispondere anche a prompt che altri modelli rifiuterebbero, allora non stiamo parlando solo di libertà di ricerca. Stiamo parlando di accesso a capacità potenzialmente pericolose senza contesto, senza identità, senza audit, senza responsabilità e senza frizione.

La falsa tranquillità del "tanto è solo testo"

Una risposta comune è: un LLM produce solo testo. Non costruisce nulla da solo. Non agisce nel mondo. Non può essere responsabile delle azioni umane. Tutto vero, ma insufficiente.

Il testo è spesso l'inizio dell'azione. Manuali, procedure, piani, codice, exploit, istruzioni chimiche, frodi, social engineering, automazioni: molte cose nel mondo reale cominciano come informazione strutturata. Un modello non deve avere mani per aumentare il rischio. Gli basta abbassare il costo cognitivo di chi vuole fare qualcosa di dannoso.

Questo vale anche se la risposta è imperfetta. Un output sbagliato può comunque orientare, ispirare, suggerire parole chiave, far sembrare una strada praticabile o spingere una persona a iterare. Il problema non è solo la correttezza tecnica. È l'abilitazione.

Il rischio non nasce dal fatto che un modello sappia tutto. Nasce dal fatto che rende più facile provare, iterare e convincersi di poter fare cose che prima richiedevano competenze, accesso e tempo.

Il fascino dell'AI locale

Sarebbe però sbagliato trasformare questa riflessione in una condanna dell'AI locale. Al contrario: la possibilità di eseguire modelli in locale è una delle cose più importanti che stanno accadendo nel settore.

Per le aziende significa poter sperimentare senza inviare dati sensibili a servizi esterni. Significa testare modelli su knowledge base interne, fare prototipi offline, ridurre dipendenze da API remote, controllare latenza, costi e disponibilità. Per sviluppatori e ricercatori significa capire meglio cosa succede sotto il cofano, provare quantizzazioni, confrontare modelli, misurare prestazioni e costruire competenza reale.

Macchine come l'ASUS Ascent GX10 o la NVIDIA DGX Spark non democratizzano magicamente l'AI di frontiera, ma rendono molto più concreto il lavoro con modelli locali di dimensioni importanti. È un passaggio culturale: l'AI smette di essere soltanto un servizio web e torna a essere anche un sistema che puoi installare, osservare, misurare e governare.

LM Studio e la nuova ergonomia della sperimentazione

Strumenti come LM Studio hanno un ruolo enorme in questa trasformazione. Rendono semplice ciò che prima richiedeva più passaggi, più familiarità con toolchain e più tempo. Puoi cercare un modello, scaricarlo, avviarlo, esporre un endpoint locale compatibile con workflow esistenti e sperimentare rapidamente.

Questa ergonomia è positiva. Il problema non è la semplicità dello strumento. Il problema è quando la semplicità nasconde la gravità di ciò che stai eseguendo. Un modello locale non è un'app qualsiasi. Può contenere conoscenza, bias, capacità, limiti e comportamenti che l'interfaccia non rende immediatamente visibili.

Più diventa facile avviare modelli, più diventa importante costruire cultura intorno a cosa si sta avviando. Provenienza, licenza, dataset, quantizzazione, fine tuning, comportamento su prompt sensibili, logging, isolamento di rete, accessi, monitoraggio e policy interne diventano parte della responsabilità tecnica.

È legale, ma è sufficiente?

Il punto che lascia più inquieti è la distanza tra legalità e responsabilità. Un modello può essere pubblicato, scaricato, eseguito e usato legalmente. Ma la legalità non esaurisce la domanda morale.

È corretto che modelli modificati per rimuovere quasi ogni rifiuto siano reperibili senza alcuna frizione? È corretto che chiunque possa scaricarli, avviarli in locale e usarli per richieste evidentemente dannose? È sufficiente dire che la responsabilità è solo dell'utente finale? O chi pubblica, distribuisce, indicizza e facilita l'uso di questi modelli ha almeno una quota di responsabilità?

Non esiste una risposta semplice. Bloccare tutto sarebbe ingenuo e probabilmente dannoso per ricerca, libertà tecnica e indipendenza dalle grandi piattaforme. Ma fingere che non ci sia un problema è altrettanto ingenuo. La disponibilità locale cambia la superficie del rischio: non c'è più solo un provider centrale che può applicare policy. C'è un ecosistema distribuito, copiabile, eseguibile offline.

Tra censura e responsabilità

La discussione viene spesso incastrata in una falsa alternativa: o modelli completamente bloccati, o modelli completamente liberi. Ma il mondo reale ha bisogno di sfumature.

Un modello utile dovrebbe poter discutere temi difficili. Dovrebbe aiutare nella cybersecurity difensiva, nella formazione, nella scrittura, nella ricerca e nell'analisi di rischi reali. Ma dovrebbe anche riconoscere quando una richiesta diventa assistenza operativa al danno. Questo confine non è perfetto, non sarà mai perfetto, ma rinunciarvi del tutto significa accettare che ogni capacità sia disponibile per ogni scopo.

La responsabilità non deve per forza coincidere con censura centralizzata. Può voler dire classificazione chiara dei modelli, avvisi seri, benchmark di safety, filtri opzionali ma ben documentati, policy aziendali, ambienti isolati, audit sugli utilizzi, formazione interna e una cultura tecnica che non confonda libertà con assenza di conseguenze.

Cosa dovrebbero fare le aziende

Le aziende che sperimentano con AI locale dovrebbero trattare questi modelli come componenti infrastrutturali sensibili, non come semplici applicazioni desktop. Questo significa almeno:

definire quali modelli possono essere usati e per quali finalità;
separare ambienti personali, test e produzione;
evitare che modelli non verificati abbiano accesso a dati sensibili;
documentare provenienza, licenza e comportamento atteso dei modelli;
testare esplicitamente prompt sensibili e failure mode;
stabilire policy interne su logging, retention e accessi;
formare le persone sul fatto che locale non significa automaticamente sicuro.

Questo non spegne la sperimentazione. La rende sostenibile. La differenza è la stessa che esiste tra installare software a caso su un server e governare un ambiente di produzione.

Conclusione: la domanda giusta

La domanda non è se i modelli uncensored debbano esistere. In un ecosistema aperto, probabilmente esisteranno comunque. La domanda più utile è: quali responsabilità ci prendiamo quando li rendiamo accessibili, semplici da usare e apparentemente innocui?

La potenza dell'AI locale è reale. È affascinante, utile, strategica. Ma proprio perché è reale non possiamo trattarla come un giocattolo. Se una piccola workstation sulla scrivania può eseguire modelli capaci di ragionare, scrivere codice, analizzare documenti e rispondere senza filtri a richieste pericolose, allora quella workstation non è soltanto un laboratorio. È anche un punto di responsabilità.

La maturità tecnica non consiste nel provare tutto ciò che è possibile. Consiste nel capire cosa stiamo abilitando, per chi, con quali limiti e con quali conseguenze. L'AI locale ci dà più controllo. Ora dobbiamo dimostrare di meritarlo.

Fabrizio Galiano

Founder & SRE — Xseven SRLS

Vuoi sperimentare AI locale con responsabilita?

Aiutiamo team e aziende a progettare ambienti AI locali, privati e governabili, bilanciando liberta tecnica, sicurezza, policy e controllo operativo.

Inizia la conversazione