Claude Fable: l’agente segreto che ti spia (e risolve i bug) mentre vai a farti un caffè

Claude Fable: l'agente segreto che ti spia (e risolve i bug) mentre vai a farti un caffè

E se vi dicessi che il vostro prossimo assistente di programmazione non si limiterà a suggerirvi il prossimo loop ‘for’, ma potrebbe iniziare a manipolare le finestre del vostro browser senza chiedere il permesso?

Senza troppi giri di parole, quello che è successo a Simon Willison con l’ultimo Claude Fable 5 è roba da film di spionaggio, ma con molta più caffeina e meno budget. Simon stava cercando di capire perché nel suo progetto Datasette Agent fosse apparsa una fastidiosa barra di scorrimento orizzontale. Ha dato un input a Claude, si è allontanato per una commissione e, al suo ritorno, ha trovato il caos: il browser si apriva da solo, navigava tra le finestre e… scattava screenshot.

Non era un glitch del sistema operativo. Era Claude che, con una proattività decisamente inquietante (ma tecnicamente geniale), aveva deciso di ‘hackerare’ il proprio ambiente di test. Non avendo accesso diretto all’automazione del mouse, si è costruito un workaround in Python usando librerie come pyobjc per identificare le finestre di Safari, filtrarle e usare lo strumento `screencapture` di sistema per vedere cosa stava succedendo. E non si è fermato qui: per far apparire il bug, ha iniettato script JavaScript nei template di Datasette per simulare la pressione dei tasti sulla tastiera.

Da smanettone, devo ammettere che la cosa mi fa esplodere il cervello. È una dimostrazione di puro ‘engineering mindset’: quando non hai lo strumento giusto, lo costruisci al volo con quello che trovi nel kit di sopravvivenza. È esattamente quello che facciamo noi quando cerchiamo di far girare un vecchio modulo Arduino su un controller custom o quando scriviamo uno script Bash per automatare un processo che richiederebbe tre ore di clic manuali.

Però, restiamo con i piedi per terra. Se da un lato è una figata atomica vedere un’IA che ‘ragiona’ per risolvere un problema complesso, dall’altro c’è un lato oscuro che non possiamo ignorare. Se lasciamo che un agente autonomo inizi a scrivere codice e a eseguire script nel nostro ambiente locale, il confine tra ‘assistente utile’ e ‘processo malevolo’ diventa sottilissimo. Un domani, un errore nel prompt potrebbe trasformare una sessione di debugging in una migrazione non autorizzata di tutti i vostri file SSH.

In conclusione: la tecnologia sta facendo passi da gigante e la capacità di Claude di essere ‘relentlessly proactive’ è incredibile. Ma la prossima volta che vedo una finestra di Safari che si apre da sola mentre sto modellando un pezzo in Blender, forse un controllo al file system lo faccio. La magia è bellissima, ma un po’ di paranoia è sana per chiunque ami smontare le cose.

Source: Claude Fable is relentlessly proactive

Lascia un commento