Claude Code: Quando l’intelligenza artificiale decide di fare la sbronza (e Anthropic ci spiega perché)

Claude Code: Quando l'intelligenza artificiale decide di fare la sbronza (e Anthropic ci spiega perché)

Avete presente quella sensazione di quando smontate un vecchio Commodore 64 convinti di trovare un semplice contatto ossidato e invece vi ritrovate con la scheda madre che sembra un pezzo di carta bruciata? Ecco, qualcosa di molto simile è successo con Claude Code nell’ultimo mese.

Se avete notato che Claude ultimamente sembrava aver preso troppi caffè (o peggio, che avesse iniziato a soffrire di demenza precoce), non siete impazziti voi. Anthropic ha appena pubblicato un postmortem che è un mix tra un manuale di debugging e un diario di bordo di un naufragamente. In pratica, la loro AI ha deciso di fare un tour della regressione cognitiva, e la colpa è di una serie di decisioni che definire ‘disastrose’ è un complimento.

Andiamo con ordine, perché qui c’è del materiale succoso per ogni smanettone.

Primo punto: la pigrizia cognitiva. Per evitare che l’interfaccia sembrasse congelata mentre il modello ‘pensava’, hanno abbassato il default da High a Medium effort. Risultato? Un’intelligenza ridotta ai minimi termini. È come se avessero rimosso la scheda video dedicata dal tuo PC per risparmiare energia: funzionava, ma non potevi più far girare nulla che non fosse un foglio di calcolo.

Secondo punto, il vero colpo di genio (al contrario): un bug nel caching. Cercando di risparmiare token e velocizzare le sessioni inattive, hanno implementato una funzione che, invece di pulire solo la memoria vecchia, cancellava tutto il ragionamento precedente a ogni singolo turno. Claude si è ritrovato a vivere in un eterno presente, dimenticando perché stesse scrivendo proprio quella riga di codice. Praticamente un loop di amnesia digitale.

E il gran finale? Hanno provato a rendere Claude meno ‘chiacchierone’ aggiungendo istruzioni nel system prompt per limitare la verbosità. Un tentativo di ottimizzazione che ha finito per troncare la qualità del codice. È come se chiedessi a un compagno di progetto di essere sintetico e lui ti rispondesse solo con ‘Sì’, lasciandoti nel limbo della totale mancanza di contesto.

Per noi che passiamo le notti a debuggare script o a ottimizzare modelli per le nostre macchine CNC, questa è una lezione fondamentale: non toccate quello che funziona, specialmente quando si parla di ‘ottimizzazioni’ che toccano i parametri core. Il rischio è trasformare uno strumento potentissimo in un giocattolo inutile.

La buona notizia? Hanno risolto tutto, hanno resettato i limiti di utilizzo per tutti gli utenti e hanno promesso di testare tutto con molta più attenzione. Per ora possiamo tornare a usare Claude senza temere che ci risponda come un bot degli anni ’90, ma resta l’amaro in bocca. Speriamo che la prossima ‘ottimizzazione’ non decida di trasformare l’AI in un semplice calcolatore di sconti per il supermercato.

Source: An update on recent Claude Code quality reports

Lascia un commento