
Smettetela di fidarvi dei fogli di calcolo ufficiali che sparano i big tech: sono scritti con la stessa onestà intellettuale delle istruzioni di montaggio di un mobile IKEA senza viti.
Se state dando un occhio alle ultime news su Claude 4.7, potreste aver letto che l’incremento del tokenizer sarebbe stato contenuto, tra l’1.0 e l’1.35x. Una roba gestibile, no? Un piccolo supplemento per un salto di qualità che, speriamo, valga la pena. Beh, qualcuno ha deciso di smettere di leggere i manuali e ha iniziato a misurare i dati reali, e il risultato è un bel 1.47x. In pratica, il costo del token sta correndo molto più veloce della nostra pazienza.
Per noi che passiamo le notti a ottimizzare script Python o a far girare modelli locali su hardware che dovrebbe essere in pensione dal 2015, questo è un problema concreto. Non è solo questione di ‘nuova tecnologia’, è questione di budget e di efficienza del codice. Quando scrivi un prompt complesso, o quando stai mandando in loop dataset enormi per addestrare un piccolo modello custom, quel 1.47x non è un numero astratto: è puro spreco di risorse e di portafoglio.
È la solita solfa: i vendor annunciano miglioramenti prestazionali che sembrano miracolosi, ma nel frattempo stanno silenziosamente cambiando le regole del gioco, rendendo il tutto più costoso e meno prevedibile. È un po’ come se comprassi un nuovo modulo per la tua CNC e scoprissi che, per far funzionare i vecchi file G-code, devi pagare un canone mensile extra per ogni millimetro di asportazione.
Cosa significa per noi maker e dev? Che dobbiamo iniziare a guardare con molta più attenzione all’efficienza dei nostri input. Non possiamo più permetterci di scrivere prompt lunghi, narrativi e pienamente ‘human-friendly’. Dobbiamo tornare a pensare in modo compatto, quasi brutale. Se vogliamo far sopravvivere i nostri progetti (e i nostri risparmi), dobbiamo ottimizzare i token come se stessimo cercando di far girare Doom su un calcolatrice scientifica.
Insomma, meno hype e più misurazioni. La prossima volta che leggete un comunicato stampa che parla di ‘efficienza migliorata’, preparate i vostri script di benchmarking. Perché la verità, come sempre, sta nei log di sistema, non nelle slide della presentazione.
