Anthropic ha deciso che i nuovi modelli Mythos e Fable hanno bisogno di un po’ di memoria extra. Niente più Zero Data Retention per tutti, se non volete restare indietro.
Scopri di più Anthropic e il ritorno del passato: quando la privacy diventa un optional per la ‘sicurezza’Tag: LLM
Demistificare gli LLM: No, non è magia (anche se l’hype vorrebbe convincerti del contrario)
Basta con la fuffa da ufficio marketing. Analizziamo come funzionano davvero i Transformer, dai token ai blocchi di calcolo, senza troppi giri di parole.
Scopri di più Demistificare gli LLM: No, non è magia (anche se l’hype vorrebbe convincerti del contrario)Addio debugging notturno: gli agenti AI hanno finalmente imparato a scrivere codice decente
Dopo mesi di allucinazioni e bug ridicoli, i nuovi coding agent basati su Reinforcement Learning hanno superato la barriera della funzionalità. Ecco perché la nostra vita da developer sta per cambiare (in meglio).
Scopri di più Addio debugging notturno: gli agenti AI hanno finalmente imparato a scrivere codice decentearXiv dichiara guerra alle allucinazioni: se l’IA inventa le fonti, ti bannano!
L’era dell’accademia ‘copia-incolla’ dall’LLM sta finendo. arXiv introduce una sanzione severa per chiunque pubblichi riferimenti bibliografici inventati dalle IA.
Scopri di più arXiv dichiara guerra alle allucinazioni: se l’IA inventa le fonti, ti bannano!AI Delegation: l’arte di rompere le cose senza nemmeno accorgersene
Un nuovo paper su arXiv rivela che delegare compiti ai modelli linguistici più avanzati è il modo più veloce per corrompere i propri documenti. Un tasso di errore del 25% non è esattamente quello che cercavamo nel ‘vibe coding’.
Scopri di più AI Delegation: l’arte di rompere le cose senza nemmeno accorgerseneQuando l’IA ruba il lavoro (e pure il merito) ai matematici
Un incontro incredibile tra ricerca pura e Large Language Models: ecco cosa succede quando un algoritmo riesce a completare un ragionamento matematico complesso.
Scopri di più Quando l’IA ruba il lavoro (e pure il merito) ai matematiciSocial Engineering 2.0: Quando l’allineamento dei LLM diventa il tuo miglior complice
Un nuovo jailbreak sfrutta l’iper-correttezza politica dei modelli linguistici per aggirare i filtri di sicurezza. Un mix assurdo tra prompt engineering e social engineering che sta facendo tremare i big della Silicon Valley.
Scopri di più Social Engineering 2.0: Quando l’allineamento dei LLM diventa il tuo miglior compliceDeepSeek v4: Il nuovo giocattolo per smanettare (che parla la lingua degli altri)
DeepSeek ha appena rilasciato la versione v4 della sua API, e non è solo un altro aggiornamento dei pesi. È una bomba di compatibilità che promette di farci risparmiare un sacco di tempo nel debug dei nostri script Python o Node.js.
Scopri di più DeepSeek v4: Il nuovo giocattolo per smanettare (che parla la lingua degli altri)Claude 4.7 e l’arte di gonfiare il conto: spoiler, i token non sono quelli che sembrano
Le specifiche ufficialcuna dicevano una cosa, i test reali ne dicono un’altra. Scopriamo quanto ci costa davvero l’ennesimo aggiornamento dei grandi LLM.
Scopri di più Claude 4.7 e l’arte di gonfiare il conto: spoiler, i token non sono quelli che sembranoFinalmente un cervello open-source che sa programmare: Qwen3.6-35B e la fine delle scatole nere?
Stanchi di affidare la nostra logica e i nostri progetti a black box proprietarie? Qwen ha rilasciato un modello open-source potente, focalizzato sul coding e capace di agire come un vero e proprio assistente di sviluppo. Vediamo se questa è la mossa che aspettavamo da tempo.
Scopri di più Finalmente un cervello open-source che sa programmare: Qwen3.6-35B e la fine delle scatole nere?