
Se pensavate che il futuro dell’intelligenza artificiale fosse una proprietà esclusiva di qualche parco giochi in California con budget infinito, preparatevi a rimettervi in discussione.
DeepSeek ha appena lanciato la preview di V4 e, come al solito, ha deciso di dare una scossa elettrica al settore. Non parliamo solo di un aggiornamento incrementale, ma di una release che punta tutto sull’efficienza e sull’open-source. Abbiamo qui due versioni: la ‘Pro’, un mostro da 1.6 trilioni di parametri totali (ma con soli 49B attivi, perché l’efficienza è tutto), e la ‘Flash’, che è praticamente il turbo per chi ha bisogno di risposte veloci senza dover vendere un rene per pagare le API.
La vera bomba? Il context window da 1 milione di token. Sì, avete letto bene. Potete letteralmente buttargli dentro intere documentazioni, repository di codice o quei manuali di elettronica che tenete in soffitta dal 1998, e lui non perderà il filo. E la cosa figa è che lo fanno con un’architettura nuova, la ‘DeepSeek Sparse Attention’, che promette di ridurre drasticamente il carico di calcolo e memoria. In pratica, meno hardware della madonna necessario per far girare roba seria.
Dal punto di vista di chi ama smanettare, la notizia è oro colato. La versione Pro vanta capacità ‘agentic’ che nei benchmark di coding sono ai vertici del settore. Se state scrivendo script per la vostra CNC o cercate di automatizzare un processo di modellazione in Blender, avere un modello che capisce davvero il contesto e non si perde dopo tre righe di codice è una svolta. E la versione Flash? È perfetta per essere integrata nei vostri piccoli progetti o bot locali, senza distruggere il budget della vostra associazione maker.
C’è però un piccolo ‘ma’ da considerare, perché come sempre nel mondo tech, non è tutto rose e fiori. DeepSeek ha annunciato che i vecchi modelli ‘deepseek-chat’ e ‘deepseek-reasoner’ verranno ritirati a luglio. Un classico move da vendor: ‘ti faccio innamorare della nuova tecnologia e poi ti taglio i ponti con la vecchia’. Inoltre, sebbene i pesi siano aperti, restate sempre attenti a dove mandate i vostri dati. L’open-source è la nostra libertà, ma la privacy rimane un campo di battaglia.
In definitiva, V4 è una reminder fondamentale: la forza bruta dei modelli chiusi sta incontrando una resistenza insuperabile grazie all’ottimizzazione intelligente. Per noi che amiamo smontare i sistemi per capire come funzionano, vedere un’innovazione strutturale così profonda nel modo di gestire l’attenzione è pura poesia digitale. Andate a testarlo, scaricate i pesi da HuggingFace e vedete se regge il confronto con i vostri workflow più complessi. Se regge, il gioco si fa molto più interessante.
Source: DeepSeek v4
