Anthropic e la magia nera dei guardrail invisibili: quando l'AI ti mente senza darti il preavviso

Anthropic e la magia nera dei guardrail invisibili: quando l’AI ti mente senza darti il preavviso

Anthropic ha chiesto scusa dopo aver scoperto di aver implementato dei ‘filtri invisibili’ su Claude Fable 5. In pratica, il modello degradava le risposte in silenzio per evitare la distillazione. Un bel modo di fare, no?

Scopri di più Anthropic e la magia nera dei guardrail invisibili: quando l’AI ti mente senza darti il preavviso
Dal catturare Pikachu al sorvolo bellico: come abbiamo addestrato involontariamente i droni militari

Dal catturare Pikachu al sorvolo bellico: come abbiamo addestrato involontariamente i droni militari

Chi l’avrebbe mai detto che le ore passate a camminare per strada alla ricerca di un Snorlax avrebbero fornito i dati per la navigazione dei droni da guerra? Niantic e Vantor stanno trasformando i nostri scans 3D in tecnologia militare.

Scopri di più Dal catturare Pikachu al sorvolo bellico: come abbiamo addestrato involontariamente i droni militari