DeepSeek-R1: un nuovo modello “ragionante”
Articolo e report realizzati da Berardo Branella per il BlogAI di Mathesis Bergamo
Il 20 gennaio 2025, la start-up cinese DeepSeek ha rilasciato DeepSeek-R1, un modello di intelligenza artificiale che ha attirato l’attenzione per la sua efficienza computazionale e i costi di sviluppo molto contenuti rispetto a quelli delle altre imprese di AI. DeepSeek-R1 si distingue per essere open source, permettendo modifiche e personalizzazioni da parte degli sviluppatori. Al momento non genera immagini, ma supporta la navigazione web e il caricamento di file di testo e immagini fino a 100 MB.
Un elemento innovativo del modello è il suo approccio al ragionamento, che lo rende particolarmente adatto a discipline come la matematica e la fisica. Prima di fornire risposte, R1 espone un preambolo che illustra il suo percorso logico, offrendo potenzialità interessanti per la didattica. Il report allegato esplora queste funzionalità attraverso quattro percorsi: il ragionamento “a catena di pensiero”, un set di dodici domande, conversazioni matematiche e un’analisi computazionale di una poesia.