Anthropic: prompt più veloci con il caching

Anthropic ha lanciato una nuova funzionalità di prompt caching per i suoi modelli AI Claude 3.5 Sonnet e Claude 3 Haiku, ora disponibile in versione beta pubblica. Questa innovazione permette agli sviluppatori di memorizzare contesti frequentemente utilizzati tra le chiamate API, con l'obiettivo di ridurre significativamente costi e latenza per i prompt lunghi.

Il prompt caching rappresenta un importante passo avanti nell'ottimizzazione delle interazioni con i modelli di linguaggio AI. Questa tecnologia può portare benefici sostanziali in vari ambiti applicativi, dalla creazione di assistenti conversazionali più efficienti allo sviluppo di strumenti di codifica avanzati.

Vantaggi e Applicazioni

La nuova funzionalità offre diversi vantaggi in scenari specifici:

- Agenti conversazionali: Riduce costi e latenza nelle conversazioni prolungate, specialmente con istruzioni complesse o documenti caricati. - Assistenti di codifica: Migliora l'autocompletamento e le funzionalità di domande e risposte sul codice. - Elaborazione di documenti lunghi: Permette di incorporare efficacemente materiali estesi come libri o articoli. - Set di istruzioni dettagliate: Consente di condividere liste estese di istruzioni ed esempi per affinare le risposte del modello. - Utilizzo di strumenti agenti: Ottimizza le prestazioni in scenari che richiedono multiple chiamate a strumenti e modifiche iterative.

Il caching riduce i costi fino al 90% e la latenza fino all'85% per i prompt lunghi.

Funzionamento e Struttura dei Costi

Il sistema verifica la presenza di un prefisso del prompt già memorizzato da una query recente. Se trovato, utilizza la versione in cache, riducendo elaborazione e costi. La cache ha una durata di cinque minuti, aggiornandosi ad ogni utilizzo.

La struttura dei costi prevede un aumento del 25% per la scrittura nella cache rispetto al prezzo base dei token di input. Tuttavia, l'utilizzo del contenuto memorizzato costa solo il 10% del prezzo base, rendendo l'integrazione dell'AI più accessibile ed economicamente vantaggiosa.

Impatto sul Mercato

Con questa innovazione, Anthropic mira a ottimizzare l'uso delle API e ridurre i costi, facilitando lo sviluppo di applicazioni AI più sofisticate in vari settori. Aziende come Notion hanno già integrato questa funzionalità, registrando miglioramenti nell'esperienza utente e nelle operazioni interne grazie a una maggiore velocità e riduzione dei costi.

Il prompt caching rappresenta un passo significativo verso un'intelligenza artificiale più efficiente e accessibile, aprendo nuove possibilità per sviluppatori e aziende nell'implementazione di soluzioni AI avanzate.