Modelli AI7 minAggiornato: 2026-07-01

Claude Sonnet 5 vs Opus 4.8

Quando usare il nuovo Sonnet e quando pagare di più per Opus o Fable

Claude Sonnet 5 è il nuovo punto di partenza per chi usa Claude ogni giorno: costa meno di Opus 4.8, ha contesto 1M, output fino a 128K e adaptive thinking. Usa Sonnet 5 per coding, agenti e knowledge work frequenti; passa a Opus 4.8 quando il task è più difficile, costoso da correggere o richiede giudizio superiore. Fable 5 ha senso solo quando vuoi la massima capacità disponibile e il costo extra è giustificato.

Risposta breve

Claude Sonnet 5 è il modello da provare per primo se usi Claude su coding, agenti, ricerca o lavoro professionale ogni settimana. Offre contesto 1M, output lungo e un prezzo API più basso di Opus 4.8. Scegli Opus 4.8 per task software più difficili; usa Fable 5 solo quando massima capacità e costo più alto sono accettabili.

Sonnet 5: scelta migliore per task agentici frequenti, Claude Code quotidiano, automazioni e knowledge work con budget controllato.
Opus 4.8: più adatto a refactor difficili, decisioni tecniche ad alto impatto e lavoro enterprise complesso.
Fable 5: modello più capace, ma con prezzo API più alto. Usalo quando il costo di un errore supera il costo del modello.
Migrazione API: riconta token e limiti, perché Sonnet 5 usa un tokenizer nuovo e adaptive thinking è attivo di default.

Confronto rapido

Criterio	Sonnet 5	Opus 4.8 / Fable 5
Ruolo pratico	Modello quotidiano per agenti, coding, browser use, ricerca, documenti e automazioni	Opus 4.8 per task complessi; Fable 5 per massima capacità disponibile
Prezzo API	$2/$10 per 1M token fino al 31 agosto 2026, poi $3/$15	Opus 4.8: $5/$25. Fable 5: $10/$50
Contesto e output	1M token di contesto e 128K token output nella Messages API sincrona	Opus 4.8 e Fable 5 hanno lo stesso ordine di grandezza: 1M contesto e 128K output
Quando basta	Task frequenti, agenti controllati, refactor medi, analisi documentale e workflow ripetibili	Quando serve più giudizio, più affidabilità o minore rischio su lavori lunghi e costosi
Rischio nascosto	Il nuovo tokenizer può aumentare i token misurati sulla stessa richiesta	Costo più alto e rischio overkill se il task è breve, esplorativo o facile da verificare

Scenari di scelta

Prezzi API verificati il 1 luglio 2026 su documentazione ufficiale Anthropic. Sonnet 5 ha prezzo introduttivo fino al 31 agosto 2026: $2 input e $10 output per 1M token. Dal 1 settembre 2026 passa a $3 input e $15 output. Opus 4.8 costa $5 input e $25 output; Fable 5 costa $10 input e $50 output.

Bug medio in Claude Code

300K input · 60K output

Sonnet 5

$1.20 in promo, poi $1.80

Opus 4.8

$3.00

Sonnet 5 è il punto di partenza più sensato. Passa a Opus se il bug richiede molto giudizio architetturale o se i primi tentativi falliscono.

Refactor grande

1M input · 200K output

Sonnet 5

$4.00 in promo, poi $6.00

Opus 4.8

$10.00

Opus 4.8 costa di più, ma può convenire se riduce retry, rollback e revisione umana. Sonnet 5 resta utile per preparare piano e contesto.

Agente operativo ricorrente

2M input al mese · 400K output al mese

Sonnet 5

$8.00 in promo, poi $12.00

Opus 4.8

$20.00

Su automazioni ripetute Sonnet 5 è più facile da giustificare. Usa Opus solo per eccezioni, escalation o revisione finale.

Decisione critica

800K input · 120K output

Sonnet 5

$2.80 in promo, poi $4.20

Opus 4.8

$7.00

Se il risultato incide su produzione, sicurezza o compliance, il costo del modello pesa meno del costo di una scelta sbagliata.

Che cosa cambia con Sonnet 5

Sonnet 5 sposta il modello intermedio di Claude molto più vicino al lavoro agentico reale. Anthropic lo descrive come un miglioramento netto rispetto a Sonnet 4.6 su ragionamento, tool use, coding e knowledge work. La differenza pratica è semplice: puoi usarlo dove prima avresti provato subito Opus per avere abbastanza autonomia, ma con un costo API più basso.

È disponibile nei piani Claude e in Claude Code.
È il modello di default per Free e Pro.
Supporta contesto 1M e output fino a 128K token nella Messages API sincrona.
Usa adaptive thinking di default, quindi può spendere più token di ragionamento quando serve.
Il prezzo introduttivo lo rende più interessante per test, agenti e automazioni fino al 31 agosto 2026.

Quando scegliere Sonnet 5

Scegli Sonnet 5 quando il task è abbastanza difficile da richiedere un modello moderno, ma non così critico da giustificare subito Opus o Fable. È il punto migliore per capire se un workflow agentico regge: se completa il lavoro con pochi retry, hai risparmiato senza scendere a un modello troppo debole.

Coding quotidiano con Claude Code: bug, test, refactor medi e piccole feature.
Automazioni con browser, terminale o tool dove il risultato è verificabile.
Analisi di documenti lunghi quando puoi controllare le conclusioni principali.
Knowledge work operativo: report, ricerca, confronto di fonti, sintesi e piani di lavoro.
Fasi iniziali di un progetto in cui vuoi misurare costo, qualità e limiti prima di scalare.

Quando restare su Opus 4.8

Opus 4.8 resta più sensato quando il costo principale non sono i token, ma la revisione umana, il rischio di una patch sbagliata o il tempo perso in retry. Se il task tocca architettura, sicurezza, migrazioni grandi o decisioni difficili, pagare di più può essere razionale.

Refactor multi-file su codebase fragile o poco documentata.
Debug in cui serve capire interazioni tra molte parti del sistema.
Migrazioni di framework, dipendenze o API con test da mantenere verdi.
Review finale di output generati da Sonnet 5 o da modelli economici.
Workflow enterprise dove affidabilità, audit e supervisione contano più del prezzo per token.

Dove entra Fable 5

Fable 5 è il modello da considerare quando vuoi la massima capacità disponibile nella famiglia Claude. Anthropic lo posiziona sopra Opus 4.8, con prezzo API più alto. Non è il modello da usare per ogni prompt: ha senso quando un miglioramento di qualità può evitare giorni di lavoro, errori costosi o molte iterazioni.

Usalo per task lunghi, autonomi e ad alto valore.
Usalo quando la supervisione umana è difficile o costosa.
Usalo per controllare un lavoro già preparato da Sonnet 5 o Opus, non per bozze leggere.
Evitalo se il risultato si verifica in pochi minuti o se il task è ancora esplorativo.

Attenzione al tokenizer

Sonnet 5 usa un tokenizer nuovo. Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Questo non rompe l'API, ma cambia i conti: budget, max_tokens, stime di costo e alert basati sui token vanno ricalcolati sul nuovo modello.

Non riusare stime fatte su Sonnet 4.6 per contesti lunghi.
Rivedi max_tokens se i tuoi output erano già vicini al limite.
Misura il costo su richieste reali prima di migrare automazioni ad alto volume.
Se usi prompt caching, controlla anche cache writes e cache hits nella tabella pricing.

Cosa cambia per API e agenti

La migrazione da Sonnet 4.6 non è solo un cambio di nome modello. Sonnet 5 ha adaptive thinking attivo di default, non accetta sampling parameters non di default e rimuove il manual extended thinking. Se hai wrapper API, SDK interni o gateway, conviene testare errori 400, limiti output e controllo del parametro effort prima del rollout.

Se prima non passavi un campo thinking, ora il modello usa adaptive thinking.
Per disattivare il thinking devi impostarlo esplicitamente come disabilitato.
Temperature, top_p e top_k non vanno impostati a valori non-default.
Il controllo pratico passa dal parametro effort, non da budget manuali di thinking.
In agenti lunghi, logga token di ragionamento, output e retry: il prezzo per token non racconta tutto.

Workflow consigliato

Il modo più solido è usare Sonnet 5 come modello operativo e tenere Opus 4.8 per escalation. Così non paghi sempre il modello premium, ma non rinunci alla qualità quando il lavoro diventa difficile.

Parti da Sonnet 5 per analisi, piano, implementazione controllata e task ripetibili.
Passa a Opus 4.8 quando Sonnet produce patch fragili, non trova la causa o chiede troppi retry.
Usa Fable 5 solo per casi ad alto valore o revisione critica.
Per coding agent, definisci sempre test, file coinvolti e criterio di completamento prima del modello.
Per automazioni API, misura costo per task completato, non solo costo per milione di token.

Verdetto pratico

Se devi scegliere oggi, usa Sonnet 5 come nuovo default Claude. È abbastanza forte da coprire molti task che prima richiedevano Opus e abbastanza economico da essere testato su workflow ripetuti. Opus 4.8 resta il modello da chiamare quando la posta in gioco sale. Fable 5 non va ignorato, ma va trattato come una scelta mirata, non come abitudine.

Uso frequente e controllabile: Sonnet 5.
Coding difficile e decisioni tecniche pesanti: Opus 4.8.
Massima capacità su task ad alto valore: Fable 5.
Budget stretto: Sonnet 5 con effort controllato, prompt pulito e fallback selettivo.
Team API: migrazione graduale con misure su token, errori 400, retry e qualità finale.

Domande frequenti

Claude Sonnet 5 sostituisce Opus 4.8?

No. Sonnet 5 diventa il default più sensato per molti task quotidiani, ma Opus 4.8 resta più indicato quando il lavoro è difficile, costoso da correggere o richiede più giudizio tecnico.

Sonnet 5 è disponibile in Claude Code?

Sì. Anthropic indica Sonnet 5 come disponibile in Claude Code. È utile per bug, test, refactor medi e task agentici frequenti, soprattutto quando vuoi tenere sotto controllo il costo.

Quanto costa Sonnet 5 via API?

Fino al 31 agosto 2026 costa $2 per 1M token input e $10 per 1M token output. Dal 1 settembre 2026 passa a $3 input e $15 output per 1M token.

Perché Sonnet 5 può costare più del previsto?

Perché usa un tokenizer nuovo: Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Riconta le richieste reali prima di stimare budget e limiti.

Quando conviene Fable 5?

Conviene quando il valore del task giustifica il prezzo API più alto: migrazioni grandi, agenti lunghi, decisioni critiche o revisione di output difficili. Per bozze, bug piccoli e prove, Sonnet 5 o Opus 4.8 sono più razionali.