Claude Sonnet 5 vs Opus 4.8
Quando usare il nuovo Sonnet e quando pagare di più per Opus o Fable
Claude Sonnet 5 è il nuovo punto di partenza per chi usa Claude ogni giorno: costa meno di Opus 4.8, ha contesto 1M, output fino a 128K e adaptive thinking. Usa Sonnet 5 per coding, agenti e knowledge work frequenti; passa a Opus 4.8 quando il task è più difficile, costoso da correggere o richiede giudizio superiore. Fable 5 ha senso solo quando vuoi la massima capacità disponibile e il costo extra è giustificato.
Risposta breve
Claude Sonnet 5 è il modello da provare per primo se usi Claude su coding, agenti, ricerca o lavoro professionale ogni settimana. Offre contesto 1M, output lungo e un prezzo API più basso di Opus 4.8. Scegli Opus 4.8 per task software più difficili; usa Fable 5 solo quando massima capacità e costo più alto sono accettabili.
- Sonnet 5: scelta migliore per task agentici frequenti, Claude Code quotidiano, automazioni e knowledge work con budget controllato.
- Opus 4.8: più adatto a refactor difficili, decisioni tecniche ad alto impatto e lavoro enterprise complesso.
- Fable 5: modello più capace, ma con prezzo API più alto. Usalo quando il costo di un errore supera il costo del modello.
- Migrazione API: riconta token e limiti, perché Sonnet 5 usa un tokenizer nuovo e adaptive thinking è attivo di default.
Confronto rapido
| Criterio | Sonnet 5 | Opus 4.8 / Fable 5 |
|---|---|---|
| Ruolo pratico | Modello quotidiano per agenti, coding, browser use, ricerca, documenti e automazioni | Opus 4.8 per task complessi; Fable 5 per massima capacità disponibile |
| Prezzo API | $2/$10 per 1M token fino al 31 agosto 2026, poi $3/$15 | Opus 4.8: $5/$25. Fable 5: $10/$50 |
| Contesto e output | 1M token di contesto e 128K token output nella Messages API sincrona | Opus 4.8 e Fable 5 hanno lo stesso ordine di grandezza: 1M contesto e 128K output |
| Quando basta | Task frequenti, agenti controllati, refactor medi, analisi documentale e workflow ripetibili | Quando serve più giudizio, più affidabilità o minore rischio su lavori lunghi e costosi |
| Rischio nascosto | Il nuovo tokenizer può aumentare i token misurati sulla stessa richiesta | Costo più alto e rischio overkill se il task è breve, esplorativo o facile da verificare |
Scenari di scelta
Prezzi API verificati il 1 luglio 2026 su documentazione ufficiale Anthropic. Sonnet 5 ha prezzo introduttivo fino al 31 agosto 2026: $2 input e $10 output per 1M token. Dal 1 settembre 2026 passa a $3 input e $15 output. Opus 4.8 costa $5 input e $25 output; Fable 5 costa $10 input e $50 output.
Bug medio in Claude Code
300K input · 60K output
Sonnet 5
$1.20 in promo, poi $1.80
Opus 4.8
$3.00
Sonnet 5 è il punto di partenza più sensato. Passa a Opus se il bug richiede molto giudizio architetturale o se i primi tentativi falliscono.
Refactor grande
1M input · 200K output
Sonnet 5
$4.00 in promo, poi $6.00
Opus 4.8
$10.00
Opus 4.8 costa di più, ma può convenire se riduce retry, rollback e revisione umana. Sonnet 5 resta utile per preparare piano e contesto.
Agente operativo ricorrente
2M input al mese · 400K output al mese
Sonnet 5
$8.00 in promo, poi $12.00
Opus 4.8
$20.00
Su automazioni ripetute Sonnet 5 è più facile da giustificare. Usa Opus solo per eccezioni, escalation o revisione finale.
Decisione critica
800K input · 120K output
Sonnet 5
$2.80 in promo, poi $4.20
Opus 4.8
$7.00
Se il risultato incide su produzione, sicurezza o compliance, il costo del modello pesa meno del costo di una scelta sbagliata.
Che cosa cambia con Sonnet 5
Sonnet 5 sposta il modello intermedio di Claude molto più vicino al lavoro agentico reale. Anthropic lo descrive come un miglioramento netto rispetto a Sonnet 4.6 su ragionamento, tool use, coding e knowledge work. La differenza pratica è semplice: puoi usarlo dove prima avresti provato subito Opus per avere abbastanza autonomia, ma con un costo API più basso.
- È disponibile nei piani Claude e in Claude Code.
- È il modello di default per Free e Pro.
- Supporta contesto 1M e output fino a 128K token nella Messages API sincrona.
- Usa adaptive thinking di default, quindi può spendere più token di ragionamento quando serve.
- Il prezzo introduttivo lo rende più interessante per test, agenti e automazioni fino al 31 agosto 2026.
Quando scegliere Sonnet 5
Scegli Sonnet 5 quando il task è abbastanza difficile da richiedere un modello moderno, ma non così critico da giustificare subito Opus o Fable. È il punto migliore per capire se un workflow agentico regge: se completa il lavoro con pochi retry, hai risparmiato senza scendere a un modello troppo debole.
- Coding quotidiano con Claude Code: bug, test, refactor medi e piccole feature.
- Automazioni con browser, terminale o tool dove il risultato è verificabile.
- Analisi di documenti lunghi quando puoi controllare le conclusioni principali.
- Knowledge work operativo: report, ricerca, confronto di fonti, sintesi e piani di lavoro.
- Fasi iniziali di un progetto in cui vuoi misurare costo, qualità e limiti prima di scalare.
Quando restare su Opus 4.8
Opus 4.8 resta più sensato quando il costo principale non sono i token, ma la revisione umana, il rischio di una patch sbagliata o il tempo perso in retry. Se il task tocca architettura, sicurezza, migrazioni grandi o decisioni difficili, pagare di più può essere razionale.
- Refactor multi-file su codebase fragile o poco documentata.
- Debug in cui serve capire interazioni tra molte parti del sistema.
- Migrazioni di framework, dipendenze o API con test da mantenere verdi.
- Review finale di output generati da Sonnet 5 o da modelli economici.
- Workflow enterprise dove affidabilità, audit e supervisione contano più del prezzo per token.
Dove entra Fable 5
Fable 5 è il modello da considerare quando vuoi la massima capacità disponibile nella famiglia Claude. Anthropic lo posiziona sopra Opus 4.8, con prezzo API più alto. Non è il modello da usare per ogni prompt: ha senso quando un miglioramento di qualità può evitare giorni di lavoro, errori costosi o molte iterazioni.
- Usalo per task lunghi, autonomi e ad alto valore.
- Usalo quando la supervisione umana è difficile o costosa.
- Usalo per controllare un lavoro già preparato da Sonnet 5 o Opus, non per bozze leggere.
- Evitalo se il risultato si verifica in pochi minuti o se il task è ancora esplorativo.
Attenzione al tokenizer
Sonnet 5 usa un tokenizer nuovo. Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Questo non rompe l'API, ma cambia i conti: budget, max_tokens, stime di costo e alert basati sui token vanno ricalcolati sul nuovo modello.
- Non riusare stime fatte su Sonnet 4.6 per contesti lunghi.
- Rivedi max_tokens se i tuoi output erano già vicini al limite.
- Misura il costo su richieste reali prima di migrare automazioni ad alto volume.
- Se usi prompt caching, controlla anche cache writes e cache hits nella tabella pricing.
Cosa cambia per API e agenti
La migrazione da Sonnet 4.6 non è solo un cambio di nome modello. Sonnet 5 ha adaptive thinking attivo di default, non accetta sampling parameters non di default e rimuove il manual extended thinking. Se hai wrapper API, SDK interni o gateway, conviene testare errori 400, limiti output e controllo del parametro effort prima del rollout.
- Se prima non passavi un campo thinking, ora il modello usa adaptive thinking.
- Per disattivare il thinking devi impostarlo esplicitamente come disabilitato.
- Temperature, top_p e top_k non vanno impostati a valori non-default.
- Il controllo pratico passa dal parametro effort, non da budget manuali di thinking.
- In agenti lunghi, logga token di ragionamento, output e retry: il prezzo per token non racconta tutto.
Workflow consigliato
Il modo più solido è usare Sonnet 5 come modello operativo e tenere Opus 4.8 per escalation. Così non paghi sempre il modello premium, ma non rinunci alla qualità quando il lavoro diventa difficile.
- Parti da Sonnet 5 per analisi, piano, implementazione controllata e task ripetibili.
- Passa a Opus 4.8 quando Sonnet produce patch fragili, non trova la causa o chiede troppi retry.
- Usa Fable 5 solo per casi ad alto valore o revisione critica.
- Per coding agent, definisci sempre test, file coinvolti e criterio di completamento prima del modello.
- Per automazioni API, misura costo per task completato, non solo costo per milione di token.
Verdetto pratico
Se devi scegliere oggi, usa Sonnet 5 come nuovo default Claude. È abbastanza forte da coprire molti task che prima richiedevano Opus e abbastanza economico da essere testato su workflow ripetuti. Opus 4.8 resta il modello da chiamare quando la posta in gioco sale. Fable 5 non va ignorato, ma va trattato come una scelta mirata, non come abitudine.
- Uso frequente e controllabile: Sonnet 5.
- Coding difficile e decisioni tecniche pesanti: Opus 4.8.
- Massima capacità su task ad alto valore: Fable 5.
- Budget stretto: Sonnet 5 con effort controllato, prompt pulito e fallback selettivo.
- Team API: migrazione graduale con misure su token, errori 400, retry e qualità finale.
Domande frequenti
Claude Sonnet 5 sostituisce Opus 4.8?
No. Sonnet 5 diventa il default più sensato per molti task quotidiani, ma Opus 4.8 resta più indicato quando il lavoro è difficile, costoso da correggere o richiede più giudizio tecnico.
Sonnet 5 è disponibile in Claude Code?
Sì. Anthropic indica Sonnet 5 come disponibile in Claude Code. È utile per bug, test, refactor medi e task agentici frequenti, soprattutto quando vuoi tenere sotto controllo il costo.
Quanto costa Sonnet 5 via API?
Fino al 31 agosto 2026 costa $2 per 1M token input e $10 per 1M token output. Dal 1 settembre 2026 passa a $3 input e $15 output per 1M token.
Perché Sonnet 5 può costare più del previsto?
Perché usa un tokenizer nuovo: Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Riconta le richieste reali prima di stimare budget e limiti.
Quando conviene Fable 5?
Conviene quando il valore del task giustifica il prezzo API più alto: migrazioni grandi, agenti lunghi, decisioni critiche o revisione di output difficili. Per bozze, bug piccoli e prove, Sonnet 5 o Opus 4.8 sono più razionali.