Salta al contenuto principale
Modelli AI7 minAggiornato: 2026-07-01

Claude Sonnet 5 vs Opus 4.8

Quando usare il nuovo Sonnet e quando pagare di più per Opus o Fable

Claude Sonnet 5 è il nuovo punto di partenza per chi usa Claude ogni giorno: costa meno di Opus 4.8, ha contesto 1M, output fino a 128K e adaptive thinking. Usa Sonnet 5 per coding, agenti e knowledge work frequenti; passa a Opus 4.8 quando il task è più difficile, costoso da correggere o richiede giudizio superiore. Fable 5 ha senso solo quando vuoi la massima capacità disponibile e il costo extra è giustificato.

Risposta breve

Claude Sonnet 5 è il modello da provare per primo se usi Claude su coding, agenti, ricerca o lavoro professionale ogni settimana. Offre contesto 1M, output lungo e un prezzo API più basso di Opus 4.8. Scegli Opus 4.8 per task software più difficili; usa Fable 5 solo quando massima capacità e costo più alto sono accettabili.

  • Sonnet 5: scelta migliore per task agentici frequenti, Claude Code quotidiano, automazioni e knowledge work con budget controllato.
  • Opus 4.8: più adatto a refactor difficili, decisioni tecniche ad alto impatto e lavoro enterprise complesso.
  • Fable 5: modello più capace, ma con prezzo API più alto. Usalo quando il costo di un errore supera il costo del modello.
  • Migrazione API: riconta token e limiti, perché Sonnet 5 usa un tokenizer nuovo e adaptive thinking è attivo di default.

Confronto rapido

CriterioSonnet 5Opus 4.8 / Fable 5
Ruolo praticoModello quotidiano per agenti, coding, browser use, ricerca, documenti e automazioniOpus 4.8 per task complessi; Fable 5 per massima capacità disponibile
Prezzo API$2/$10 per 1M token fino al 31 agosto 2026, poi $3/$15Opus 4.8: $5/$25. Fable 5: $10/$50
Contesto e output1M token di contesto e 128K token output nella Messages API sincronaOpus 4.8 e Fable 5 hanno lo stesso ordine di grandezza: 1M contesto e 128K output
Quando bastaTask frequenti, agenti controllati, refactor medi, analisi documentale e workflow ripetibiliQuando serve più giudizio, più affidabilità o minore rischio su lavori lunghi e costosi
Rischio nascostoIl nuovo tokenizer può aumentare i token misurati sulla stessa richiestaCosto più alto e rischio overkill se il task è breve, esplorativo o facile da verificare

Scenari di scelta

Prezzi API verificati il 1 luglio 2026 su documentazione ufficiale Anthropic. Sonnet 5 ha prezzo introduttivo fino al 31 agosto 2026: $2 input e $10 output per 1M token. Dal 1 settembre 2026 passa a $3 input e $15 output. Opus 4.8 costa $5 input e $25 output; Fable 5 costa $10 input e $50 output.

Bug medio in Claude Code

300K input · 60K output

Sonnet 5

$1.20 in promo, poi $1.80

Opus 4.8

$3.00

Sonnet 5 è il punto di partenza più sensato. Passa a Opus se il bug richiede molto giudizio architetturale o se i primi tentativi falliscono.

Refactor grande

1M input · 200K output

Sonnet 5

$4.00 in promo, poi $6.00

Opus 4.8

$10.00

Opus 4.8 costa di più, ma può convenire se riduce retry, rollback e revisione umana. Sonnet 5 resta utile per preparare piano e contesto.

Agente operativo ricorrente

2M input al mese · 400K output al mese

Sonnet 5

$8.00 in promo, poi $12.00

Opus 4.8

$20.00

Su automazioni ripetute Sonnet 5 è più facile da giustificare. Usa Opus solo per eccezioni, escalation o revisione finale.

Decisione critica

800K input · 120K output

Sonnet 5

$2.80 in promo, poi $4.20

Opus 4.8

$7.00

Se il risultato incide su produzione, sicurezza o compliance, il costo del modello pesa meno del costo di una scelta sbagliata.

Che cosa cambia con Sonnet 5

Sonnet 5 sposta il modello intermedio di Claude molto più vicino al lavoro agentico reale. Anthropic lo descrive come un miglioramento netto rispetto a Sonnet 4.6 su ragionamento, tool use, coding e knowledge work. La differenza pratica è semplice: puoi usarlo dove prima avresti provato subito Opus per avere abbastanza autonomia, ma con un costo API più basso.

  • È disponibile nei piani Claude e in Claude Code.
  • È il modello di default per Free e Pro.
  • Supporta contesto 1M e output fino a 128K token nella Messages API sincrona.
  • Usa adaptive thinking di default, quindi può spendere più token di ragionamento quando serve.
  • Il prezzo introduttivo lo rende più interessante per test, agenti e automazioni fino al 31 agosto 2026.

Quando scegliere Sonnet 5

Scegli Sonnet 5 quando il task è abbastanza difficile da richiedere un modello moderno, ma non così critico da giustificare subito Opus o Fable. È il punto migliore per capire se un workflow agentico regge: se completa il lavoro con pochi retry, hai risparmiato senza scendere a un modello troppo debole.

  • Coding quotidiano con Claude Code: bug, test, refactor medi e piccole feature.
  • Automazioni con browser, terminale o tool dove il risultato è verificabile.
  • Analisi di documenti lunghi quando puoi controllare le conclusioni principali.
  • Knowledge work operativo: report, ricerca, confronto di fonti, sintesi e piani di lavoro.
  • Fasi iniziali di un progetto in cui vuoi misurare costo, qualità e limiti prima di scalare.

Quando restare su Opus 4.8

Opus 4.8 resta più sensato quando il costo principale non sono i token, ma la revisione umana, il rischio di una patch sbagliata o il tempo perso in retry. Se il task tocca architettura, sicurezza, migrazioni grandi o decisioni difficili, pagare di più può essere razionale.

  • Refactor multi-file su codebase fragile o poco documentata.
  • Debug in cui serve capire interazioni tra molte parti del sistema.
  • Migrazioni di framework, dipendenze o API con test da mantenere verdi.
  • Review finale di output generati da Sonnet 5 o da modelli economici.
  • Workflow enterprise dove affidabilità, audit e supervisione contano più del prezzo per token.

Dove entra Fable 5

Fable 5 è il modello da considerare quando vuoi la massima capacità disponibile nella famiglia Claude. Anthropic lo posiziona sopra Opus 4.8, con prezzo API più alto. Non è il modello da usare per ogni prompt: ha senso quando un miglioramento di qualità può evitare giorni di lavoro, errori costosi o molte iterazioni.

  • Usalo per task lunghi, autonomi e ad alto valore.
  • Usalo quando la supervisione umana è difficile o costosa.
  • Usalo per controllare un lavoro già preparato da Sonnet 5 o Opus, non per bozze leggere.
  • Evitalo se il risultato si verifica in pochi minuti o se il task è ancora esplorativo.

Attenzione al tokenizer

Sonnet 5 usa un tokenizer nuovo. Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Questo non rompe l'API, ma cambia i conti: budget, max_tokens, stime di costo e alert basati sui token vanno ricalcolati sul nuovo modello.

  • Non riusare stime fatte su Sonnet 4.6 per contesti lunghi.
  • Rivedi max_tokens se i tuoi output erano già vicini al limite.
  • Misura il costo su richieste reali prima di migrare automazioni ad alto volume.
  • Se usi prompt caching, controlla anche cache writes e cache hits nella tabella pricing.

Cosa cambia per API e agenti

La migrazione da Sonnet 4.6 non è solo un cambio di nome modello. Sonnet 5 ha adaptive thinking attivo di default, non accetta sampling parameters non di default e rimuove il manual extended thinking. Se hai wrapper API, SDK interni o gateway, conviene testare errori 400, limiti output e controllo del parametro effort prima del rollout.

  • Se prima non passavi un campo thinking, ora il modello usa adaptive thinking.
  • Per disattivare il thinking devi impostarlo esplicitamente come disabilitato.
  • Temperature, top_p e top_k non vanno impostati a valori non-default.
  • Il controllo pratico passa dal parametro effort, non da budget manuali di thinking.
  • In agenti lunghi, logga token di ragionamento, output e retry: il prezzo per token non racconta tutto.

Workflow consigliato

Il modo più solido è usare Sonnet 5 come modello operativo e tenere Opus 4.8 per escalation. Così non paghi sempre il modello premium, ma non rinunci alla qualità quando il lavoro diventa difficile.

  • Parti da Sonnet 5 per analisi, piano, implementazione controllata e task ripetibili.
  • Passa a Opus 4.8 quando Sonnet produce patch fragili, non trova la causa o chiede troppi retry.
  • Usa Fable 5 solo per casi ad alto valore o revisione critica.
  • Per coding agent, definisci sempre test, file coinvolti e criterio di completamento prima del modello.
  • Per automazioni API, misura costo per task completato, non solo costo per milione di token.

Verdetto pratico

Se devi scegliere oggi, usa Sonnet 5 come nuovo default Claude. È abbastanza forte da coprire molti task che prima richiedevano Opus e abbastanza economico da essere testato su workflow ripetuti. Opus 4.8 resta il modello da chiamare quando la posta in gioco sale. Fable 5 non va ignorato, ma va trattato come una scelta mirata, non come abitudine.

  • Uso frequente e controllabile: Sonnet 5.
  • Coding difficile e decisioni tecniche pesanti: Opus 4.8.
  • Massima capacità su task ad alto valore: Fable 5.
  • Budget stretto: Sonnet 5 con effort controllato, prompt pulito e fallback selettivo.
  • Team API: migrazione graduale con misure su token, errori 400, retry e qualità finale.

Domande frequenti

Claude Sonnet 5 sostituisce Opus 4.8?

No. Sonnet 5 diventa il default più sensato per molti task quotidiani, ma Opus 4.8 resta più indicato quando il lavoro è difficile, costoso da correggere o richiede più giudizio tecnico.

Sonnet 5 è disponibile in Claude Code?

Sì. Anthropic indica Sonnet 5 come disponibile in Claude Code. È utile per bug, test, refactor medi e task agentici frequenti, soprattutto quando vuoi tenere sotto controllo il costo.

Quanto costa Sonnet 5 via API?

Fino al 31 agosto 2026 costa $2 per 1M token input e $10 per 1M token output. Dal 1 settembre 2026 passa a $3 input e $15 output per 1M token.

Perché Sonnet 5 può costare più del previsto?

Perché usa un tokenizer nuovo: Anthropic indica che lo stesso testo può produrre circa il 30% di token in più rispetto a Sonnet 4.6. Riconta le richieste reali prima di stimare budget e limiti.

Quando conviene Fable 5?

Conviene quando il valore del task giustifica il prezzo API più alto: migrazioni grandi, agenti lunghi, decisioni critiche o revisione di output difficili. Per bozze, bug piccoli e prove, Sonnet 5 o Opus 4.8 sono più razionali.