
Cosa è cambiato
Novità QualeAI
Tool e approfondimenti recenti
Gli ultimi approfondimenti pubblicati e i nuovi tool aggiunti al catalogo, in ordine cronologico.
59 novità
Ultimi aggiornamenti
La lista combina nuovi articoli e nuovi tool, senza aggiornamenti prezzo o modifiche minori.
GPT-5.6: cos'è, quando arriva e cosa cambia
Il 26 giugno 2026 OpenAI ha presentato GPT-5.6, una nuova famiglia di modelli composta da Sol, Terra e Luna. Sol è il modello più potente e porta OpenAI nella stessa conversazione di Anthropic Mythos e Fable sui task cyber e agentici lunghi. Terra punta a un equilibrio tra qualità e costo, Luna privilegia velocità ed efficienza. L'accesso è graduale: per molti utenti la domanda pratica resta quando comparirà nel selettore modelli di ChatGPT.
Claude Code /insights: capire il tuo workflow
Il comando /insights di Claude Code genera un report sulle tue sessioni: aree di progetto, pattern di interazione e punti di attrito. È utile quando usi spesso Claude Code ma non sai dove stai perdendo tempo: prompt troppo vaghi, sessioni interrotte, skill mancanti, MCP poco usati o istruzioni di progetto da migliorare.
Claude Code /team-onboarding: far entrare un teammate
Il comando /team-onboarding di Claude Code genera una guida di onboarding partendo dalla cronologia recente: sessioni, comandi, MCP server e abitudini d'uso. È pensato per far entrare un teammate in un progetto già lavorato con agenti AI, riducendo il passaggio manuale di contesto. In Codex non c'è un comando identico, ma puoi costruire un flusso simile con AGENTS.md, skill, /init e /import.
Google Antigravity: quando usarlo
Google Antigravity è la piattaforma agent-first di Google per sviluppo software. Compete con Claude Code, ChatGPT Codex e Cursor perché serve a delegare task di coding ad agenti, non solo a completare codice nell'editor. Il suo vantaggio distintivo è l'ambiente: Agent Manager, IDE, CLI, SDK, subagenti, artifact e integrazioni con AI Studio, Gemini API, Firebase e Google Cloud.
Vibe coding senza perdere controllo: cos'è l'harness
Nel vibe coding l'harness è il sistema intorno al modello: istruzioni, contesto, strumenti, test, regole di sicurezza, permessi e controllo dei costi. Non serve complicare un prototipo piccolo, ma diventa importante appena il progetto deve durare, coinvolge utenti reali o tocca dati, pagamenti e manutenzione. Il punto non è smettere di usare AI: è dare all'AI un perimetro migliore.
Alternative economiche a Claude, GPT e Gemini: quando usarle
I modelli economici come GLM, Qwen, Kimi e DeepSeek non sono una sostituzione automatica di Claude, GPT o Gemini. Convengono quando il costo per token pesa, il task è verificabile e i dati non richiedono garanzie enterprise forti. Restano da evitare o limitare quando lavori su dati sensibili, compliance, decisioni critiche, ricerca che richiede neutralità o workflow dove affidabilità e supporto valgono più del risparmio.
Come usare GLM-5.2: chat Z.ai, API e Cursor
Per usare GLM-5.2 non devi partire da API o hardware locale. Il primo test più naturale è la chat ufficiale Z.ai: apri chat.z.ai, provi lo stesso tipo di richieste che oggi faresti a Claude o ChatGPT e capisci se qualità, limiti e privacy ti bastano. Se poi vuoi usarlo in workflow tecnici, puoi passare ad API Z.ai, OpenRouter, Cursor, Codex o un tuo script compatibile OpenAI.
Quanto costa GLM-5.2: chat, API Z.ai e OpenRouter
GLM-5.2 può essere provato prima in chat su Z.ai, come alternativa pratica a Claude o ChatGPT. I prezzi per token diventano importanti quando lo usi via API, OpenRouter o coding agent. Al 25 giugno 2026 Z.ai indica $1,40 input, $0,26 cached input e $4,40 output per 1M token. OpenRouter mostra $0,95 input e $3 output per 1M token. Il costo finale dipende da contesto, output, retry e cache.
Devs.ai
Piattaforma per creare app e agenti AI su dati aziendali, con integrazioni, controlli team e distribuzione su marketplace.
Creare un MVP con AI senza programmare
Gli AI app builder come Lovable, Replit, Bolt, v0 ed Emergent possono bastare per prototipi, demo, tool interni piccoli e MVP privati. Prima di aprire l'app a utenti reali, dati personali, pagamenti o processi critici serve però una review tecnica: sicurezza, permessi, test, backup e manutenzione non si delegano solo al prompt.
CastMagic
CastMagic trascrive registrazioni, podcast, webinar e video, poi genera note, articoli, newsletter, post social, clip e materiali riutilizzabili.
Emergent
Un AI app builder per trasformare prompt in applicazioni web, mobile, dashboard e tool interni con backend, auth e deploy gestiti.
Murf AI
Genera voiceover naturali, doppiaggi e audio TTS per contenuti, e-learning, video aziendali e voice agent.
QuillBot
Suite AI per parafrasare, correggere, riassumere e rifinire testi senza partire sempre da una chat generalista.
Reclaim.ai
Reclaim.ai organizza automaticamente calendario, focus time, task, meeting e abitudini ricorrenti con agenti AI collegati agli strumenti di lavoro.
Come capire se il tuo brand compare nelle risposte AI
Per capire se il tuo brand compare nelle risposte AI devi controllare menzioni, prompt, fonti citate e competitor. Poi devi rendere il sito più facile da capire e citare: pagine chiare, dati strutturati, versioni Markdown, file llms.txt e fonti esterne coerenti aiutano più di contenuti generici scritti solo per riempire il sito.
Cursor, SpaceX e Composer 2.5: la nuova gara dei coding agent
Cursor è nato come il posto in cui i modelli migliori diventavano davvero comodi per scrivere codice. Claude Code e Codex hanno spostato la gara sugli agenti autonomi, più vicini ai lab che controllano i modelli. Con Composer 2.5 e la compute di SpaceX, Cursor prova a chiudere il cerchio: IDE, modello e infrastruttura nella stessa direzione.
OpenRouter o API dirette: quando usare un gateway LLM
OpenRouter conviene quando vuoi provare o usare più modelli AI con una sola API, centralizzare crediti e aggiungere fallback tra provider senza costruire un layer interno. Le API dirette restano migliori quando usi un solo provider, hai vincoli privacy molto rigidi, vuoi il minimo intermediario possibile o hai già governance, billing e routing gestiti dal tuo backend.
Usare più modelli AI insieme: quando conviene
Usare più modelli AI insieme ha senso quando il task è complesso, verificabile e beneficia di prospettive diverse: ricerca profonda, decisioni tecniche, analisi comparativa, revisione di output e valutazioni ad alto costo di errore. Per chat quotidiana, bozze semplici e automazioni ripetitive, un solo modello ben scelto resta più economico, veloce e facile da governare.
LiteLLM
Gateway AI open source per chiamare 100+ provider LLM in formato OpenAI, con proxy, fallback, budget e tracciamento costi.
OpenRouter
Gateway LLM per accedere a centinaia di modelli AI con una sola API compatibile OpenAI, crediti condivisi, routing e fallback.
OtterlyAI
Piattaforma per capire se un brand viene citato da ChatGPT, Perplexity, Gemini, Copilot e Google AI Overviews, con prompt, citazioni, competitor e raccomandazioni GEO.
Profound
Suite AI per team marketing, SEO e brand che vogliono capire come appaiono in ChatGPT, Perplexity, Claude, Gemini, Grok, Copilot e AI Overviews.
Rank Prompt
Piattaforma AI per misurare dove un brand appare in ChatGPT, Perplexity, Claude, Gemini, Grok e Google AI Overviews, con citazioni, competitor e suggerimenti operativi.
Agent Loop AI: cosa sono e quando usarli
Un Agent Loop non è un prompt più lungo: è un ciclo in cui un agente riceve un obiettivo, controlla lo stato, usa strumenti, valuta il risultato e decide se continuare, fermarsi o chiedere aiuto. Funziona quando il task ha segnali verificabili e un perimetro chiaro. Diventa rischioso quando lo usi per delegare lavori vaghi, costosi o senza condizioni di uscita.
GLM-5.2: benchmark, prezzo e confronto con Claude, GPT e Kimi
GLM-5.2 è il modello flagship di Z.ai per task lunghi e coding agentico. La promessa è forte: contesto fino a 1M token, output fino a 128K, licenza MIT, API compatibile con SDK OpenAI e benchmark vicini ai modelli chiusi più costosi. Il punto non è dichiararlo vincitore assoluto, ma capire quando vale la pena provarlo al posto di Claude Opus 4.8, GPT-5.5 o Kimi K2.7 Code.
OpenCode o Pi Agent: quale agente open source scegliere
OpenCode e Pi Agent risolvono un problema simile: usare un coding agent controllabile, open source e collegabile a provider diversi. La differenza è nel punto di partenza. OpenCode è più vicino a un prodotto pronto per scrivere codice in terminale, IDE o desktop. Pi Agent è più vicino a un harness minimale da modellare con estensioni, skill, prompt template e pacchetti.
Pi Agent: quando usare un coding agent minimalista
Pi Agent è un coding agent da terminale pensato come harness minimale: pochi pezzi nel core, provider multipli, sessioni ad albero, skill, prompt template, estensioni TypeScript e pacchetti installabili. Ha senso se vuoi controllare davvero prompt stack, contesto e workflow. È meno adatto se cerchi sandbox, permission gate, plan mode, MCP o sub-agent già pronti nel prodotto base.
Pi Agent
Harness di coding locale per terminale: usa un core minimale, supporta provider multipli, sessioni ad albero, estensioni, skill e prompt template.
Z.ai
Piattaforma AI con GLM-5.2, API compatibile OpenAI e modelli open-weight per coding agentico, task lunghi e integrazioni tecniche.
Claude Code e Codex: compact, fork e handoff
Quando una sessione con un coding agent diventa lunga, la scelta non è solo continuare o ricominciare. /compact serve a riassumere e liberare contesto, /clear o /new servono a cambiare task, /resume recupera una sessione, /branch e /fork aiutano a provare strade alternative. /handoff non è un comando integrato: è una skill installabile, utile quando vuoi aprire un ramo di lavoro portabile verso un'altra sessione o un altro agente.
Dify
Builder open source per creare, distribuire e monitorare agenti, workflow AI, chatbot, app RAG e API con modelli diversi.
Beautiful.ai
Crea deck professionali con AI, Smart Slides, brand control e collaborazione per team sales, marketing e founder.
ChatGPT, Claude, Gemini o Copilot
ChatGPT è la scelta più elastica se vuoi un assistente unico per lavori diversi. Claude conviene quando scrivi, ragioni su documenti lunghi o programmi. Gemini ha senso se vivi in Google Workspace. Microsoft Copilot diventa più forte quando il lavoro passa già da Microsoft 365, Teams, Outlook, Word, Excel e governance aziendale.
Kimi K2.7 Code: benchmark, prezzi e confronto con GPT-5.5 e Opus 4.8
Kimi K2.7 Code è il modello agentico per coding con cui Moonshot prova a spostare la gara su un terreno pratico: task lunghi, tool use, contesto 256K e costo per token basso. Nei benchmark ufficiali migliora nettamente K2.6 e si avvicina ai frontier in alcuni test, ma la vera domanda è se il rapporto prezzo/prestazioni basta per preferirlo nei workflow reali.
MAI-Image-2.5 vs ChatGPT e Nano Banana
MAI-Image-2.5 porta Microsoft nella fascia alta dei modelli per immagini. Nella classifica Arena del 5 giugno 2026 è dietro gpt-image-2, Reve 2.0 e Gemini 3.1 Flash Image Preview, ma supera Nano Banana Pro 2K e GPT-image-1.5. Il punto più forte è l'editing, dove Microsoft dichiara un secondo posto nella leaderboard Image Edit.
Microsoft MAI: cosa cambia per Copilot
Microsoft MAI è la famiglia di modelli proprietari con cui Microsoft vuole rafforzare Copilot in ragionamento, codice, immagini, voce e trascrizione. Per chi sceglie strumenti AI, il punto non è il nome del modello: è capire quando Copilot può diventare più competitivo rispetto a ChatGPT, Claude, Gemini, GitHub Copilot ed ElevenLabs.
Perché Fable 5 e Mythos 5 sono stati bloccati?
Fable 5 e Mythos 5 sono stati bloccati dopo una direttiva del governo degli Stati Uniti legata a ragioni di sicurezza nazionale. Secondo Anthropic, il governo ha indicato un possibile metodo di jailbreak di Fable 5, ma l'azienda sostiene che il caso riguardi vulnerabilità minori già note e capacità disponibili anche in altri modelli pubblici.
CLAUDE.md o AGENTS.md: dove mettere le istruzioni per il tuo agente
CLAUDE.md e AGENTS.md sono file Markdown che spiegano a un agente di coding come lavorare in un repository: comandi, test, vincoli, stile e file da non toccare. Se lavori solo con Claude Code, un buon CLAUDE.md può bastare. Se usi Codex, Copilot, Zed, Cursor o altri agenti, conviene rendere AGENTS.md la fonte canonica e farlo importare da CLAUDE.md.
Come organizzare il contesto per agenti AI di coding
Un agente di coding lavora meglio quando non deve ricostruire ogni volta cosa vuoi. Il contesto va distribuito: le decisioni di prodotto in una spec, le regole ricorrenti in AGENTS.md, i workflow ripetibili in skill, le procedure consolidate in script e le esplorazioni rumorose in subagent o chat separate. Così puoi ripartire da sessioni pulite senza perdere memoria utile e senza usare sempre il modello più potente.
Come risparmiare token AI
Risparmiare token non significa solo scrivere prompt più corti. Il costo reale dipende da contesto inviato, output generato, retry, modello scelto, cache e strumenti usati dagli agenti. Le leve più efficaci sono: tenere stabile il prefisso del prompt, spostare contenuto variabile alla fine, usare modelli economici per fasi semplici, limitare output e fermare gli agenti con scope e budget chiari.
Context window, context rot e sessioni stateless
La context window è la quantità di informazioni che un modello può usare in una richiesta o conversazione. Non è memoria infinita: se la riempi con log, file, tentativi e discussioni laterali, il modello può diventare meno affidabile e più costoso. Context rot indica proprio questo degrado pratico. Le sessioni API sono spesso stateless se non passi o persisti tu la cronologia, quindi conviene salvare decisioni e specifiche in file, non solo nella chat.
LLM Wiki, RAG o Graphify: come dare conoscenza agli agenti
Una LLM Wiki è una base di conoscenza compilata in pagine leggibili, collegate e pensate per essere navigate da un agente. RAG recupera frammenti rilevanti da un corpus indicizzato a ogni domanda. Graphify rappresenta un terzo filone: trasforma codice, documenti e media in un knowledge graph interrogabile. La scelta dipende da dimensione, volatilità, bisogno di sintesi e relazioni tra le fonti.
MCP o CLI: come collegare strumenti a un agente AI
MCP è un protocollo per collegare agenti AI a strumenti, dati e servizi esterni tramite server con tool e schemi espliciti. Una CLI è un comando da terminale che l'agente può eseguire, leggere e verificare con exit code e output. Per strumenti locali e script di progetto, parti quasi sempre da una CLI ben documentata. Promuovi a MCP quando lo strumento deve essere condiviso tra agenti, richiede auth strutturata o va governato centralmente.
NotebookLM o ChatGPT per studiare
NotebookLM è la scelta più solida quando devi studiare dispense, slide, PDF, audio o video delle lezioni perché lavora sulle fonti che carichi e mostra citazioni. ChatGPT è più adatto quando ti serve un tutor che spiega, fa domande, costruisce esercizi e colma lacune fuori dal materiale del corso. Per molti studenti la scelta migliore è usarli insieme.
Skill degli agenti AI: quando crearne una e come
Una skill è un pacchetto di istruzioni, file di supporto e talvolta script che un agente carica solo quando riconosce un certo tipo di lavoro. Crea una skill quando una procedura si ripete, ha passaggi precisi e non deve stare sempre nel contesto dell'agente. Lascia invece in CLAUDE.md o AGENTS.md le regole valide in ogni sessione, e usa MCP quando il problema è accedere a un sistema esterno con permessi e dati condivisi.
Spec driven development con AI
Lo spec driven development con AI trasforma una richiesta di prodotto in artefatti espliciti: requisiti, design tecnico, task e verifiche. Serve quando un coding agent deve lavorare su feature non banali, con edge case, vincoli di architettura o più persone coinvolte. Non serve per ogni modifica: sui fix piccoli un prompt ben scritto o un /goal delimitato resta più veloce.
Vibe coding: cos'è e quando usarlo
Vibe coding significa descrivere a un modello AI che cosa vuoi costruire e lasciare che generi codice, pagine o app mentre tu guidi il risultato con prompt, preview e correzioni successive. Il termine è stato reso popolare da Andrej Karpathy nel 2025. Funziona bene per prototipi, tool personali e prime versioni, ma diventa rischioso quando servono sicurezza, manutenzione, test e responsabilità tecnica.
Quale AI usare con dati sensibili
La scelta non parte dal brand più famoso, ma dal tipo di dato e dal piano che stai usando. Per dati personali, contratti, documenti interni o informazioni clienti, controlla prima training, opt-out, retention e garanzie business dichiarate dal vendor.
Un solo abbonamento AI: quale scegliere
Se puoi pagare un solo abbonamento AI, scegli ChatGPT Plus per versatilità, immagini, file, Codex e uso quotidiano; Claude Pro per scrittura lunga, ragionamento e Claude Code; Google AI Pro se vivi in Gmail, Docs, Drive e ti serve anche storage. Il piano gratis basta se usi l'AI a blocchi, non lavori su file lunghi e accetti limiti variabili.
Claude Chat, Cowork o Code
Claude Chat è la superficie migliore per ragionare, scrivere e analizzare. Claude Cowork serve quando vuoi delegare lavoro operativo su file e attività da knowledge worker. Claude Code è la scelta per sviluppo software: legge codebase, modifica file, esegue comandi, testa e prepara PR.
Codex Sites vs Replit vs Lovable
Codex Sites è la scelta più naturale per siti e app interne in workspace ChatGPT Business o Enterprise. Replit è più completo quando vuoi costruire, testare e pubblicare app in un ambiente cloud unico. Lovable è forte quando servono prototipi full-stack, GitHub, team non tecnici e controllo sul codice.
DeepSeek: quando conviene evitarlo
DeepSeek può essere molto potente e conveniente, soprattutto quando usi modelli open-weight in locale o tramite provider controllati. Il rischio cresce quando inserisci dati personali, aziendali o regolati nell'app o API ufficiale senza verificare dove vengono conservati, come vengono usati e quali obblighi normativi si applicano.
Fable 5 vs GPT, Gemini e altri modelli frontier: cosa dicono davvero i benchmark
Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi oggi non è una scelta operativa: se vuoi restare in Anthropic, parti da Opus 4.8. I benchmark restano utili per capire dove Fable sarebbe stato forte: coding agentico, knowledge work e task lunghi. Il limite è altrettanto chiaro: costo alto, disponibilità bloccata e velocità non da primo posto.
Il comando /goal in Claude Code e Codex
Il comando /goal serve a far lavorare un agente oltre il singolo prompt, mantenendo una definizione di done visibile e verificabile. In Claude Code è una condizione di completamento valutata dopo ogni turno. In Codex è Goal mode: un obiettivo persistente legato al thread, che puoi mettere in pausa, modificare, riprendere o cancellare.
NotebookLM come workspace di ricerca
NotebookLM conviene quando hai già fonti da analizzare e vuoi trasformarle in sintesi, note, mappe, audio o video con citazioni verificabili. Le risposte restano ancorate alle fonti del notebook: può aiutarti a scoprire nuove fonti da aggiungere, ma non va trattato come una ricerca web aperta tipo Perplexity.
Quanto costa davvero usare Fable 5
Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi al momento non è una spesa che puoi attivare: il riferimento premium torna a Opus 4.8. Quando l'accesso verrà ripristinato, Fable ha un prezzo API di riferimento pari a $10 per 1M token input e $50 per 1M token output e conviene solo quando riduce retry, supervisione o rischio su task ad alto valore.
Quanto costa un coding agent AI
Il costo di un coding agent non dipende solo dal prezzo mensile. Dipende da modello scelto, token consumati, contesto caricato, durata della sessione e numero di tentativi. Dopo il passaggio di GitHub Copilot agli AI Credits, conviene ragionare per task: autocomplete e chat brevi sono prevedibili, agenti lunghi su repository grandi possono diventare molto più costosi.
Claude Fable 5 vs Opus 4.8
Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi per ora il modello premium da usare è Opus 4.8. Quando l'accesso tornerà, Fable costa circa il doppio di Opus via API e ha senso solo quando il task è lungo, autonomo, costoso da supervisionare o ad alto impatto. Per lavoro quotidiano, debug circoscritti e bozze, Opus resta spesso la scelta più equilibrata.