Salta al contenuto principale

Cosa è cambiato

Novità QualeAI

Tool e approfondimenti recenti

Gli ultimi approfondimenti pubblicati e i nuovi tool aggiunti al catalogo, in ordine cronologico.

59 novità

Ultimi aggiornamenti

La lista combina nuovi articoli e nuovi tool, senza aggiornamenti prezzo o modifiche minori.

Approfondimento

GPT-5.6: cos'è, quando arriva e cosa cambia

Il 26 giugno 2026 OpenAI ha presentato GPT-5.6, una nuova famiglia di modelli composta da Sol, Terra e Luna. Sol è il modello più potente e porta OpenAI nella stessa conversazione di Anthropic Mythos e Fable sui task cyber e agentici lunghi. Terra punta a un equilibrio tra qualità e costo, Luna privilegia velocità ed efficienza. L'accesso è graduale: per molti utenti la domanda pratica resta quando comparirà nel selettore modelli di ChatGPT.

Approfondimento

Claude Code /insights: capire il tuo workflow

Il comando /insights di Claude Code genera un report sulle tue sessioni: aree di progetto, pattern di interazione e punti di attrito. È utile quando usi spesso Claude Code ma non sai dove stai perdendo tempo: prompt troppo vaghi, sessioni interrotte, skill mancanti, MCP poco usati o istruzioni di progetto da migliorare.

Approfondimento

Claude Code /team-onboarding: far entrare un teammate

Il comando /team-onboarding di Claude Code genera una guida di onboarding partendo dalla cronologia recente: sessioni, comandi, MCP server e abitudini d'uso. È pensato per far entrare un teammate in un progetto già lavorato con agenti AI, riducendo il passaggio manuale di contesto. In Codex non c'è un comando identico, ma puoi costruire un flusso simile con AGENTS.md, skill, /init e /import.

Approfondimento

Google Antigravity: quando usarlo

Google Antigravity è la piattaforma agent-first di Google per sviluppo software. Compete con Claude Code, ChatGPT Codex e Cursor perché serve a delegare task di coding ad agenti, non solo a completare codice nell'editor. Il suo vantaggio distintivo è l'ambiente: Agent Manager, IDE, CLI, SDK, subagenti, artifact e integrazioni con AI Studio, Gemini API, Firebase e Google Cloud.

Approfondimento

Vibe coding senza perdere controllo: cos'è l'harness

Nel vibe coding l'harness è il sistema intorno al modello: istruzioni, contesto, strumenti, test, regole di sicurezza, permessi e controllo dei costi. Non serve complicare un prototipo piccolo, ma diventa importante appena il progetto deve durare, coinvolge utenti reali o tocca dati, pagamenti e manutenzione. Il punto non è smettere di usare AI: è dare all'AI un perimetro migliore.

Approfondimento

Alternative economiche a Claude, GPT e Gemini: quando usarle

I modelli economici come GLM, Qwen, Kimi e DeepSeek non sono una sostituzione automatica di Claude, GPT o Gemini. Convengono quando il costo per token pesa, il task è verificabile e i dati non richiedono garanzie enterprise forti. Restano da evitare o limitare quando lavori su dati sensibili, compliance, decisioni critiche, ricerca che richiede neutralità o workflow dove affidabilità e supporto valgono più del risparmio.

Approfondimento

Come usare GLM-5.2: chat Z.ai, API e Cursor

Per usare GLM-5.2 non devi partire da API o hardware locale. Il primo test più naturale è la chat ufficiale Z.ai: apri chat.z.ai, provi lo stesso tipo di richieste che oggi faresti a Claude o ChatGPT e capisci se qualità, limiti e privacy ti bastano. Se poi vuoi usarlo in workflow tecnici, puoi passare ad API Z.ai, OpenRouter, Cursor, Codex o un tuo script compatibile OpenAI.

Approfondimento

Quanto costa GLM-5.2: chat, API Z.ai e OpenRouter

GLM-5.2 può essere provato prima in chat su Z.ai, come alternativa pratica a Claude o ChatGPT. I prezzi per token diventano importanti quando lo usi via API, OpenRouter o coding agent. Al 25 giugno 2026 Z.ai indica $1,40 input, $0,26 cached input e $4,40 output per 1M token. OpenRouter mostra $0,95 input e $3 output per 1M token. Il costo finale dipende da contesto, output, retry e cache.

Nuovo tool

Devs.ai

Piattaforma per creare app e agenti AI su dati aziendali, con integrazioni, controlli team e distribuzione su marketplace.

Approfondimento

Creare un MVP con AI senza programmare

Gli AI app builder come Lovable, Replit, Bolt, v0 ed Emergent possono bastare per prototipi, demo, tool interni piccoli e MVP privati. Prima di aprire l'app a utenti reali, dati personali, pagamenti o processi critici serve però una review tecnica: sicurezza, permessi, test, backup e manutenzione non si delegano solo al prompt.

Nuovo tool

CastMagic

CastMagic trascrive registrazioni, podcast, webinar e video, poi genera note, articoli, newsletter, post social, clip e materiali riutilizzabili.

Nuovo tool

Emergent

Un AI app builder per trasformare prompt in applicazioni web, mobile, dashboard e tool interni con backend, auth e deploy gestiti.

Nuovo tool

Murf AI

Genera voiceover naturali, doppiaggi e audio TTS per contenuti, e-learning, video aziendali e voice agent.

Nuovo tool

QuillBot

Suite AI per parafrasare, correggere, riassumere e rifinire testi senza partire sempre da una chat generalista.

Nuovo tool

Reclaim.ai

Reclaim.ai organizza automaticamente calendario, focus time, task, meeting e abitudini ricorrenti con agenti AI collegati agli strumenti di lavoro.

Approfondimento

Come capire se il tuo brand compare nelle risposte AI

Per capire se il tuo brand compare nelle risposte AI devi controllare menzioni, prompt, fonti citate e competitor. Poi devi rendere il sito più facile da capire e citare: pagine chiare, dati strutturati, versioni Markdown, file llms.txt e fonti esterne coerenti aiutano più di contenuti generici scritti solo per riempire il sito.

Approfondimento

Cursor, SpaceX e Composer 2.5: la nuova gara dei coding agent

Cursor è nato come il posto in cui i modelli migliori diventavano davvero comodi per scrivere codice. Claude Code e Codex hanno spostato la gara sugli agenti autonomi, più vicini ai lab che controllano i modelli. Con Composer 2.5 e la compute di SpaceX, Cursor prova a chiudere il cerchio: IDE, modello e infrastruttura nella stessa direzione.

Approfondimento

OpenRouter o API dirette: quando usare un gateway LLM

OpenRouter conviene quando vuoi provare o usare più modelli AI con una sola API, centralizzare crediti e aggiungere fallback tra provider senza costruire un layer interno. Le API dirette restano migliori quando usi un solo provider, hai vincoli privacy molto rigidi, vuoi il minimo intermediario possibile o hai già governance, billing e routing gestiti dal tuo backend.

Approfondimento

Usare più modelli AI insieme: quando conviene

Usare più modelli AI insieme ha senso quando il task è complesso, verificabile e beneficia di prospettive diverse: ricerca profonda, decisioni tecniche, analisi comparativa, revisione di output e valutazioni ad alto costo di errore. Per chat quotidiana, bozze semplici e automazioni ripetitive, un solo modello ben scelto resta più economico, veloce e facile da governare.

Nuovo tool

LiteLLM

Gateway AI open source per chiamare 100+ provider LLM in formato OpenAI, con proxy, fallback, budget e tracciamento costi.

Nuovo tool

OpenRouter

Gateway LLM per accedere a centinaia di modelli AI con una sola API compatibile OpenAI, crediti condivisi, routing e fallback.

Nuovo tool

OtterlyAI

Piattaforma per capire se un brand viene citato da ChatGPT, Perplexity, Gemini, Copilot e Google AI Overviews, con prompt, citazioni, competitor e raccomandazioni GEO.

Nuovo tool

Profound

Suite AI per team marketing, SEO e brand che vogliono capire come appaiono in ChatGPT, Perplexity, Claude, Gemini, Grok, Copilot e AI Overviews.

Nuovo tool

Rank Prompt

Piattaforma AI per misurare dove un brand appare in ChatGPT, Perplexity, Claude, Gemini, Grok e Google AI Overviews, con citazioni, competitor e suggerimenti operativi.

Approfondimento

Agent Loop AI: cosa sono e quando usarli

Un Agent Loop non è un prompt più lungo: è un ciclo in cui un agente riceve un obiettivo, controlla lo stato, usa strumenti, valuta il risultato e decide se continuare, fermarsi o chiedere aiuto. Funziona quando il task ha segnali verificabili e un perimetro chiaro. Diventa rischioso quando lo usi per delegare lavori vaghi, costosi o senza condizioni di uscita.

Approfondimento

GLM-5.2: benchmark, prezzo e confronto con Claude, GPT e Kimi

GLM-5.2 è il modello flagship di Z.ai per task lunghi e coding agentico. La promessa è forte: contesto fino a 1M token, output fino a 128K, licenza MIT, API compatibile con SDK OpenAI e benchmark vicini ai modelli chiusi più costosi. Il punto non è dichiararlo vincitore assoluto, ma capire quando vale la pena provarlo al posto di Claude Opus 4.8, GPT-5.5 o Kimi K2.7 Code.

Approfondimento

OpenCode o Pi Agent: quale agente open source scegliere

OpenCode e Pi Agent risolvono un problema simile: usare un coding agent controllabile, open source e collegabile a provider diversi. La differenza è nel punto di partenza. OpenCode è più vicino a un prodotto pronto per scrivere codice in terminale, IDE o desktop. Pi Agent è più vicino a un harness minimale da modellare con estensioni, skill, prompt template e pacchetti.

Approfondimento

Pi Agent: quando usare un coding agent minimalista

Pi Agent è un coding agent da terminale pensato come harness minimale: pochi pezzi nel core, provider multipli, sessioni ad albero, skill, prompt template, estensioni TypeScript e pacchetti installabili. Ha senso se vuoi controllare davvero prompt stack, contesto e workflow. È meno adatto se cerchi sandbox, permission gate, plan mode, MCP o sub-agent già pronti nel prodotto base.

Nuovo tool

Pi Agent

Harness di coding locale per terminale: usa un core minimale, supporta provider multipli, sessioni ad albero, estensioni, skill e prompt template.

Nuovo tool

Z.ai

Piattaforma AI con GLM-5.2, API compatibile OpenAI e modelli open-weight per coding agentico, task lunghi e integrazioni tecniche.

Approfondimento

Claude Code e Codex: compact, fork e handoff

Quando una sessione con un coding agent diventa lunga, la scelta non è solo continuare o ricominciare. /compact serve a riassumere e liberare contesto, /clear o /new servono a cambiare task, /resume recupera una sessione, /branch e /fork aiutano a provare strade alternative. /handoff non è un comando integrato: è una skill installabile, utile quando vuoi aprire un ramo di lavoro portabile verso un'altra sessione o un altro agente.

Nuovo tool

Dify

Builder open source per creare, distribuire e monitorare agenti, workflow AI, chatbot, app RAG e API con modelli diversi.

Nuovo tool

Beautiful.ai

Crea deck professionali con AI, Smart Slides, brand control e collaborazione per team sales, marketing e founder.

Approfondimento

ChatGPT, Claude, Gemini o Copilot

ChatGPT è la scelta più elastica se vuoi un assistente unico per lavori diversi. Claude conviene quando scrivi, ragioni su documenti lunghi o programmi. Gemini ha senso se vivi in Google Workspace. Microsoft Copilot diventa più forte quando il lavoro passa già da Microsoft 365, Teams, Outlook, Word, Excel e governance aziendale.

Approfondimento

Kimi K2.7 Code: benchmark, prezzi e confronto con GPT-5.5 e Opus 4.8

Kimi K2.7 Code è il modello agentico per coding con cui Moonshot prova a spostare la gara su un terreno pratico: task lunghi, tool use, contesto 256K e costo per token basso. Nei benchmark ufficiali migliora nettamente K2.6 e si avvicina ai frontier in alcuni test, ma la vera domanda è se il rapporto prezzo/prestazioni basta per preferirlo nei workflow reali.

Approfondimento

MAI-Image-2.5 vs ChatGPT e Nano Banana

MAI-Image-2.5 porta Microsoft nella fascia alta dei modelli per immagini. Nella classifica Arena del 5 giugno 2026 è dietro gpt-image-2, Reve 2.0 e Gemini 3.1 Flash Image Preview, ma supera Nano Banana Pro 2K e GPT-image-1.5. Il punto più forte è l'editing, dove Microsoft dichiara un secondo posto nella leaderboard Image Edit.

Approfondimento

Microsoft MAI: cosa cambia per Copilot

Microsoft MAI è la famiglia di modelli proprietari con cui Microsoft vuole rafforzare Copilot in ragionamento, codice, immagini, voce e trascrizione. Per chi sceglie strumenti AI, il punto non è il nome del modello: è capire quando Copilot può diventare più competitivo rispetto a ChatGPT, Claude, Gemini, GitHub Copilot ed ElevenLabs.

Approfondimento

Perché Fable 5 e Mythos 5 sono stati bloccati?

Fable 5 e Mythos 5 sono stati bloccati dopo una direttiva del governo degli Stati Uniti legata a ragioni di sicurezza nazionale. Secondo Anthropic, il governo ha indicato un possibile metodo di jailbreak di Fable 5, ma l'azienda sostiene che il caso riguardi vulnerabilità minori già note e capacità disponibili anche in altri modelli pubblici.

Approfondimento

CLAUDE.md o AGENTS.md: dove mettere le istruzioni per il tuo agente

CLAUDE.md e AGENTS.md sono file Markdown che spiegano a un agente di coding come lavorare in un repository: comandi, test, vincoli, stile e file da non toccare. Se lavori solo con Claude Code, un buon CLAUDE.md può bastare. Se usi Codex, Copilot, Zed, Cursor o altri agenti, conviene rendere AGENTS.md la fonte canonica e farlo importare da CLAUDE.md.

Approfondimento

Come organizzare il contesto per agenti AI di coding

Un agente di coding lavora meglio quando non deve ricostruire ogni volta cosa vuoi. Il contesto va distribuito: le decisioni di prodotto in una spec, le regole ricorrenti in AGENTS.md, i workflow ripetibili in skill, le procedure consolidate in script e le esplorazioni rumorose in subagent o chat separate. Così puoi ripartire da sessioni pulite senza perdere memoria utile e senza usare sempre il modello più potente.

Approfondimento

Come risparmiare token AI

Risparmiare token non significa solo scrivere prompt più corti. Il costo reale dipende da contesto inviato, output generato, retry, modello scelto, cache e strumenti usati dagli agenti. Le leve più efficaci sono: tenere stabile il prefisso del prompt, spostare contenuto variabile alla fine, usare modelli economici per fasi semplici, limitare output e fermare gli agenti con scope e budget chiari.

Approfondimento

Context window, context rot e sessioni stateless

La context window è la quantità di informazioni che un modello può usare in una richiesta o conversazione. Non è memoria infinita: se la riempi con log, file, tentativi e discussioni laterali, il modello può diventare meno affidabile e più costoso. Context rot indica proprio questo degrado pratico. Le sessioni API sono spesso stateless se non passi o persisti tu la cronologia, quindi conviene salvare decisioni e specifiche in file, non solo nella chat.

Approfondimento

LLM Wiki, RAG o Graphify: come dare conoscenza agli agenti

Una LLM Wiki è una base di conoscenza compilata in pagine leggibili, collegate e pensate per essere navigate da un agente. RAG recupera frammenti rilevanti da un corpus indicizzato a ogni domanda. Graphify rappresenta un terzo filone: trasforma codice, documenti e media in un knowledge graph interrogabile. La scelta dipende da dimensione, volatilità, bisogno di sintesi e relazioni tra le fonti.

Approfondimento

MCP o CLI: come collegare strumenti a un agente AI

MCP è un protocollo per collegare agenti AI a strumenti, dati e servizi esterni tramite server con tool e schemi espliciti. Una CLI è un comando da terminale che l'agente può eseguire, leggere e verificare con exit code e output. Per strumenti locali e script di progetto, parti quasi sempre da una CLI ben documentata. Promuovi a MCP quando lo strumento deve essere condiviso tra agenti, richiede auth strutturata o va governato centralmente.

Approfondimento

NotebookLM o ChatGPT per studiare

NotebookLM è la scelta più solida quando devi studiare dispense, slide, PDF, audio o video delle lezioni perché lavora sulle fonti che carichi e mostra citazioni. ChatGPT è più adatto quando ti serve un tutor che spiega, fa domande, costruisce esercizi e colma lacune fuori dal materiale del corso. Per molti studenti la scelta migliore è usarli insieme.

Approfondimento

Skill degli agenti AI: quando crearne una e come

Una skill è un pacchetto di istruzioni, file di supporto e talvolta script che un agente carica solo quando riconosce un certo tipo di lavoro. Crea una skill quando una procedura si ripete, ha passaggi precisi e non deve stare sempre nel contesto dell'agente. Lascia invece in CLAUDE.md o AGENTS.md le regole valide in ogni sessione, e usa MCP quando il problema è accedere a un sistema esterno con permessi e dati condivisi.

Approfondimento

Spec driven development con AI

Lo spec driven development con AI trasforma una richiesta di prodotto in artefatti espliciti: requisiti, design tecnico, task e verifiche. Serve quando un coding agent deve lavorare su feature non banali, con edge case, vincoli di architettura o più persone coinvolte. Non serve per ogni modifica: sui fix piccoli un prompt ben scritto o un /goal delimitato resta più veloce.

Approfondimento

Vibe coding: cos'è e quando usarlo

Vibe coding significa descrivere a un modello AI che cosa vuoi costruire e lasciare che generi codice, pagine o app mentre tu guidi il risultato con prompt, preview e correzioni successive. Il termine è stato reso popolare da Andrej Karpathy nel 2025. Funziona bene per prototipi, tool personali e prime versioni, ma diventa rischioso quando servono sicurezza, manutenzione, test e responsabilità tecnica.

Approfondimento

Quale AI usare con dati sensibili

La scelta non parte dal brand più famoso, ma dal tipo di dato e dal piano che stai usando. Per dati personali, contratti, documenti interni o informazioni clienti, controlla prima training, opt-out, retention e garanzie business dichiarate dal vendor.

Approfondimento

Un solo abbonamento AI: quale scegliere

Se puoi pagare un solo abbonamento AI, scegli ChatGPT Plus per versatilità, immagini, file, Codex e uso quotidiano; Claude Pro per scrittura lunga, ragionamento e Claude Code; Google AI Pro se vivi in Gmail, Docs, Drive e ti serve anche storage. Il piano gratis basta se usi l'AI a blocchi, non lavori su file lunghi e accetti limiti variabili.

Approfondimento

Claude Chat, Cowork o Code

Claude Chat è la superficie migliore per ragionare, scrivere e analizzare. Claude Cowork serve quando vuoi delegare lavoro operativo su file e attività da knowledge worker. Claude Code è la scelta per sviluppo software: legge codebase, modifica file, esegue comandi, testa e prepara PR.

Approfondimento

Codex Sites vs Replit vs Lovable

Codex Sites è la scelta più naturale per siti e app interne in workspace ChatGPT Business o Enterprise. Replit è più completo quando vuoi costruire, testare e pubblicare app in un ambiente cloud unico. Lovable è forte quando servono prototipi full-stack, GitHub, team non tecnici e controllo sul codice.

Approfondimento

DeepSeek: quando conviene evitarlo

DeepSeek può essere molto potente e conveniente, soprattutto quando usi modelli open-weight in locale o tramite provider controllati. Il rischio cresce quando inserisci dati personali, aziendali o regolati nell'app o API ufficiale senza verificare dove vengono conservati, come vengono usati e quali obblighi normativi si applicano.

Approfondimento

Fable 5 vs GPT, Gemini e altri modelli frontier: cosa dicono davvero i benchmark

Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi oggi non è una scelta operativa: se vuoi restare in Anthropic, parti da Opus 4.8. I benchmark restano utili per capire dove Fable sarebbe stato forte: coding agentico, knowledge work e task lunghi. Il limite è altrettanto chiaro: costo alto, disponibilità bloccata e velocità non da primo posto.

Approfondimento

Il comando /goal in Claude Code e Codex

Il comando /goal serve a far lavorare un agente oltre il singolo prompt, mantenendo una definizione di done visibile e verificabile. In Claude Code è una condizione di completamento valutata dopo ogni turno. In Codex è Goal mode: un obiettivo persistente legato al thread, che puoi mettere in pausa, modificare, riprendere o cancellare.

Approfondimento

NotebookLM come workspace di ricerca

NotebookLM conviene quando hai già fonti da analizzare e vuoi trasformarle in sintesi, note, mappe, audio o video con citazioni verificabili. Le risposte restano ancorate alle fonti del notebook: può aiutarti a scoprire nuove fonti da aggiungere, ma non va trattato come una ricerca web aperta tipo Perplexity.

Approfondimento

Quanto costa davvero usare Fable 5

Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi al momento non è una spesa che puoi attivare: il riferimento premium torna a Opus 4.8. Quando l'accesso verrà ripristinato, Fable ha un prezzo API di riferimento pari a $10 per 1M token input e $50 per 1M token output e conviene solo quando riduce retry, supervisione o rischio su task ad alto valore.

Approfondimento

Quanto costa un coding agent AI

Il costo di un coding agent non dipende solo dal prezzo mensile. Dipende da modello scelto, token consumati, contesto caricato, durata della sessione e numero di tentativi. Dopo il passaggio di GitHub Copilot agli AI Credits, conviene ragionare per task: autocomplete e chat brevi sono prevedibili, agenti lunghi su repository grandi possono diventare molto più costosi.

Approfondimento

Claude Fable 5 vs Opus 4.8

Dal 12 giugno 2026 Fable 5 non è accessibile dopo una direttiva del governo USA, quindi per ora il modello premium da usare è Opus 4.8. Quando l'accesso tornerà, Fable costa circa il doppio di Opus via API e ha senso solo quando il task è lungo, autonomo, costoso da supervisionare o ad alto impatto. Per lavoro quotidiano, debug circoscritti e bozze, Opus resta spesso la scelta più equilibrata.