Economia
La Cina straccia i costi dell’Intelligenza Artificiale: dopo DeepSeek, il modello GLM-5.2 di Z.ai fa tremare la Silicon Valley
Pensavamo che DeepSeek fosse un’eccezione, ma la Cina sta riscrivendo le regole dell’Intelligenza Artificiale. Il nuovo GLM-5.2 di Z.ai scrive codice a livelli altissimi, gira su hardware ridotto e fa crollare i costi. La reazione della Silicon Valley? “Siamo scioccati”. Il monopolio USA sta scricchiolando. L’analisi completa qui 👇 [Link] #IntelligenzaArtificiale #Cina #SiliconValley #Economia

Pensavamo che lo shock causato da DeepSeek – capace di offrire prestazioni di altissimo livello con costi di addestramento ridicoli rispetto agli standard americani – fosse un’anomalia. Evidentemente, ci sbagliavamo. La guerra dei prezzi e dell’efficienza nel settore dell’Intelligenza Artificiale ha un nuovo protagonista, ed è ancora una volta cinese.
Si tratta di Z.ai (precedentemente nota come Zhipu), una startup che sta dimostrando come l’innovazione asiatica non si basi solo sui sussidi statali, ma su una spietata ottimizzazione delle risorse. Il nuovo modello GLM-5.2, rilasciato con licenza open-weight, sta letteralmente mandando in crisi le certezze (e i listini prezzi) dei colossi della Silicon Valley. GLM sta per General Linguistic Model.
Dal taglio dei costi alla supremazia nel codice
La strategia di Z.ai si era già palesata nel 2025 con il modello GLM-4.5. Presentato a Shanghai, aveva introdotto un tariffario da discount: 0,11 dollari per milione di token in input e 0,28 in output. Numeri che rendevano i modelli occidentali improvvisamente fuori mercato. La vera magia ingegneristica risiedeva nell’hardware: il sistema girava su appena otto chip Nvidia H20, una frazione dell’infrastruttura richiesta dai concorrenti.
Oggi, con il GLM-5.2, il focus si è spostato dalla pura guerra dei prezzi alla qualità assoluta in un settore critico: la programmazione e i flussi di lavoro agentici.
Ecco le specifiche tecniche che stanno facendo discutere gli addetti ai lavori:
- Contesto enorme: Una finestra di 1 milione di token, capace di ingerire e analizzare intere basi di codice sorgente o documentazioni tecniche chilometriche in una singola sessione.
- Architettura efficiente: 744 miliardi di parametri totali, ma solo 40 miliardi attivi grazie alla struttura Mixture-of-Experts (MoE), che garantisce risposte rapide senza fondere i server.
- Indipendenza infrastrutturale: Essendo open-weight, gli sviluppatori possono scaricarlo e farlo girare sui propri server, aggirando i cloud provider (spesso americani e costosi).
| Modello Z.ai | Focus Principale | Vantaggio Competitivo |
| GLM-4.5 (2025) | Efficienza economica, Task agentici | Costi operativi minimi (Gira su 8 chip H20) |
| GLM-5.2 (2026) | Ingegneria del software, Codice lungo | Finestra da 1M token, Open-weight, Struttura MoE |
Le ricadute economiche: una deflazione strutturale
Dal punto di vista economico, l’arrivo di modelli come il GLM-5.2 rappresenta uno shock dal lato dell’offerta per l’industria del software globale. Guillermo Rauch, CEO di Vercel, si è detto “quasi scioccato” dalle capacità di codifica di questo modello. Nei test indipendenti di Arena AI, GLM-5.2 si è piazzato secondo, battendo mostri sacri occidentali e posizionandosi a ridosso solo dell’ammiraglia di Anthropic.
Cosa significa questo per il mercato? Semplice: il costo marginale della produzione di codice sta crollando. Se startup e aziende possono utilizzare modelli gratuiti o quasi gratuiti, capaci di competere con i costosissimi abbonamenti americani, le barriere all’ingresso per lo sviluppo di software si abbassano drasticamente. L’infrastruttura occidentale, basata su capitali immensi investiti in data center faraonici, rischia di trovarsi spiazzata da un approccio cinese molto più “leggero” e flessibile, costretto all’efficienza anche a causa delle sanzioni USA sui microchip.
Introducing GLM-5.2: Frontier Intelligence, Open Weights
– Significant improvements in coding and agentic tasks
– Strong long-horizon capabilities with a 1M context window
– Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong… pic.twitter.com/SjGPSVhePJ— Z.ai (@Zai_org) June 16, 2026
Mentre gli Stati Uniti, per bocca di Anthropic, limitano l’accesso ai loro modelli di punta per paura dello spionaggio, la Cina risponde inondando il mercato globale con modelli open-source altamente capaci. Quando su X si è ipotizzato che la Cina avrebbe raggiunto il livello dei modelli occidentali “Mythos” tra la fine del 2026 e l’inizio del 2027 (ipotesi condivisa da Elon Musk), il fondatore di Z.ai, Jie Tang, ha risposto con una laconica certezza: “Non ci vorrà così tanto”.
La Silicon Valley è avvisata: il monopolio dell’intelligenza è finito, ed è iniziato il tempo della guerra dei margini.







You must be logged in to post a comment Login