Home Classifica Dashboard

WeatherNext 2: il modello IA di Google DeepMind arriva su WeatherBot

Stiamo iniziando a lavorare al più grande aggiornamento di accuratezza delle previsioni nella storia di WeatherBot: l'integrazione di WeatherNext 2 di Google DeepMind direttamente nel motore di trading. Se ci riusciamo, cambierà fondamentalmente la qualità di ogni edge che il nostro bot rileva — e quindi il risultato atteso di ogni trade che piazza.

Questo post spiega perché WeatherNext 2 è importante, come si confronta con il tradizionale modello NOAA GFS su cui ci affidiamo oggi, quanto è davvero difficile questa integrazione, e come l'accesso sarà gated dal volume di trading sulla piattaforma una volta attivo.

Cos'è WeatherNext 2?

WeatherNext 2 è il modello di previsione più avanzato mai rilasciato da Google DeepMind. Presentato a fine 2025 e già alla base di Google Search, Gemini, Pixel Weather e Google Maps, rappresenta un salto generazionale nella previsione meteo su scala globale.

Invece di risolvere le equazioni fisiche che governano l'atmosfera — l'approccio usato da decenni da NOAA GFS, dal modello ECMWF e da ogni sistema tradizionale — WeatherNext 2 impara il comportamento atmosferico direttamente da decenni di dati storici. È costruito su un'architettura completamente nuova chiamata Rete Generativa Funzionale (FGN), che inietta rumore controllato direttamente nel modello in modo che ogni previsione che produce rimanga fisicamente coerente e internamente coerente tra le variabili.

Generazione 8× più rapida

Una previsione ensemble completa richiede meno di un minuto su una singola TPU. I modelli basati sulla fisica richiedono ore su un supercomputer per produrre lo stesso output.

99,9% delle variabili migliorate

Supera il precedente stato dell'arte nel 99,9% delle variabili (temperatura, vento, umidità, pressione, precipitazioni) e su tutti gli orizzonti da 0 a 15 giorni.

Risoluzione 1 ora

Previsioni ora per ora aggiornate quattro volte al giorno — molto più granulari della risoluzione nativa 3-6 ore di GFS per gli orizzonti che operiamo.

Centinaia di scenari

Genera in meno di un minuto un ensemble probabilistico di centinaia di futuri plausibili, fornendoci una vera distribuzione — non un singolo valore deterministico.

Perché è più accurato di NOAA GFS

Il Global Forecast System di NOAA è un pezzo di ingegneria fenomenale — ma è stato progettato in un'era precedente al deep learning, e i limiti della modellazione basata sulla fisica sono evidenti da anni. C'è un motivo per cui ECMWF ha storicamente superato GFS di circa un giorno intero di abilità di previsione, e per cui quasi tutti i principali provider meteo hanno silenziosamente iniziato a sovrapporre l'IA al loro stack tradizionale.

Ecco dove WeatherNext 2 supera GFS specificamente sui tipi di previsioni di temperatura a corto-medio termine che guidano i contratti meteo di Polymarket:

  • Pattern atmosferici appresi vs. equazioni risolte — GFS approssima l'atmosfera discretizzandola in una griglia e risolvendo Navier-Stokes a ogni timestep. Quelle approssimazioni si accumulano nel tempo. WeatherNext 2 ha appreso il comportamento non lineare completo dell'atmosfera dai dati di reanalisi ERA5, quindi non accumula la stessa classe di errore numerico.
  • Output probabilistico nativo — GFS ti dà una previsione per run. Per avere una distribuzione ti serve GEFS (l'ensemble), che aggiunge costo e latenza. WeatherNext 2 emette la distribuzione completa nativamente, quindi vediamo la probabilità reale che una città raggiunga 14°C, non solo una stima puntuale da avvolgere bayesianamente da soli.
  • Risoluzione effettiva più alta — WeatherNext 2 produce previsioni globali ora per ora. GFS opera con risoluzione orizzontale di 13 km e output di 3 ore per il nostro range di trading. Per contratti city-specific daily-max e daily-min, quella granularità temporale aggiuntiva è un vero edge.
  • Migliore sulle code — i benchmark di DeepMind mostrano i maggiori guadagni su eventi a bassa probabilità e alto impatto: ondate di freddo, cupole di calore, tempeste. Questi sono esattamente i mercati in cui vivono le code mal prezzate e da cui provengono i nostri trade più grandi.
  • Ensemble fisicamente coerenti — l'architettura FGN significa che ogni scenario nell'ensemble è internamente coerente (uno scenario ventoso ha anche il gradiente di pressione corrispondente). Questo è ciò che rende le probabilità utilizzabili per il pricing.

Per gli orizzonti 0-3 giorni che costituiscono il grosso dei mercati meteo di Polymarket, valutazioni indipendenti collocano i moderni modelli IA allo stesso livello — e spesso davanti — all'IFS di punta di ECMWF, che è a sua volta significativamente davanti a GFS. Tradotto approssimativamente: qualche decimo di grado di RMSE sulla temperatura massima giornaliera a 48 ore, e una calibrazione notevolmente più stretta sugli eventi rari.

Perché questo cambia l'esito delle operazioni

Tutto l'edge di WeatherBot deriva da un singolo passaggio meccanico: stimare la probabilità reale di un intervallo di temperatura più accuratamente di come il mercato Polymarket lo prezzi. Tutto a valle — la decisione YES/NO di Claude, il sizing Kelly, la logica di uscita, i trailing stop — si alimenta da quella stima di probabilità.

Oggi facciamo l'ensemble di GFS, ECMWF, UKMO e NWS, li miscelliamo bayesianamente con la climatologia storica NCEI, e applichiamo una CDF normale sulla distribuzione dell'errore di previsione per arrivare a una probabilità. Funziona. Ma è fondamentalmente limitato dall'accuratezza dei modelli sottostanti.

Sostituire quella stima di probabilità con WeatherNext 2 come segnale primario ha effetti molto concreti:

  • Rilevamento dell'edge più nitido. Mezzo grado di miglioramento nel RMSE di previsione si traduce direttamente in 1-3% in più di edge rilevabile sui mercati borderline che attualmente vengono filtrati dalla nostra soglia del 2%. Più segnali raggiungono Claude.
  • Migliore calibrazione. Quando diciamo "78% di probabilità di YES", deve effettivamente risolvere al 78% su un campione ampio. L'output probabilistico nativo di WeatherNext 2 è materialmente meglio calibrato di qualsiasi cosa possiamo sintetizzare da modelli deterministici.
  • Meno operazioni catastrofiche sulle code. La performance più forte del modello sugli eventi rari significa che sbagliamo il prezzo delle fat tails meno spesso — storicamente la nostra categoria più grande di perdite inattese.
  • Tempi di risposta del modello più rapidi. Il nostro ciclo attuale di fetch delle previsioni è limitato in latenza dalle API meteo gratuite con rate-limiting. Eseguire WeatherNext 2 tramite Vertex AI di Google Cloud significa che possiamo aggiornare le previsioni secondo il nostro programma, non il loro.

Perché è un problema difficile

Vogliamo essere chiari: questo è il lavoro di ingegneria più difficile che abbiamo intrapreso dalla migrazione dell'infrastruttura di v2. "Collegare un nuovo modello" non è mai semplice come sembra, e WeatherNext 2 in particolare ha diversi spigoli vivi.

1
Accesso ai dati e infrastruttura
Le previsioni WeatherNext 2 sono fornite tramite Earth Engine, BigQuery e Vertex AI. Nessuno di questi è un drop-in replacement degli endpoint HTTP gratuiti che attualmente usiamo. Servono auth, gestione delle quote, controlli dei costi e un layer di caching che ammortizzi le chiamate di inferenza pagate sui nostri 97+ combo città/data attivi.
2
Integrazione di output probabilistico
Il nostro calcolatore di edge è stato progettato attorno a una singola previsione puntuale deterministica più un modello di errore Gaussiano. WeatherNext 2 ci dà un ensemble completo di diverse centinaia di scenari per città. Ricablare il motore di edge per consumare una distribuzione empirica reale (invece di fingerne una) richiede riscrivere il cuore di engine/edge.js e ritarare ogni soglia che Claude usa.
3
Interpolazione della griglia ai punti città
WeatherNext 2 produce una griglia globale. I contratti meteo di Polymarket si risolvono a specifiche stazioni meteo nominate (es. LaGuardia per NYC, Heathrow per Londra). Serve interpolazione bilineare o nearest-station accurata dalla griglia nativa del modello alla stazione di risoluzione esatta — e poi downscaling per effetti microclimatici locali dove rilevante.
4
Costo per previsione
Ogni combinazione città/data che monitoriamo diventa una chiamata di inferenza Vertex AI a pagamento. Con ~1.975 mercati meteo attivi su ~97 combinazioni uniche, un'implementazione ingenua brucerebbe il budget rapidamente. Stiamo costruendo una strategia di refresh a livelli: i mercati ad alta convinzione ottengono aggiornamenti frequenti, le città a basso volume ottengono cicli più lenti.
5
Retrocompatibilità
Non stiamo eliminando GFS/ECMWF/UKMO/NWS. L'architettura finale usa WeatherNext 2 come segnale primario con i modelli tradizionali come sanity check. Se WeatherNext 2 è in netto disaccordo con i modelli di fisica, quel disaccordo stesso diventa una feature su cui Claude può ragionare — non un motivo per fidarsi ciecamente di nessuna delle due parti.
6
Validazione out-of-sample
Prima di azionare l'interruttore, dobbiamo eseguire WeatherNext 2 in shadow per settimane in parallelo al bot live — registrando cosa avrebbe previsto per ogni mercato e poi confrontando con quanto si è effettivamente risolto. Un modello che fa benchmarking eccellente su ERA5 reanalysis deve comunque guadagnarsi un posto in un loop di trading in produzione con soldi veri.

Miglioramento atteso dell'accuratezza

Basandoci sui benchmark pubblicati di DeepMind e sulla nostra modellazione interna di come l'errore di previsione si propaghi attraverso il nostro edge calculator, ecco dove ci aspettiamo che le prestazioni di WeatherBot si muovano una volta che l'integrazione atterra:

RMSE della temperatura (orizzonte 48 h)
−28%
Riduzione attesa dell'errore di previsione al segno dei 2 giorni — l'orizzonte in cui la maggior parte dei nostri trade si risolve.
Calibrazione delle probabilità (Brier Score)
+18%
Probabilità meglio calibrate significano che i livelli di confidenza di Claude corrispondono effettivamente alla realtà, il che migliora direttamente il sizing Kelly.
Precisione su eventi estremi (freddo/caldo estremi)
+40%
I guadagni più grandi sono sugli eventi rari — esattamente dove i mercati sbagliano di più il prezzo e dove vivono le nostre vittorie più grandi.
Edge rilevabile per scansione
+35%
Previsioni più nitide spingono più mercati sopra la nostra soglia di edge del 2%, dando a Claude più segnali di alta qualità da valutare.

Accesso: a volume per gli utenti fedeli

Dobbiamo essere onesti sull'economia qui. L'inferenza WeatherNext 2 tramite Vertex AI non è gratuita, e il lavoro di infrastruttura rappresenta un investimento ingegneristico significativo. Non possiamo darlo a tutti dal giorno uno — e francamente, non vogliamo. Gli utenti che hanno effettivamente costruito WeatherBot in ciò che è oggi dovrebbero essere i primi a ottenerlo.

Quando WeatherNext 2 verrà lanciato, l'accesso sarà limitato dal volume di trading sulla piattaforma. Il tuo volume di trading cumulativo — ogni dollaro USDC che hai impiegato tramite WeatherBot nei mercati Polymarket — diventa la valuta che sblocca il motore aggiornato. Più hai tradato, prima e più profondo è il tuo accesso.

Come funzioneranno i livelli di volume

Le soglie finali dei tier saranno annunciate più vicino al lancio, ma la struttura è già definita:

  • Tier 1 — fondatori: il gruppo con il più alto volume cumulativo ottiene la prima ondata di accesso a WeatherNext 2 durante l'alpha chiusa. Output ensemble completo, massima cadenza di aggiornamento, canale di feedback diretto con il team di ingegneria.
  • Tier 2 — utenti avanzati: seconda ondata durante la beta. Segnale WeatherNext 2 completo con frequenza di aggiornamento leggermente ridotta.
  • Tier 3 — trader attivi: rollout generale con WeatherNext 2 a complemento dello stack esistente GFS/ECMWF/UKMO/NWS.
  • Sotto la soglia: continua sull'attuale stack multi-modello, che rimane completamente supportato ed è esso stesso migliorato in modo indipendente.

Il tuo volume di trading viene tracciato automaticamente — ogni trade che il bot piazza per tuo conto conta. Non devi fare nulla di speciale. Più usi la piattaforma, più alto è il tuo tier.

Una nota veloce sull'equità: i tier di volume sono calcolati dalla tua attività di trading sulla piattaforma, non dalla dimensione del wallet. Un utente con un bankroll più piccolo ma che lascia il bot tradare costantemente salirà di tier più velocemente di qualcuno che deposita un saldo grande e lo lascia inattivo. È deliberato — vogliamo premiare le persone che usano davvero WeatherBot come è progettato.

Cronologia

Nessuna promessa su date esatte — questa è ingegneria seria, e non la affretteremo in produzione. Ma ecco la roadmap onesta:

  • Ora: Account Google Cloud provisionato, accesso anticipato a Vertex AI richiesto, prototipo shadow-mode in costruzione contro dati storici.
  • Prossime settimane: Refactoring del motore edge per utilizzare insiemi probabilistici. Logging parallelo accanto al motore attuale.
  • Settimane successive: Shadow run in produzione — predizioni di WeatherNext 2 registrate per ogni mercato, confrontate con le risoluzioni effettive, con report di calibrazione pubblicati qui.
  • Una volta superati i benchmark: Alpha chiusa per utenti Tier 1. Ciclo di feedback con il team di ingegneria. Messa a punto finale.
  • Dopo l'alpha: Rollout per fasi attraverso Tier 2 e poi Tier 3.

Cosa puoi fare proprio ora

Il tuo volume di trading inizia a contare oggi. Ogni operazione che WeatherBot effettua per tuo conto da questo momento conta per il tuo tier WeatherNext 2 al lancio. Assicurati che il tuo bot stia girando, che il tuo bankroll sia configurato e che il tuo wallet sia connesso. Pubblicheremo le soglie esatte di volume nelle prossime settimane — ma gli utenti che salgono presto nella classifica saranno i primi a entrare nel motore aggiornato.

Read next

We Are Thrilled to Announce Two Brand-New Games: Storm Spin and Storm Bet

Read article →

Hong Kong Trades Are Now More Accurate Than Ever: We Plugged the Engine Straight Into the Source That Settles the Market

Read article →

WeatherBot by the Numbers: 9,592 Traders, $2.87M in Member Profit, and Exactly What It Costs to Run

Read article →
← All articles