Accueil Classement Tableau de bord

WeatherNext 2 : le modèle IA de Google DeepMind arrive sur WeatherBot

Nous commençons à travailler sur la plus grande amélioration de précision des prévisions de l'histoire de WeatherBot : intégrer WeatherNext 2 de Google DeepMind directement dans le moteur de trading. Si nous réussissons cela, cela changera fondamentalement la qualité de chaque edge que notre bot détecte — et donc le résultat attendu de chaque trade qu'il place.

Ce post explique pourquoi WeatherNext 2 est important, comment il se compare au modèle NOAA GFS traditionnel sur lequel nous nous appuyons aujourd'hui, à quel point cette intégration est difficile, et comment l'accès sera conditionné par le volume de trading sur la plateforme une fois en ligne.

Qu'est-ce que WeatherNext 2 ?

WeatherNext 2 est le modèle de prévision le plus avancé que Google DeepMind ait jamais publié. Dévoilé fin 2025 et alimentant déjà Google Search, Gemini, Pixel Weather et Google Maps, il représente un saut générationnel dans la prévision météo à l'échelle mondiale.

Au lieu de résoudre les équations physiques qui régissent l'atmosphère — l'approche utilisée depuis des décennies par NOAA GFS, le modèle ECMWF et tous les systèmes traditionnels — WeatherNext 2 apprend le comportement atmosphérique directement à partir de décennies de données historiques. Il est construit sur une toute nouvelle architecture appelée Réseau Génératif Fonctionnel (FGN), qui injecte un bruit contrôlé directement dans le modèle pour que chaque prévision produite reste physiquement cohérente et intérieurement cohérente entre les variables.

Génération 8× plus rapide

Une prévision d'ensemble complète prend moins d'une minute sur un seul TPU. Les modèles basés sur la physique nécessitent des heures sur un supercalculateur pour produire le même résultat.

99,9 % des variables améliorées

Surpasse l'état de l'art précédent sur 99,9 % des variables (température, vent, humidité, pression, précipitation) et sur toutes les échéances de 0 à 15 jours.

Résolution 1 heure

Prévisions heure par heure rafraîchies quatre fois par jour — bien plus fines que la résolution native de 3 à 6 heures de GFS pour les horizons que nous tradons.

Des centaines de scénarios

Génère un ensemble probabiliste de centaines d'avenirs plausibles en moins d'une minute, ce qui nous donne une véritable distribution — et non une seule estimation déterministe.

Pourquoi c'est plus précis que NOAA GFS

Le Global Forecast System de la NOAA est un travail d'ingénierie phénoménal — mais il a été conçu à une époque antérieure au deep learning, et les limites de la modélisation basée sur la physique sont évidentes depuis des années. Il y a une raison pour laquelle ECMWF a historiquement surpassé GFS d'environ un jour complet de compétence de prévision, et pour laquelle presque tous les principaux fournisseurs météo ont commencé discrètement à superposer de l'IA sur leur stack traditionnel.

C'est là que WeatherNext 2 prend le pas sur GFS, en particulier sur le type de prévisions de température à court et moyen terme qui guident les contrats météo de Polymarket :

  • Schémas atmosphériques appris vs. équations résolues — GFS approxime l'atmosphère en la discrétisant en une grille et en résolvant Navier-Stokes à chaque pas de temps. Ces approximations s'accumulent avec le temps. WeatherNext 2 a appris le comportement non linéaire complet de l'atmosphère à partir des données de réanalyse ERA5, donc il n'accumule pas la même classe d'erreur numérique.
  • Sortie probabiliste native — GFS vous donne une prévision par exécution. Pour obtenir une distribution, vous avez besoin de GEFS (l'ensemble), ce qui ajoute du coût et de la latence. WeatherNext 2 sort la distribution complète nativement, nous voyons donc la probabilité réelle qu'une ville atteigne 14°C, pas seulement une estimation ponctuelle que nous devons emballer en bayésien nous-mêmes.
  • Résolution effective supérieure — WeatherNext 2 produit des prévisions globales heure par heure. GFS fonctionne opérationnellement à une résolution horizontale de 13 km avec une sortie de 3 heures pour notre plage de trading. Pour les contrats spécifiques aux villes daily-max et daily-min, cette granularité temporelle supplémentaire est un véritable edge.
  • Meilleur sur les extrêmes — les benchmarks de DeepMind montrent les plus grands gains sur les événements à faible probabilité et fort impact : vagues de froid, dômes de chaleur, tempêtes. Ce sont exactement les marchés où vivent les queues mal valorisées et d'où viennent nos plus gros trades.
  • Ensembles physiquement cohérents — l'architecture FGN signifie que chaque scénario de l'ensemble est intérieurement cohérent (un scénario venteux a aussi le gradient de pression correspondant). C'est ce qui rend les probabilités utilisables pour la tarification.

Pour les horizons de 0 à 3 jours qui constituent l'essentiel des marchés météo de Polymarket, des évaluations indépendantes placent les modèles d'IA modernes au même niveau que — et souvent devant — l'IFS phare d'ECMWF, lui-même significativement en avance sur GFS. En traduction approximative : quelques dixièmes de degré de RMSE sur la température maximale quotidienne à 48 h, et une calibration sensiblement plus serrée sur les événements rares.

Pourquoi cela change le résultat des trades

Tout l'edge de WeatherBot vient d'une étape mécanique : estimer la vraie probabilité d'une plage de température avec plus de précision que ce que le marché Polymarket pricing. Tout en aval — la décision YES/NO de Claude, le sizing Kelly, la logique de sortie, les trailing stops — découle de cette estimation de probabilité.

Aujourd'hui nous assemblons GFS, ECMWF, UKMO et NWS, les mélangeons en mode bayésien avec la climatologie historique NCEI, et appliquons une CDF normale sur la distribution des erreurs de prévision pour obtenir une probabilité. Ça fonctionne. Mais c'est fondamentalement plafonné par la précision des modèles sous-jacents.

Remplacer cette estimation de probabilité par WeatherNext 2 comme signal principal a des effets très concrets :

  • Détection d'edge plus précise. Un demi-degré d'amélioration du RMSE de prévision se traduit directement par 1-3% d'edge détectable supplémentaire sur les marchés borderline qui sont actuellement filtrés par notre seuil de 2%. Plus de signaux parviennent à Claude.
  • Meilleure calibration. Quand nous disons « 78 % de probabilité de YES », cela doit réellement se résoudre à 78 % sur un grand échantillon. La sortie probabiliste native de WeatherNext 2 est nettement mieux calibrée que tout ce que nous pouvons synthétiser à partir de modèles déterministes.
  • Moins de trades catastrophiques sur les extrêmes. La meilleure performance du modèle sur les événements rares signifie que nous mal-pricons moins souvent les fat tails — historiquement notre principale catégorie de pertes inattendues.
  • Délais de modèle plus rapides. Notre cycle actuel de récupération de prévisions est limité en latence par des API météo gratuites soumises à des limites de taux. Faire tourner WeatherNext 2 via Vertex AI de Google Cloud nous permet de rafraîchir les prévisions à notre propre rythme, pas au leur.

Pourquoi c'est un problème difficile

Nous voulons être francs : c'est le travail d'ingénierie le plus difficile que nous ayons entrepris depuis la migration d'infrastructure de v2. "Brancher un nouveau modèle" n'est jamais aussi simple qu'il y paraît, et WeatherNext 2 en particulier comporte de nombreuses aspérités.

1
Accès aux données & plomberie
Les prévisions WeatherNext 2 sont fournies via Earth Engine, BigQuery et Vertex AI. Aucun de ceux-ci n'est un remplacement direct des endpoints HTTP gratuits que nous utilisons actuellement. Nous avons besoin d'authentification, gestion des quotas, contrôles de coût et d'une couche de cache amortissant les appels d'inférence payants sur nos 97+ combos ville/date actifs.
2
Intégration de sortie probabiliste
Notre calculateur d'edge a été conçu autour d'une seule prévision ponctuelle déterministe plus un modèle d'erreur gaussien. WeatherNext 2 nous fournit un ensemble complet de plusieurs centaines de scénarios par ville. Reconfigurer le moteur d'edge pour qu'il consomme une véritable distribution empirique (au lieu d'en simuler une) nécessite de réécrire le cœur de engine/edge.js et reconfigurer chaque seuil utilisé par Claude.
3
Interpolation de grille vers les points des villes
WeatherNext 2 produit une grille mondiale. Les contrats météo de Polymarket se règlent à des stations météo nommément identifiées (par ex., LaGuardia pour New York, Heathrow pour Londres). Nous avons besoin d'une interpolation bilinéaire ou nearest-station précise de la grille native du modèle vers la station de résolution exacte — puis d'un downscaling pour les effets microclimatiques locaux le cas échéant.
4
Coût par prévision
Chaque combinaison ville/date que nous surveillons devient un appel d'inférence Vertex AI payant. Avec ~1 975 marchés météo actifs répartis sur ~97 combinaisons uniques, une implémentation naïve épuiserait le budget rapidement. Nous construisons une stratégie de rafraîchissement par paliers : les marchés à forte conviction reçoivent des mises à jour fréquentes, les villes à faible volume reçoivent des cycles plus lents.
5
Rétrocompatibilité
Nous n'arrachons pas GFS/ECMWF/UKMO/NWS. L'architecture finale utilise WeatherNext 2 comme signal principal, avec les modèles traditionnels comme vérification de bon sens. Si WeatherNext 2 est en désaccord profond avec les modèles physiques, ce désaccord lui-même devient une caractéristique sur laquelle Claude peut raisonner — pas une raison de faire aveuglément confiance à l'un ou l'autre.
6
Validation hors échantillon
Avant d'actionner l'interrupteur, nous devons faire tourner WeatherNext 2 en shadow pendant des semaines en parallèle du bot en direct — en loggant ce qu'il aurait prédit pour chaque marché, puis en comparant à ce qui s'est réellement réglé. Un modèle qui obtient d'excellents benchmarks sur la réanalyse ERA5 doit encore gagner sa place dans une boucle de trading en production avec du vrai argent derrière.

Amélioration de précision attendue

Sur la base des benchmarks publiés par DeepMind et de notre propre modélisation interne de la façon dont l'erreur de prévision se propage à travers notre calculateur d'edge, voici où nous attendons que les performances de WeatherBot évoluent une fois l'intégration en place :

RMSE de température (horizon 48 h)
−28%
Réduction attendue de l'erreur de prévision à la marque de 2 jours — l'horizon où la majorité de nos trades se résolvent.
Calibration des probabilités (score de Brier)
+18%
Des probabilités mieux calibrées signifient que les niveaux de confiance de Claude correspondent réellement à la réalité, ce qui améliore directement le dimensionnement Kelly.
Précision sur événements extrêmes (froid/chaleur extrêmes)
+40%
Les plus grands gains se trouvent sur les événements rares — exactement là où les marchés se trompent le plus en prix et où vivent nos plus grandes victoires.
Edge détectable par scan
+35%
Des prévisions plus précises poussent plus de marchés au-dessus de notre seuil d'edge de 2%, donnant à Claude plus de signaux de haute qualité à évaluer.

Accès : conditionné au volume pour les utilisateurs fidèles

Soyons honnêtes sur l'économie ici. L'inférence WeatherNext 2 via Vertex AI n'est pas gratuite, et le travail d'infrastructure représente un investissement d'ingénierie significatif. Nous ne pouvons pas le donner à tout le monde dès le premier jour — et franchement, nous ne le voulons pas. Les utilisateurs qui ont réellement construit WeatherBot dans ce qu'il est aujourd'hui devraient être les premiers à l'obtenir.

Lors du lancement de WeatherNext 2, l'accès sera conditionné par le volume de trading sur la plateforme. Votre volume de trading cumulatif — chaque dollar USDC que vous avez déployé via WeatherBot sur les marchés Polymarket — devient la monnaie qui débloque le moteur amélioré. Plus vous avez tradé, plus votre accès est précoce et profond.

Comment fonctionneront les paliers de volume

Les seuils finaux des paliers seront annoncés à l'approche du lancement, mais la structure est déjà figée :

  • Tier 1 — Fondateurs : le groupe au volume cumulé le plus élevé obtient la première vague d'accès à WeatherNext 2 pendant l'alpha fermée. Sortie d'ensemble complète, cadence de rafraîchissement la plus élevée, canal de feedback direct avec l'équipe d'ingénierie.
  • Tier 2 — Utilisateurs avancés : deuxième vague pendant la bêta. Signal WeatherNext 2 complet avec une fréquence de rafraîchissement légèrement réduite.
  • Tier 3 — Traders actifs : déploiement général avec WeatherNext 2 en complément de la pile GFS/ECMWF/UKMO/NWS existante.
  • En dessous du seuil : se poursuit sur l'actuel stack multi-modèle, qui reste entièrement pris en charge et est lui-même amélioré indépendamment.

Votre volume de trading est suivi automatiquement — chaque trade que le bot place en votre nom compte. Vous n'avez rien de spécial à faire. Plus vous utilisez la plateforme, plus votre tier est élevé.

Une note rapide sur l'équité : les paliers de volume sont calculés à partir de votre activité de trading sur la plateforme, pas de la taille de votre wallet. Un utilisateur avec un capital plus petit mais laissant le bot trader régulièrement gravira les paliers plus vite que quelqu'un qui dépose un gros solde et le laisse inactif. C'est délibéré — nous voulons récompenser les personnes qui utilisent vraiment WeatherBot comme il est conçu.

Calendrier

Pas de promesses sur des dates exactes — c'est de l'ingénierie sérieuse, et nous n'allons pas la précipiter en production. Mais voici la feuille de route honnête :

  • Maintenant : Compte Google Cloud provisionné, accès anticipé à Vertex AI demandé, prototype shadow-mode en cours de construction sur données historiques.
  • Prochaines semaines : Refactorisation du moteur d'edge pour consommer des ensembles probabilistes. Journalisation parallèle aux côtés du moteur actuel.
  • Semaines suivantes : Shadow run en production — prédictions de WeatherNext 2 enregistrées pour chaque marché, comparées aux résolutions réelles, avec des rapports de calibration publiés ici.
  • Une fois les benchmarks validés : Alpha fermée pour les utilisateurs Tier 1. Boucle de retour avec l'équipe d'ingénierie. Réglages finaux.
  • Après l'alpha : Déploiement par étapes via Tier 2, puis Tier 3.

Ce que vous pouvez faire maintenant

Votre volume de trading commence à compter aujourd'hui. Chaque trade que WeatherBot effectue en votre nom dès maintenant compte pour votre palier WeatherNext 2 au lancement. Assurez-vous que votre bot tourne, que votre capital est configuré et que votre wallet est connecté. Nous publierons les seuils de volume exacts dans les semaines à venir — mais les utilisateurs qui grimpent le classement tôt seront les premiers à passer au moteur amélioré.

Read next

We Are Thrilled to Announce Two Brand-New Games: Storm Spin and Storm Bet

Read article →

Hong Kong Trades Are Now More Accurate Than Ever: We Plugged the Engine Straight Into the Source That Settles the Market

Read article →

WeatherBot by the Numbers: 9,592 Traders, $2.87M in Member Profit, and Exactly What It Costs to Run

Read article →
← All articles