WeatherNext 2 : le modèle IA de Google DeepMind arrive sur WeatherBot
Nous commençons à travailler sur la plus grande amélioration de précision des prévisions de l'histoire de WeatherBot : intégrer WeatherNext 2 de Google DeepMind directement dans le moteur de trading. Si nous réussissons cela, cela changera fondamentalement la qualité de chaque edge que notre bot détecte — et donc le résultat attendu de chaque trade qu'il place.
Ce post explique pourquoi WeatherNext 2 est important, comment il se compare au modèle NOAA GFS traditionnel sur lequel nous nous appuyons aujourd'hui, à quel point cette intégration est difficile, et comment l'accès sera conditionné par le volume de trading sur la plateforme une fois en ligne.
Qu'est-ce que WeatherNext 2 ?
WeatherNext 2 est le modèle de prévision le plus avancé que Google DeepMind ait jamais publié. Dévoilé fin 2025 et alimentant déjà Google Search, Gemini, Pixel Weather et Google Maps, il représente un saut générationnel dans la prévision météo à l'échelle mondiale.
Au lieu de résoudre les équations physiques qui régissent l'atmosphère — l'approche utilisée depuis des décennies par NOAA GFS, le modèle ECMWF et tous les systèmes traditionnels — WeatherNext 2 apprend le comportement atmosphérique directement à partir de décennies de données historiques. Il est construit sur une toute nouvelle architecture appelée Réseau Génératif Fonctionnel (FGN), qui injecte un bruit contrôlé directement dans le modèle pour que chaque prévision produite reste physiquement cohérente et intérieurement cohérente entre les variables.
Génération 8× plus rapide
Une prévision d'ensemble complète prend moins d'une minute sur un seul TPU. Les modèles basés sur la physique nécessitent des heures sur un supercalculateur pour produire le même résultat.
99,9 % des variables améliorées
Surpasse l'état de l'art précédent sur 99,9 % des variables (température, vent, humidité, pression, précipitation) et sur toutes les échéances de 0 à 15 jours.
Résolution 1 heure
Prévisions heure par heure rafraîchies quatre fois par jour — bien plus fines que la résolution native de 3 à 6 heures de GFS pour les horizons que nous tradons.
Des centaines de scénarios
Génère un ensemble probabiliste de centaines d'avenirs plausibles en moins d'une minute, ce qui nous donne une véritable distribution — et non une seule estimation déterministe.
Pourquoi c'est plus précis que NOAA GFS
Le Global Forecast System de la NOAA est un travail d'ingénierie phénoménal — mais il a été conçu à une époque antérieure au deep learning, et les limites de la modélisation basée sur la physique sont évidentes depuis des années. Il y a une raison pour laquelle ECMWF a historiquement surpassé GFS d'environ un jour complet de compétence de prévision, et pour laquelle presque tous les principaux fournisseurs météo ont commencé discrètement à superposer de l'IA sur leur stack traditionnel.
C'est là que WeatherNext 2 prend le pas sur GFS, en particulier sur le type de prévisions de température à court et moyen terme qui guident les contrats météo de Polymarket :
- Schémas atmosphériques appris vs. équations résolues — GFS approxime l'atmosphère en la discrétisant en une grille et en résolvant Navier-Stokes à chaque pas de temps. Ces approximations s'accumulent avec le temps. WeatherNext 2 a appris le comportement non linéaire complet de l'atmosphère à partir des données de réanalyse ERA5, donc il n'accumule pas la même classe d'erreur numérique.
- Sortie probabiliste native — GFS vous donne une prévision par exécution. Pour obtenir une distribution, vous avez besoin de GEFS (l'ensemble), ce qui ajoute du coût et de la latence. WeatherNext 2 sort la distribution complète nativement, nous voyons donc la probabilité réelle qu'une ville atteigne 14°C, pas seulement une estimation ponctuelle que nous devons emballer en bayésien nous-mêmes.
- Résolution effective supérieure — WeatherNext 2 produit des prévisions globales heure par heure. GFS fonctionne opérationnellement à une résolution horizontale de 13 km avec une sortie de 3 heures pour notre plage de trading. Pour les contrats spécifiques aux villes daily-max et daily-min, cette granularité temporelle supplémentaire est un véritable edge.
- Meilleur sur les extrêmes — les benchmarks de DeepMind montrent les plus grands gains sur les événements à faible probabilité et fort impact : vagues de froid, dômes de chaleur, tempêtes. Ce sont exactement les marchés où vivent les queues mal valorisées et d'où viennent nos plus gros trades.
- Ensembles physiquement cohérents — l'architecture FGN signifie que chaque scénario de l'ensemble est intérieurement cohérent (un scénario venteux a aussi le gradient de pression correspondant). C'est ce qui rend les probabilités utilisables pour la tarification.
Pour les horizons de 0 à 3 jours qui constituent l'essentiel des marchés météo de Polymarket, des évaluations indépendantes placent les modèles d'IA modernes au même niveau que — et souvent devant — l'IFS phare d'ECMWF, lui-même significativement en avance sur GFS. En traduction approximative : quelques dixièmes de degré de RMSE sur la température maximale quotidienne à 48 h, et une calibration sensiblement plus serrée sur les événements rares.
Pourquoi cela change le résultat des trades
Tout l'edge de WeatherBot vient d'une étape mécanique : estimer la vraie probabilité d'une plage de température avec plus de précision que ce que le marché Polymarket pricing. Tout en aval — la décision YES/NO de Claude, le sizing Kelly, la logique de sortie, les trailing stops — découle de cette estimation de probabilité.
Aujourd'hui nous assemblons GFS, ECMWF, UKMO et NWS, les mélangeons en mode bayésien avec la climatologie historique NCEI, et appliquons une CDF normale sur la distribution des erreurs de prévision pour obtenir une probabilité. Ça fonctionne. Mais c'est fondamentalement plafonné par la précision des modèles sous-jacents.
Remplacer cette estimation de probabilité par WeatherNext 2 comme signal principal a des effets très concrets :
- Détection d'edge plus précise. Un demi-degré d'amélioration du RMSE de prévision se traduit directement par 1-3% d'edge détectable supplémentaire sur les marchés borderline qui sont actuellement filtrés par notre seuil de 2%. Plus de signaux parviennent à Claude.
- Meilleure calibration. Quand nous disons « 78 % de probabilité de YES », cela doit réellement se résoudre à 78 % sur un grand échantillon. La sortie probabiliste native de WeatherNext 2 est nettement mieux calibrée que tout ce que nous pouvons synthétiser à partir de modèles déterministes.
- Moins de trades catastrophiques sur les extrêmes. La meilleure performance du modèle sur les événements rares signifie que nous mal-pricons moins souvent les fat tails — historiquement notre principale catégorie de pertes inattendues.
- Délais de modèle plus rapides. Notre cycle actuel de récupération de prévisions est limité en latence par des API météo gratuites soumises à des limites de taux. Faire tourner WeatherNext 2 via Vertex AI de Google Cloud nous permet de rafraîchir les prévisions à notre propre rythme, pas au leur.
Pourquoi c'est un problème difficile
Nous voulons être francs : c'est le travail d'ingénierie le plus difficile que nous ayons entrepris depuis la migration d'infrastructure de v2. "Brancher un nouveau modèle" n'est jamais aussi simple qu'il y paraît, et WeatherNext 2 en particulier comporte de nombreuses aspérités.
engine/edge.js et reconfigurer chaque seuil utilisé par Claude.Amélioration de précision attendue
Sur la base des benchmarks publiés par DeepMind et de notre propre modélisation interne de la façon dont l'erreur de prévision se propage à travers notre calculateur d'edge, voici où nous attendons que les performances de WeatherBot évoluent une fois l'intégration en place :
Accès : conditionné au volume pour les utilisateurs fidèles
Soyons honnêtes sur l'économie ici. L'inférence WeatherNext 2 via Vertex AI n'est pas gratuite, et le travail d'infrastructure représente un investissement d'ingénierie significatif. Nous ne pouvons pas le donner à tout le monde dès le premier jour — et franchement, nous ne le voulons pas. Les utilisateurs qui ont réellement construit WeatherBot dans ce qu'il est aujourd'hui devraient être les premiers à l'obtenir.
Lors du lancement de WeatherNext 2, l'accès sera conditionné par le volume de trading sur la plateforme. Votre volume de trading cumulatif — chaque dollar USDC que vous avez déployé via WeatherBot sur les marchés Polymarket — devient la monnaie qui débloque le moteur amélioré. Plus vous avez tradé, plus votre accès est précoce et profond.
Comment fonctionneront les paliers de volume
Les seuils finaux des paliers seront annoncés à l'approche du lancement, mais la structure est déjà figée :
- Tier 1 — Fondateurs : le groupe au volume cumulé le plus élevé obtient la première vague d'accès à WeatherNext 2 pendant l'alpha fermée. Sortie d'ensemble complète, cadence de rafraîchissement la plus élevée, canal de feedback direct avec l'équipe d'ingénierie.
- Tier 2 — Utilisateurs avancés : deuxième vague pendant la bêta. Signal WeatherNext 2 complet avec une fréquence de rafraîchissement légèrement réduite.
- Tier 3 — Traders actifs : déploiement général avec WeatherNext 2 en complément de la pile GFS/ECMWF/UKMO/NWS existante.
- En dessous du seuil : se poursuit sur l'actuel stack multi-modèle, qui reste entièrement pris en charge et est lui-même amélioré indépendamment.
Votre volume de trading est suivi automatiquement — chaque trade que le bot place en votre nom compte. Vous n'avez rien de spécial à faire. Plus vous utilisez la plateforme, plus votre tier est élevé.
Une note rapide sur l'équité : les paliers de volume sont calculés à partir de votre activité de trading sur la plateforme, pas de la taille de votre wallet. Un utilisateur avec un capital plus petit mais laissant le bot trader régulièrement gravira les paliers plus vite que quelqu'un qui dépose un gros solde et le laisse inactif. C'est délibéré — nous voulons récompenser les personnes qui utilisent vraiment WeatherBot comme il est conçu.
Calendrier
Pas de promesses sur des dates exactes — c'est de l'ingénierie sérieuse, et nous n'allons pas la précipiter en production. Mais voici la feuille de route honnête :
- Maintenant : Compte Google Cloud provisionné, accès anticipé à Vertex AI demandé, prototype shadow-mode en cours de construction sur données historiques.
- Prochaines semaines : Refactorisation du moteur d'edge pour consommer des ensembles probabilistes. Journalisation parallèle aux côtés du moteur actuel.
- Semaines suivantes : Shadow run en production — prédictions de WeatherNext 2 enregistrées pour chaque marché, comparées aux résolutions réelles, avec des rapports de calibration publiés ici.
- Une fois les benchmarks validés : Alpha fermée pour les utilisateurs Tier 1. Boucle de retour avec l'équipe d'ingénierie. Réglages finaux.
- Après l'alpha : Déploiement par étapes via Tier 2, puis Tier 3.
Ce que vous pouvez faire maintenant
Votre volume de trading commence à compter aujourd'hui. Chaque trade que WeatherBot effectue en votre nom dès maintenant compte pour votre palier WeatherNext 2 au lancement. Assurez-vous que votre bot tourne, que votre capital est configuré et que votre wallet est connecté. Nous publierons les seuils de volume exacts dans les semaines à venir — mais les utilisateurs qui grimpent le classement tôt seront les premiers à passer au moteur amélioré.