WeatherNext 2: el modelo de IA de Google DeepMind llega a WeatherBot
Estamos comenzando a trabajar en la mayor mejora de precisión de pronóstico en la historia de WeatherBot: integrar WeatherNext 2 de Google DeepMind directamente en el motor de trading. Si lo logramos, cambiará fundamentalmente la calidad de cada edge que nuestro bot detecta — y por lo tanto el resultado esperado de cada trade que coloca.
Este post explica por qué WeatherNext 2 importa, cómo se compara con el modelo NOAA GFS tradicional del que dependemos hoy, lo difícil que realmente es esta integración y cómo se otorgará el acceso por volumen de trading en la plataforma una vez que esté activo.
¿Qué es WeatherNext 2?
WeatherNext 2 es el modelo de pronóstico más avanzado que Google DeepMind ha lanzado. Presentado a finales de 2025 y ya impulsando Google Search, Gemini, Pixel Weather y Google Maps, representa un salto generacional en cómo se predice el clima a escala global.
En lugar de resolver las ecuaciones físicas que gobiernan la atmósfera — el enfoque que NOAA GFS, el modelo ECMWF y todo sistema tradicional han usado durante décadas — WeatherNext 2 aprende el comportamiento atmosférico directamente desde décadas de datos históricos. Está construido sobre una arquitectura completamente nueva llamada Red Generativa Funcional (FGN), que inyecta ruido controlado directamente en el modelo para que cada pronóstico que produce permanezca físicamente consistente e internamente coherente entre variables.
Generación 8× más rápida
Un pronóstico de ensemble completo tarda menos de un minuto en una sola TPU. Los modelos basados en física necesitan horas en una supercomputadora para producir el mismo resultado.
99.9 % de variables mejoradas
Supera al anterior estado del arte en el 99.9% de las variables (temperatura, viento, humedad, presión, precipitación) y en todos los plazos desde 0 hasta 15 días.
Resolución de 1 hora
Predicciones hora por hora actualizadas cuatro veces al día — mucho más finas que la resolución nativa de 3 a 6 horas de GFS para los horizontes que operamos.
Cientos de escenarios
Genera un ensemble probabilístico de cientos de futuros plausibles en menos de un minuto, dándonos una distribución real — no una sola conjetura determinista.
Por qué es más preciso que NOAA GFS
El Global Forecast System de NOAA es una pieza fenomenal de ingeniería — pero fue diseñado en una era anterior al deep learning, y los límites del modelado basado en física llevan años siendo evidentes. Hay una razón por la que ECMWF ha superado históricamente a GFS por aproximadamente un día completo de habilidad de pronóstico, y por qué casi todos los principales proveedores meteorológicos han empezado discretamente a superponer IA sobre su stack tradicional.
Aquí es donde WeatherNext 2 se adelanta a GFS específicamente en los tipos de pronósticos de temperatura de corto a medio plazo que impulsan los contratos meteorológicos de Polymarket:
- Patrones atmosféricos aprendidos vs. ecuaciones resueltas — GFS aproxima la atmósfera discretizándola en una cuadrícula y resolviendo Navier-Stokes en cada paso de tiempo. Esas aproximaciones se acumulan con el tiempo. WeatherNext 2 aprendió el comportamiento no lineal completo de la atmósfera a partir de datos de reanálisis ERA5, así que no acumula esa misma clase de error numérico.
- Salida probabilística nativa — GFS te da un pronóstico por ejecución. Para obtener una distribución necesitas GEFS (el ensemble), lo que añade costo y latencia. WeatherNext 2 produce la distribución completa de forma nativa, así que vemos la probabilidad real de que una ciudad alcance 14°C, no solo una estimación puntual que tenemos que envolver bayesianamente nosotros mismos.
- Mayor resolución efectiva — WeatherNext 2 produce pronósticos globales hora por hora. GFS opera con resolución horizontal de 13 km y salida de 3 horas para nuestro rango de trading. Para contratos de máximo-diario y mínimo-diario específicos de ciudad, esa granularidad temporal extra es un edge genuino.
- Mejor en los extremos — los benchmarks de DeepMind muestran las mayores ganancias en eventos de baja probabilidad y alto impacto: olas de frío, domos de calor, tormentas. Estos son exactamente los mercados donde viven las colas mal valoradas y de donde vienen nuestros mayores trades.
- Ensembles físicamente coherentes — la arquitectura FGN significa que cada escenario en el ensamble es internamente consistente (un escenario con viento también tiene el gradiente de presión correspondiente). Esto es lo que hace que las probabilidades sean utilizables para fijar precios.
Para los horizontes de 0 a 3 días que constituyen la mayoría de los mercados meteorológicos de Polymarket, las evaluaciones independientes ubican a los modelos de IA modernos en el mismo nivel — y a menudo por encima — del IFS insignia de ECMWF, que por sí mismo está significativamente por delante de GFS. Una traducción aproximada: unas décimas de grado de RMSE en la temperatura máxima diaria a las 48 horas, y una calibración notablemente más ajustada en eventos raros.
Por qué esto cambia el resultado de las operaciones
Toda la ventaja de WeatherBot proviene de un paso mecánico: estimar la probabilidad real de un rango de temperatura con más precisión que la que el mercado de Polymarket le da. Todo lo que sigue — la decisión YES/NO de Claude, el sizing de Kelly, la lógica de salida, los trailing stops — se alimenta de esa estimación de probabilidad.
Hoy combinamos GFS, ECMWF, UKMO y NWS, los mezclamos bayesianamente con la climatología histórica de NCEI, y aplicamos una CDF normal sobre la distribución del error de pronóstico para llegar a una probabilidad. Funciona. Pero está fundamentalmente limitado por la precisión de los modelos subyacentes.
Reemplazar esa estimación de probabilidad con WeatherNext 2 como señal principal tiene efectos muy concretos:
- Detección de ventaja más nítida. Medio grado de mejora en el RMSE del pronóstico se traduce directamente en 1-3% más de edge detectable en mercados borderline que actualmente son filtrados por nuestro umbral del 2%. Más señales llegan a Claude.
- Mejor calibración. Cuando decimos "78 % de probabilidad de YES", debe resolverse realmente al 78 % sobre una muestra grande. La salida probabilística nativa de WeatherNext 2 está materialmente mejor calibrada que cualquier cosa que podamos sintetizar a partir de modelos determinísticos.
- Menos operaciones catastróficas en las colas. El desempeño más fuerte del modelo en eventos raros significa que sobrevaloramos menos las colas pesadas — históricamente nuestra mayor categoría de pérdidas inesperadas.
- Tiempo de respuesta del modelo más rápido. Nuestro ciclo actual de obtención de pronósticos está limitado por la latencia de APIs meteorológicas gratuitas con limitación de tasa. Ejecutar WeatherNext 2 a través de Vertex AI de Google Cloud significa que podemos refrescar pronósticos en nuestra propia agenda, no en la suya.
Por qué este es un problema difícil
Queremos ser directos: este es el trabajo de ingeniería más difícil que hemos asumido desde la migración de infraestructura de v2. "Conectar un modelo nuevo" nunca es tan simple como suena, y WeatherNext 2 en particular tiene varios bordes afilados.
engine/edge.js y reajustar cada umbral que Claude usa.Mejora de precisión esperada
Basándonos en los benchmarks publicados de DeepMind y nuestro propio modelado interno de cómo se propaga el error de pronóstico a través de nuestro calculador de edge, aquí está donde esperamos que el rendimiento de WeatherBot se mueva una vez que aterrice la integración:
Acceso: por volumen para usuarios fieles
Necesitamos ser honestos sobre la economía aquí. La inferencia de WeatherNext 2 a través de Vertex AI no es gratuita, y el trabajo de infraestructura representa una inversión de ingeniería significativa. No podemos dárselo a todos el día uno — y francamente, no queremos. Los usuarios que realmente han construido WeatherBot hasta lo que es hoy deberían ser los primeros en obtenerlo.
Cuando se lance WeatherNext 2, el acceso será restringido por el volumen de trading en la plataforma. Tu volumen acumulado de trading — cada dólar USDC que has desplegado a través de WeatherBot en mercados Polymarket — se convierte en la moneda que desbloquea el motor mejorado. Cuanto más hayas tradeado, antes y más profundo es tu acceso.
Cómo funcionarán los niveles de volumen
Los umbrales finales de los niveles se anunciarán más cerca del lanzamiento, pero la estructura ya está fijada:
- Tier 1 — Fundadores: el grupo con mayor volumen acumulado obtiene la primera ola de acceso a WeatherNext 2 durante la alpha cerrada. Salida completa de ensamble, mayor cadencia de refresco, canal directo de feedback con el equipo de ingeniería.
- Tier 2 — Usuarios avanzados: segunda oleada durante la beta. Señal completa de WeatherNext 2 con una frecuencia de actualización ligeramente reducida.
- Tier 3 — Traders activos: implementación general con WeatherNext 2 como complemento al stack existente de GFS/ECMWF/UKMO/NWS.
- Por debajo del umbral: continúa en el stack multi-modelo actual, que sigue siendo totalmente compatible y se mejora de forma independiente.
Tu volumen de trading se rastrea automáticamente — cada trade que el bot coloca en tu nombre cuenta. No necesitas hacer nada especial. Cuanto más uses la plataforma, mayor será tu tier.
Una nota rápida sobre la equidad: los niveles de volumen se calculan a partir de tu actividad de trading en la plataforma, no del tamaño de tu wallet. Un usuario con un capital menor pero que deja que el bot opere consistentemente subirá de nivel más rápido que alguien que deposita un saldo grande y lo deja inactivo. Esto es deliberado — queremos recompensar a las personas que realmente usan WeatherBot como está diseñado.
Cronograma
Sin promesas de fechas exactas — esto es ingeniería seria, y no vamos a apresurarlo a producción. Pero aquí está la hoja de ruta honesta:
- Ahora: Cuenta de Google Cloud aprovisionada, acceso temprano a Vertex AI solicitado, prototipo shadow-mode siendo construido contra datos históricos.
- Próximas semanas: Refactorización del motor de edge para consumir conjuntos probabilísticos. Registro paralelo junto al motor actual.
- Semanas siguientes: Shadow run en producción — predicciones de WeatherNext 2 registradas para cada mercado, comparadas con las resoluciones reales, con informes de calibración publicados aquí.
- Una vez superados los benchmarks: Alfa cerrada para usuarios de Tier 1. Bucle de retroalimentación con el equipo de ingeniería. Ajustes finales.
- Después del alfa: Despliegue por fases a través de Tier 2 y luego Tier 3.
Lo que puedes hacer ahora mismo
Tu volumen de trading empieza a contar hoy. Cada operación que WeatherBot ejecute en tu nombre desde este momento cuenta para tu nivel de WeatherNext 2 en el lanzamiento. Asegúrate de que tu bot esté corriendo, tu capital esté configurado y tu wallet conectada. Publicaremos los umbrales exactos de volumen en las próximas semanas — pero los usuarios que escalen el leaderboard temprano serán los primeros en entrar al motor mejorado.