WeatherNext 2: ШІ-модель Google DeepMind приходить до WeatherBot
Ми починаємо роботу над найбільшим оновленням точності прогнозу в історії WeatherBot: інтеграція WeatherNext 2 від Google DeepMind безпосередньо в торговий двигун. Якщо нам це вдасться, це фундаментально змінить якість кожного edge, який виявляє наш бот — і, отже, очікуваний результат кожної угоди, яку він здійснює.
Цей пост пояснює, чому WeatherNext 2 важливий, як він порівнюється з традиційною моделлю NOAA GFS, на яку ми покладаємось сьогодні, наскільки складною є ця інтеграція та як доступ буде розподілятись за обсягом торгів на платформі після запуску.
Що таке WeatherNext 2?
WeatherNext 2 — найдосконаліша модель прогнозу, яку випустив Google DeepMind. Представлена наприкінці 2025 і вже працює в Google Search, Gemini, Pixel Weather та Google Maps — це поколіннєвий стрибок у глобальному прогнозуванні погоди.
Замість того, щоб розв'язувати фізичні рівняння, що описують атмосферу — підхід, який NOAA GFS, модель ECMWF та всі традиційні системи використовували десятиліттями — WeatherNext 2 вчить поведінку атмосфери безпосередньо з десятиліть історичних даних. Він побудований на абсолютно новій архітектурі під назвою Функціональна генеративна мережа (FGN), який інжектує контрольований шум безпосередньо в модель, щоб кожен створюваний прогноз залишався фізично узгодженим і внутрішньо когерентним між змінними.
У 8× швидша генерація
Повний ансамблевий прогноз займає менше хвилини на одному TPU. Фізичним моделям потрібні години на суперкомп'ютері для такого ж результату.
99,9% змінних покращено
Перевершує попередній state-of-the-art за 99,9% змінних (температура, вітер, вологість, тиск, опади) і на всіх горизонтах від 0 до 15 днів.
1-годинна роздільність
Погодинні прогнози оновлюються чотири рази на день — значно точніше за нативну роздільну здатність 3-6 годин у GFS для горизонтів, на яких ми торгуємо.
Сотні сценаріїв
Менш ніж за хвилину генерує імовірнісний ансамбль із сотень правдоподібних варіантів майбутнього, даючи нам справжній розподіл — а не одне детерміністичне припущення.
Чому він точніший за NOAA GFS
Global Forecast System NOAA — феноменальна інженерія, але був розроблений до епохи глибокого навчання, і обмеження моделей на основі фізики очевидні вже багато років. Є причина, чому ECMWF історично випереджає GFS приблизно на цілий день прогнозної навички, і чому майже кожен великий постачальник погоди тихо почав накладати ШІ поверх свого традиційного стеку.
Ось де WeatherNext 2 випереджає GFS — саме в тих короткострокових і середньострокових прогнозах температури, які рухають погодні контракти Polymarket:
- Вивчені атмосферні патерни проти розв'язаних рівнянь — GFS апроксимує атмосферу, дискретизуючи її в сітку і розв'язуючи Нав'є-Стокса на кожному часовому кроці. Ці наближення накопичуються з часом. WeatherNext 2 вивчив повну нелінійну поведінку атмосфери з даних реаналізу ERA5, тому не накопичує той же клас числової помилки.
- Нативний імовірнісний вивід — GFS дає один прогноз за запуск. Щоб отримати розподіл, потрібен GEFS (ансамбль), що додає вартість і затримку. WeatherNext 2 видає повний розподіл нативно, тож ми бачимо реальну ймовірність того, що місто досягне 14°C, а не точкову оцінку, яку ми мусимо самі баєсівськи обгортати.
- Вища ефективна роздільність — WeatherNext 2 створює погодинні глобальні прогнози. GFS працює з горизонтальною роздільною здатністю 13 км і 3-годинним виводом для нашого торгового діапазону. Для контрактів на денний максимум і денний мінімум по конкретних містах ця додаткова часова деталізація — справжня перевага.
- Краще на хвостах — бенчмарки DeepMind показують найбільші виграші на подіях з низькою ймовірністю та високим впливом: похолодання, теплові куполи, шторми. Це саме ті ринки, де живуть неправильно оцінені хвости і звідки приходять наші найбільші угоди.
- Фізично узгоджені ансамблі — архітектура FGN означає, що кожен сценарій в ансамблі внутрішньо узгоджений (вітряний сценарій також має відповідний градієнт тиску). Саме це робить ймовірності придатними для ціноутворення.
Для горизонтів 0-3 дні, що складають більшість погодних ринків Polymarket, незалежні оцінки ставлять сучасні ШІ-моделі на той самий рівень — і часто попереду — флагманського IFS від ECMWF, який сам значно випереджає GFS. Грубо кажучи: кілька десятих градуса RMSE по добовому максимуму температури на позначці 48 годин і помітно щільніша калібровка на рідкісних подіях.
Чому це змінює результат угод
Уся перевага WeatherBot походить з одного механічного кроку: оцінити справжню ймовірність температурного діапазону точніше, ніж ринок Polymarket її враховує. Все, що нижче — рішення Claude YES/NO, сайзинг Келлі, логіка виходу, трейлінг-стопи — живиться цією оцінкою ймовірності.
Сьогодні ми поєднуємо GFS, ECMWF, UKMO та NWS, баєсівськи змішуємо їх із історичною кліматологією NCEI і застосовуємо нормальну CDF над розподілом помилки прогнозу, щоб отримати ймовірність. Це працює. Але фундаментально обмежено точністю базових моделей.
Заміна цієї оцінки ймовірності на WeatherNext 2 як основний сигнал має дуже конкретні ефекти:
- Чіткіше виявлення переваги. Поліпшення прогнозного RMSE на півградуса безпосередньо перетворюється на 1-3% більше виявлюваного edge на прикордонних ринках, які наразі відфільтровуються нашим порогом 2%. Більше сигналів досягає Claude.
- Краще калібрування. Коли ми кажемо «78% імовірність YES», це має дійсно сходитися до 78% на великій вибірці. Нативний імовірнісний вивід WeatherNext 2 калібрований значно краще, ніж усе, що ми можемо синтезувати з детермінованих моделей.
- Менше катастрофічних хвостових угод. Сильніша робота моделі на рідкісних подіях означає, що ми рідше неправильно оцінюємо fat tails — історично нашу найбільшу категорію несподіваних збитків.
- Швидший цикл роботи моделі. Наш поточний цикл отримання прогнозів обмежений затримкою безкоштовних погодних API з лімітами на частоту запитів. Запуск WeatherNext 2 через Vertex AI Google Cloud означає, що ми можемо оновлювати прогнози за власним графіком, а не їхнім.
Чому це складна задача
Ми хочемо бути відвертими: це найскладніша інженерна робота, за яку ми взялися з часів міграції інфраструктури v2. "Підключити нову модель" ніколи не буває так просто, як звучить, а у WeatherNext 2 зокрема є низка гострих кутів.
engine/edge.js і повторно налаштувати кожен поріг, який використовує Claude.Очікуване підвищення точності
На основі опублікованих бенчмарків DeepMind та нашого власного внутрішнього моделювання того, як помилка прогнозу поширюється через наш калькулятор edge, ось куди ми очікуємо рух продуктивності WeatherBot після інтеграції:
Доступ: за обсягом для лояльних користувачів
Маємо бути чесними щодо економіки. Інференс WeatherNext 2 через Vertex AI не безкоштовний, а робота над інфраструктурою — значні інженерні інвестиції. Ми не можемо дати це всім з першого дня — і, чесно кажучи, не хочемо. Користувачі, які насправді створили WeatherBot таким, який він є сьогодні, мають отримати його першими.
Коли вийде WeatherNext 2, доступ буде обмежено обсягом торгів на платформі. Ваш сукупний торговий обсяг — кожен долар USDC, який ви розгорнули через WeatherBot на ринках Polymarket — стає валютою, яка розблоковує оновлений двигун. Чим більше ви торгували, тим раніше та глибше ваш доступ.
Як працюватимуть рівні обсягу
Остаточні пороги рівнів буде оголошено ближче до запуску, але структура вже зафіксована:
- Tier 1 — засновники: група з найвищим сукупним обсягом отримує першу хвилю доступу до WeatherNext 2 під час закритої альфи. Повний вихід ансамблю, найвища частота оновлення, прямий канал зворотного зв'язку з інженерною командою.
- Tier 2 — досвідчені користувачі: друга хвиля під час бети. Повний сигнал WeatherNext 2 із дещо зниженою частотою оновлення.
- Tier 3 — активні трейдери: загальне розгортання з WeatherNext 2 як доповненням до наявного стеку GFS/ECMWF/UKMO/NWS.
- Нижче порогу: продовжується на поточному мультимодельному стеку, який залишається повністю підтримуваним і сам незалежно покращується.
Ваш торговий обсяг відстежується автоматично — кожна угода, яку бот здійснює від вашого імені, рахується. Вам не потрібно робити нічого особливого. Чим більше ви використовуєте платформу, тим вищий ваш рівень.
Коротке зауваження про справедливість: рівні обсягу обчислюються з вашої торгової активності на платформі, а не з розміру гаманця. Користувач з меншим банкроллом, але дозволяє боту торгувати послідовно, підніметься рівнями швидше, ніж той, хто покладе великий баланс і залишить його без діла. Це навмисно — ми хочемо винагороджувати тих, хто справді використовує WeatherBot так, як він задуманий.
Графік
Жодних обіцянок щодо точних дат — це серйозна інженерна робота, і ми не збираємося поспішати з нею у продакшен. Але ось чесна дорожня карта:
- Зараз: Обліковий запис Google Cloud підготовлено, запитано ранній доступ до Vertex AI, прототип shadow-mode будується на історичних даних.
- Найближчі тижні: Рефакторинг edge-двигуна для роботи з імовірнісними ансамблями. Паралельне логування поряд із поточним двигуном.
- Наступні тижні: Shadow run у продакшені — прогнози WeatherNext 2 логуються для кожного ринку, порівнюються з фактичними розв'язаннями, звіти про калібрування публікуються тут.
- Після проходження бенчмарків: Закрита альфа для користувачів Tier 1. Цикл зворотного зв'язку з інженерною командою. Фінальне налаштування.
- Після альфи: Поетапне розгортання через Tier 2, потім Tier 3.
Що ви можете зробити просто зараз
Ваш обсяг торгів починає враховуватися сьогодні. Кожна угода, яку WeatherBot укладе від вашого імені з цього моменту, зараховується до вашого рівня WeatherNext 2 на запуску. Переконайтеся, що ваш бот запущений, банкролл налаштований, а гаманець підключений. Точні пороги обсягу опублікуємо в найближчі тижні — але користувачі, які рано піднімуться в рейтингу, перші перейдуть на оновлений двигун.