WeatherNext 2: ИИ-модель Google DeepMind приходит в WeatherBot
Мы начинаем работу над крупнейшим обновлением точности прогноза в истории WeatherBot: интеграция WeatherNext 2 от Google DeepMind напрямую в торговый движок. Если нам это удастся, это фундаментально изменит качество каждого edge, который обнаруживает наш бот — и, следовательно, ожидаемый результат каждой сделки, которую он совершает.
Этот пост объясняет, почему WeatherNext 2 важен, как он сравнивается с традиционной моделью NOAA GFS, на которую мы полагаемся сегодня, насколько сложна эта интеграция и как доступ будет распределяться по объёму торгов на платформе после запуска.
Что такое WeatherNext 2?
WeatherNext 2 — самая продвинутая прогностическая модель, выпущенная Google DeepMind. Представленная в конце 2025 года и уже работающая в Google Search, Gemini, Pixel Weather и Google Maps, она представляет собой поколенческий скачок в глобальном прогнозировании погоды.
Вместо решения физических уравнений, описывающих атмосферу — подход, который NOAA GFS, модель ECMWF и все традиционные системы использовали десятилетиями — WeatherNext 2 учит поведение атмосферы непосредственно на десятилетиях исторических данных. Он построен на совершенно новой архитектуре под названием Функциональная генеративная сеть (FGN), который вводит контролируемый шум непосредственно в модель, так что каждый создаваемый прогноз остаётся физически согласованным и внутренне когерентным по переменным.
8× быстрее генерация
Полный ансамблевый прогноз занимает менее минуты на одном TPU. Физическим моделям нужны часы на суперкомпьютере для того же результата.
99,9 % переменных улучшены
Превосходит предыдущий state-of-the-art по 99,9 % переменных (температура, ветер, влажность, давление, осадки) и на всех сроках от 0 до 15 дней.
1-часовое разрешение
Почасовые прогнозы обновляются четыре раза в день — значительно точнее, чем нативные 3–6 часов у GFS для тех горизонтов, на которых мы торгуем.
Сотни сценариев
Менее чем за минуту генерирует вероятностный ансамбль из сотен правдоподобных вариантов будущего, давая нам настоящее распределение — а не единственное детерминированное предположение.
Почему он точнее, чем NOAA GFS
Global Forecast System NOAA — феноменальная инженерия, но был разработан до эпохи глубокого обучения, и пределы моделей на основе физики очевидны уже много лет. Есть причина, по которой ECMWF исторически опережает GFS примерно на полный день прогнозного навыка, и почему почти каждый крупный поставщик погоды тихо начал накладывать ИИ поверх своего традиционного стека.
Вот где WeatherNext 2 опережает GFS — именно в тех краткосрочных и среднесрочных прогнозах температуры, которые движут погодными контрактами Polymarket:
- Изученные атмосферные паттерны vs. решённые уравнения — GFS аппроксимирует атмосферу, дискретизируя её в сетку и решая Навье-Стокса на каждом временном шаге. Эти приближения накапливаются со временем. WeatherNext 2 выучил полное нелинейное поведение атмосферы из данных реанализа ERA5, поэтому не накапливает тот же класс численной ошибки.
- Нативный вероятностный вывод — GFS даёт один прогноз за прогон. Чтобы получить распределение, нужен GEFS (ансамбль), что добавляет стоимость и задержку. WeatherNext 2 нативно выдаёт полное распределение, и мы видим реальную вероятность того, что город достигнет 14°C, а не просто точечную оценку, которую нам приходится оборачивать байесовски самим.
- Более высокое эффективное разрешение — WeatherNext 2 создаёт почасовые глобальные прогнозы. GFS работает с горизонтальным разрешением 13 км и 3-часовым выводом для нашего торгового диапазона. Для контрактов на дневной максимум и дневной минимум по конкретным городам эта дополнительная временная детализация — настоящее преимущество.
- Лучше на хвостах — бенчмарки DeepMind показывают наибольшие выигрыши на событиях с низкой вероятностью и высоким воздействием: похолоданиях, тепловых куполах, штормах. Это именно те рынки, где живут неверно оценённые хвосты и откуда приходят наши крупнейшие сделки.
- Физически когерентные ансамбли — архитектура FGN означает, что каждый сценарий в ансамбле внутренне согласован (ветреный сценарий также имеет соответствующий градиент давления). Именно это делает вероятности пригодными для ценообразования.
Для горизонтов 0-3 дня, составляющих основную часть погодных рынков Polymarket, независимые оценки ставят современные ИИ-модели на тот же уровень — и часто впереди — флагманского IFS от ECMWF, который сам существенно впереди GFS. Приблизительно: несколько десятых градуса RMSE по дневному максимуму температуры на отметке 48 часов и заметно более точная калибровка на редких событиях.
Почему это меняет результат сделок
Весь перевес WeatherBot берётся из одного механического шага: оценить истинную вероятность температурного диапазона точнее, чем рынок Polymarket её закладывает. Всё, что идёт ниже — решение Claude YES/NO, сайзинг Келли, логика выхода, трейлинг-стопы — кормится этой оценкой вероятности.
Сегодня мы объединяем GFS, ECMWF, UKMO и NWS, байесовски смешиваем их с исторической климатологией NCEI и применяем нормальную CDF к распределению ошибки прогноза, чтобы получить вероятность. Это работает. Но фундаментально ограничено точностью базовых моделей.
Замена этой оценки вероятности на WeatherNext 2 в качестве основного сигнала даёт очень конкретные эффекты:
- Более чёткое обнаружение перевеса. Полградуса улучшения RMSE прогноза напрямую переводится в 1-3% больше обнаруживаемого edge на пограничных рынках, которые сейчас отфильтровываются нашим порогом 2%. Больше сигналов достигает Claude.
- Лучшая калибровка. Когда мы говорим «78 % вероятность YES», это должно действительно сходиться к 78 % на большой выборке. Нативный вероятностный вывод WeatherNext 2 откалиброван заметно лучше, чем всё, что мы можем синтезировать из детерминированных моделей.
- Меньше катастрофических хвостовых сделок. Более сильная работа модели на редких событиях означает, что мы реже неверно оцениваем fat tails — исторически нашу крупнейшую категорию неожиданных убытков.
- Более быстрый цикл работы модели. Наш текущий цикл получения прогнозов ограничен задержкой бесплатных погодных API с лимитами на частоту запросов. Запуск WeatherNext 2 через Vertex AI Google Cloud означает, что мы можем обновлять прогнозы по своему расписанию, а не по их.
Почему это сложная задача
Мы хотим быть откровенными: это самая сложная инженерная работа, за которую мы взялись со времён миграции инфраструктуры v2. "Подключить новую модель" никогда не бывает так просто, как звучит, а у WeatherNext 2, в частности, есть ряд острых углов.
engine/edge.js и заново настроить каждый порог, который использует Claude.Ожидаемый прирост точности
Основываясь на опубликованных бенчмарках DeepMind и нашем собственном внутреннем моделировании того, как ошибка прогноза распространяется через наш калькулятор edge, вот куда мы ожидаем, что производительность WeatherBot сдвинется после интеграции:
Доступ: по объёму для лояльных пользователей
Нужно быть честными насчёт экономики. Инференс WeatherNext 2 через Vertex AI не бесплатный, а работа над инфраструктурой — значительные инженерные инвестиции. Мы не можем дать это всем с первого дня — и, честно говоря, не хотим. Пользователи, которые на самом деле создали WeatherBot таким, какой он есть сегодня, должны получить это первыми.
Когда выйдет WeatherNext 2, доступ будет зависит от объёма торгов на платформе. Ваш совокупный торговый объём — каждый доллар USDC, который вы развернули через WeatherBot на рынках Polymarket — становится валютой, которая разблокирует обновлённый движок. Чем больше вы торговали, тем раньше и глубже ваш доступ.
Как будут работать уровни объёма
Окончательные пороги уровней будут объявлены ближе к запуску, но структура уже зафиксирована:
- Tier 1 — основатели: группа с наивысшим совокупным объёмом получает первую волну доступа к WeatherNext 2 во время закрытой альфы. Полный вывод ансамбля, наивысшая частота обновления, прямой канал обратной связи с инженерной командой.
- Tier 2 — продвинутые пользователи: вторая волна во время беты. Полный сигнал WeatherNext 2 с немного сниженной частотой обновления.
- Tier 3 — активные трейдеры: общий выпуск с WeatherNext 2 как дополнением к существующему стеку GFS/ECMWF/UKMO/NWS.
- Ниже порога: продолжается на текущем мульти-модельном стеке, который остаётся полностью поддерживаемым и улучшается независимо.
Ваш торговый объём отслеживается автоматически — каждая сделка, которую бот совершает от вашего имени, учитывается. Вам не нужно делать ничего особенного. Чем больше вы используете платформу, тем выше ваш уровень.
Краткое замечание о справедливости: уровни объёма рассчитываются из вашей торговой активности на платформе, а не из размера кошелька. Пользователь с меньшим банкроллом, но позволяющий боту торговать последовательно, поднимется по уровням быстрее, чем тот, кто пополнит большой баланс и оставит его без дела. Это сделано намеренно — мы хотим вознаграждать тех, кто действительно использует WeatherBot так, как он задуман.
График
Никаких обещаний по точным датам — это серьёзная инженерная работа, и мы не собираемся торопить её в продакшен. Но вот честная дорожная карта:
- Сейчас: Учётная запись Google Cloud подготовлена, запрошен ранний доступ к Vertex AI, прототип shadow-mode строится на исторических данных.
- Ближайшие недели: Рефакторинг edge-движка для работы с вероятностными ансамблями. Параллельное логирование рядом с текущим движком.
- Следующие недели: Shadow run в продакшене — прогнозы WeatherNext 2 логируются для каждого рынка, сравниваются с фактическими разрешениями, отчёты о калибровке публикуются здесь.
- После прохождения бенчмарков: Закрытая альфа для пользователей Tier 1. Обратная связь с инженерной командой. Финальная настройка.
- После альфы: Поэтапное развёртывание через Tier 2, затем Tier 3.
Что вы можете сделать прямо сейчас
Ваш объём торгов начинает учитываться сегодня. Каждая сделка, которую WeatherBot совершает от вашего имени с этого момента, идёт в зачёт вашего уровня WeatherNext 2 на запуске. Убедитесь, что ваш бот запущен, банкролл настроен, а кошелёк подключён. Точные пороги объёма мы опубликуем в ближайшие недели — но пользователи, которые рано поднимутся в рейтинге, первыми получат улучшенный движок.