WeatherNext 2: Google DeepMind의 AI 모델이 WeatherBot에 옵니다
WeatherBot 역사상 최대의 예보 정확도 업그레이드를 시작합니다: Google DeepMind의 WeatherNext 2 통합 직접 거래 엔진으로. 우리가 이것을 해낸다면, 봇이 감지하는 모든 엣지의 품질을 근본적으로 변경하고 — 따라서 그것이 놓는 모든 거래의 예상 결과를 변경할 것입니다.
이 글은 WeatherNext 2가 왜 중요한지, 오늘날 의존하는 전통적 NOAA GFS 모델과 어떻게 비교되는지, 이 통합이 실제로 얼마나 어려운지, 그리고 출시 후 플랫폼 거래량에 따라 접근이 어떻게 게이팅될지를 설명합니다.
WeatherNext 2란?
WeatherNext 2는 Google DeepMind이 출시한 가장 진보된 예보 모델입니다. 2025년 말 공개되어 이미 Google Search, Gemini, Pixel Weather, Google Maps를 구동하고 있으며, 지구 규모 날씨 예측의 세대적 도약을 의미합니다.
대기를 지배하는 물리 방정식을 푸는 방식 — NOAA GFS, ECMWF 모델, 그리고 모든 전통 시스템이 수십 년간 사용한 접근 — 대신, WeatherNext 2는 수십 년의 과거 데이터로부터 대기 거동을 직접 학습합니다. 다음이라 불리는 완전히 새로운 아키텍처 위에 만들어졌습니다 함수형 생성 네트워크(FGN), 모델에 직접 제어된 노이즈를 주입하여 생성되는 모든 예보가 물리적으로 일관되고 변수 전반에 걸쳐 내부적으로 일관되게 유지됩니다.
8배 빠른 생성
전체 앙상블 예보는 단일 TPU에서 1분 이내에 완료됩니다. 물리 기반 모델은 동일한 결과를 내기 위해 슈퍼컴퓨터에서 몇 시간이 걸립니다.
변수의 99.9% 개선
이전 최고 성능을 변수의 99.9%(기온, 풍속, 습도, 기압, 강수)와 0~15일 모든 리드 타임에서 능가합니다.
1시간 해상도
하루 4번 갱신되는 시간별 예측 — 우리가 거래하는 기간에서 GFS의 자체 3~6시간 해상도보다 훨씬 정밀합니다.
수백 가지 시나리오
1분 이내에 수백 가지 가능한 미래의 확률적 앙상블을 생성하여, 단일 결정론적 추정이 아닌 진짜 분포를 제공합니다.
왜 NOAA GFS보다 정확한가
NOAA의 Global Forecast System은 경이로운 엔지니어링이지만, 딥러닝 이전의 시대에 설계되었고 물리 기반 모델링의 한계는 오랫동안 분명했습니다. ECMWF가 역사적으로 GFS를 약 하루 분량의 예보 능력만큼 능가해온 이유, 그리고 거의 모든 주요 기상 사업자가 조용히 전통 스택 위에 AI를 얹기 시작한 이유에는 그만한 까닭이 있습니다.
WeatherNext 2가 GFS를 앞서는 지점은 바로 Polymarket 날씨 계약을 움직이는 단기-중기 기온 예보에서 입니다:
- 학습된 대기 패턴 vs. 풀어낸 방정식 — GFS는 대기를 격자에 이산화하고 매 시간 단계마다 Navier-Stokes를 풀어 근사합니다. 이러한 근사값은 시간이 지남에 따라 누적됩니다. WeatherNext 2는 ERA5 재해석 데이터에서 대기의 전체 비선형 거동을 학습했으므로 같은 종류의 수치 오차를 누적하지 않습니다.
- 네이티브 확률 출력 — GFS는 실행당 한 가지 예보를 제공합니다. 분포를 얻으려면 GEFS(앙상블)가 필요한데, 이는 비용과 지연을 추가합니다. WeatherNext 2는 전체 분포를 네이티브로 출력하므로, 도시가 14°C에 도달할 실제 확률을 볼 수 있습니다 — 우리가 직접 베이지안으로 감싸야 하는 점 추정값이 아니라.
- 더 높은 유효 해상도 — WeatherNext 2는 시간별 글로벌 예보를 생성합니다. GFS는 13km 수평 해상도와 3시간 출력으로 우리의 거래 범위에서 운영됩니다. 도시별 일일 최대 및 일일 최소 계약의 경우 그 추가 시간 세분성은 진정한 엣지입니다.
- 테일(극단값)에서 더 우수 — DeepMind의 벤치마크는 저확률, 고임팩트 이벤트(한파, 열돔, 폭풍)에서 가장 큰 이득을 보여줍니다. 이것이 바로 잘못 가격이 매겨진 꼬리가 존재하고 우리의 가장 큰 거래가 나오는 시장입니다.
- 물리적으로 일관된 앙상블 — FGN 아키텍처는 앙상블의 각 시나리오가 내부적으로 일관성이 있음을 의미합니다(바람이 강한 시나리오에는 일치하는 기압 경사도도 있습니다). 이것이 가격 책정에 확률을 사용할 수 있게 만드는 것입니다.
Polymarket 날씨 시장의 대부분을 차지하는 0~3일 시야에서, 독립 평가는 최신 AI 모델을 ECMWF의 대표 IFS와 동급 — 또는 종종 그 위 — 에 두며, IFS 자체도 GFS보다 의미 있게 앞섭니다. 개략적으로: 48시간 시점 일 최고기온의 RMSE에서 수십분의 1도, 그리고 희귀 이벤트에서 눈에 띄게 더 좁은 보정.
이것이 거래 결과를 바꾸는 이유
WeatherBot의 모든 엣지는 단 하나의 기계적 단계에서 옵니다: 온도 구간의 진짜 확률을 Polymarket 시장이 매기는 가격보다 더 정확히 추정하는 것. 하위의 모든 것 — Claude의 YES/NO 결정, Kelly 사이징, 청산 로직, 트레일링 스톱 — 이 모두가 그 확률 추정값을 토대로 작동합니다.
오늘 우리는 GFS, ECMWF, UKMO, NWS를 앙상블하고, NCEI 과거 기후학과 베이지안 방식으로 혼합하며, 예보 오차 분포에 정규 CDF를 적용하여 확률을 얻습니다. 작동합니다. 하지만 본질적으로 기반 모델의 정확도에 의해 상한이 정해집니다.
이 확률 추정값을 WeatherNext 2를 주된 신호로 대체하면 매우 구체적인 효과가 있습니다:
- 더 선명한 엣지 감지. 예보 RMSE의 0.5도 개선은 현재 2% 임계값에 의해 필터링되는 경계선 시장에서 1-3% 더 많은 감지 가능한 엣지로 직접 변환됩니다. 더 많은 신호가 Claude에 도달합니다.
- 더 나은 보정. "YES 78% 확률"이라고 말할 때, 큰 표본에서 실제로 78%로 결제되어야 합니다. WeatherNext 2의 네이티브 확률 출력은 결정론적 모델에서 합성할 수 있는 어떤 것보다도 실질적으로 더 잘 보정되어 있습니다.
- 극단값에서 발생하는 치명적 거래 감소. 희귀 이벤트에서의 더 강한 모델 성능은 우리가 두꺼운 꼬리를 잘못 가격 매기는 빈도가 줄어든다는 뜻입니다 — 역사적으로 우리의 가장 큰 예상치 못한 손실 카테고리.
- 모델 회전 속도 향상. 우리의 현재 예보 페치 사이클은 레이트 제한이 있는 무료 날씨 API에 의해 지연이 묶입니다. WeatherNext 2를 Google Cloud의 Vertex AI를 통해 실행하면 그들의 일정이 아니라 우리 자체 일정으로 예보를 갱신할 수 있습니다.
이것이 어려운 문제인 이유
솔직히 말씀드리겠습니다: 이것은 v2의 인프라 마이그레이션 이후 우리가 맡은 가장 어려운 엔지니어링 작업입니다. "새 모델을 연결한다"는 것은 들리는 것만큼 결코 간단하지 않으며, 특히 WeatherNext 2에는 여러 날카로운 가장자리가 있습니다.
engine/edge.js 그리고 Claude가 사용하는 모든 임계값을 다시 조정해야 합니다.예상 정확도 개선
DeepMind이 발표한 벤치마크와 예보 오류가 우리의 엣지 계산기를 통해 어떻게 전파되는지에 대한 자체 내부 모델링을 기반으로, 통합이 도착하면 WeatherBot의 성능이 어디로 이동할 것으로 예상되는지는 다음과 같습니다:
접근: 충성도 높은 사용자에게 볼륨 기준으로 제공
여기서 경제에 대해 솔직해야 합니다. Vertex AI를 통한 WeatherNext 2 추론은 무료가 아니며, 인프라 작업은 상당한 엔지니어링 투자를 의미합니다. 첫날부터 모든 사람에게 제공할 수는 없으며 — 솔직히 그러고 싶지도 않습니다. 오늘날의 WeatherBot을 실제로 만들어낸 사용자들이 먼저 받아야 합니다.
WeatherNext 2가 출시되면 접근 권한은 다음과 같습니다: 플랫폼 거래량에 따라 제한됨. 누적 거래량 — WeatherBot을 통해 Polymarket 시장에 배치한 모든 USDC 달러 — 는 업그레이드된 엔진을 잠금 해제하는 통화가 됩니다. 더 많이 거래할수록 더 일찍, 더 깊이 액세스할 수 있습니다.
볼륨 티어 작동 방식
최종 티어 임계값은 출시 시점이 가까워지면 발표되지만, 구조는 이미 확정되었습니다:
- Tier 1 — 창립 멤버: 누적 거래량이 가장 높은 그룹이 비공개 알파 동안 WeatherNext 2 액세스의 첫 번째 물결을 받습니다. 전체 앙상블 출력, 가장 높은 갱신 빈도, 엔지니어링 팀에 대한 직접 피드백 채널.
- Tier 2 — 파워 유저: 베타 기간 중 2차 웨이브. WeatherNext 2 풀 시그널, 새로고침 주기는 약간 낮음.
- Tier 3 — 활성 트레이더: 기존 GFS/ECMWF/UKMO/NWS 스택을 보완하는 WeatherNext 2의 일반 출시.
- 임계값 미만: 현재의 멀티 모델 스택에서 계속되며, 이는 완전히 지원되고 독립적으로 개선되고 있습니다.
거래량은 자동으로 추적됩니다 — 봇이 사용자를 대신해 놓는 모든 거래가 카운트됩니다. 특별한 작업을 할 필요가 없습니다. 플랫폼을 더 많이 사용할수록 등급이 높아집니다.
공정성에 대한 간단한 메모: 볼륨 티어는 지갑 크기가 아니라 플랫폼에서의 거래 활동을 기반으로 계산됩니다. 더 작은 뱅크롤이라도 봇이 꾸준히 거래하도록 두는 사용자는 큰 잔액을 입금하고 방치하는 사람보다 더 빠르게 티어를 올라갑니다. 의도된 설계입니다 — 우리는 WeatherBot을 설계대로 실제로 사용하는 사람들에게 보상하려 합니다.
타임라인
정확한 날짜에 대한 약속은 없습니다 — 이것은 진지한 엔지니어링이며, 우리는 그것을 프로덕션에 서둘러 투입하지 않을 것입니다. 그러나 여기 정직한 로드맵이 있습니다:
- 현재: Google Cloud 계정 프로비저닝, Vertex AI 조기 액세스 요청, 과거 데이터에 대해 섀도우 모드 프로토타입 구축 중.
- 앞으로 몇 주: 확률적 앙상블을 처리하도록 엣지 엔진 리팩토링. 현재 엔진과 병렬로 로깅.
- 이후 몇 주: 프로덕션에서의 섀도우 런 — 모든 시장에 대한 WeatherNext 2 예측이 기록되고, 실제 해결과 비교되며, 보정 보고서가 여기에 게시됩니다.
- 벤치마크를 통과한 후: Tier 1 사용자 대상 클로즈드 알파. 엔지니어링 팀과의 피드백 루프. 최종 튜닝.
- 알파 이후: Tier 2를 거쳐 Tier 3로 단계적 배포.
지금 할 수 있는 일
여러분의 거래량이 카운트되기 시작합니다 오늘. 지금 이 순간부터 WeatherBot이 당신을 대신해 수행하는 모든 거래는 출시 시 WeatherNext 2 티어에 반영됩니다. 봇이 실행 중이고, 뱅크롤이 구성되어 있으며, 지갑이 연결되어 있는지 확인하세요. 정확한 거래량 임계값은 향후 몇 주 내에 발표할 예정이지만, 일찍 리더보드에 오르는 사용자가 업그레이드된 엔진에 가장 먼저 들어가게 됩니다.