ホーム リーダーボード ダッシュボード

WeatherNext 2:Google DeepMind の AI モデルが WeatherBot に登場

WeatherBot 史上最大の予測精度アップグレードに取りかかります: Google DeepMind の WeatherNext 2 を統合 直接トレーディングエンジンへ。これを成功させれば、ボットが検出するすべてのエッジの品質が根本的に変わり、それゆえ配置するすべての取引の期待される結果も変わるでしょう。

この投稿では、WeatherNext 2 がなぜ重要なのか、現在依存している従来の NOAA GFS モデルとの比較、この統合がどれほど難しいか、そして稼働後はプラットフォーム上の取引量によってアクセスが段階的に開放される仕組みについて説明します。

WeatherNext 2 とは?

WeatherNext 2 は、Google DeepMind がこれまでに公開した最先端の予測モデルです。2025 年末に発表され、既に Google Search、Gemini、Pixel Weather、Google Maps を支えており、地球規模の天気予測における世代を超えた飛躍を示しています。

大気を支配する物理方程式を解く — NOAA GFS、ECMWF モデル、すべての従来システムが数十年使ってきたアプローチ — の代わりに、WeatherNext 2 は数十年分の歴史データから大気の挙動を直接学習します。以下と呼ばれる全く新しいアーキテクチャ上に構築されています 関数生成ネットワーク(FGN)、これは制御されたノイズをモデルに直接注入するので、生成されるすべての予報は物理的に一貫性を保ち、変数間で内部的にも一貫性を保ちます。

8 倍速い生成

完全なアンサンブル予測は単一の TPU で 1 分未満で完了します。物理ベースのモデルでは、同じ出力を得るのにスーパーコンピューター上で何時間もかかります。

99.9% の変数で改善

以前の最先端技術を 99.9% の変数(気温、風、湿度、気圧、降水)と 0〜15 日のすべてのリードタイムで上回ります。

1 時間ごとの解像度

1 日 4 回更新される時間単位の予測 — 当社が取引するホライズンにおいて、GFS のネイティブ 3〜6 時間解像度より遥かに精細です。

何百ものシナリオ

1 分以内に数百のもっともらしい未来からなる確率的アンサンブルを生成し、単一の決定論的な推測ではなく、真の分布を得られます。

なぜ NOAA GFS より正確なのか

NOAA の Global Forecast System は驚異的なエンジニアリングですが、ディープラーニング以前の時代に設計されており、物理ベースのモデリングの限界は何年も前から明らかです。ECMWF が歴史的に GFS をおよそ 1 日分の予測スキルで上回ってきた理由と、ほぼすべての主要気象プロバイダーが従来のスタックの上に AI を静かに重ね始めた理由には、それなりの根拠があります。

WeatherNext 2 が GFS を引き離すのは、Polymarket の天気契約を動かすような短期〜中期の気温予測においてです:

  • 学習された大気パターン vs. 方程式の解 — GFS は大気をグリッドに離散化し、各タイムステップで Navier-Stokes 方程式を解いて近似します。これらの近似は時間とともに累積します。WeatherNext 2 は ERA5 再解析データから大気の完全な非線形挙動を学習しているため、同じ種類の数値誤差を蓄積しません。
  • ネイティブな確率的出力 — GFS は実行ごとに 1 つの予測を返します。分布を得るには GEFS(アンサンブル)が必要で、これはコストとレイテンシを増やします。WeatherNext 2 はネイティブに完全な分布を出力するので、都市が 14°C に達する実際の確率が見えます — ベイズで自分たちで包む必要のある点推定ではなく。
  • より高い実効解像度 — WeatherNext 2は1時間ごとのグローバル予報を生成します。GFSは13kmの水平分解能で運用され、当社の取引範囲では3時間出力を提供します。都市別の日次最高および日次最低契約では、その追加の時間的細分性は真のエッジです。
  • テール(極端値)でより優れている — DeepMindのベンチマークは、低確率・高インパクトのイベント、つまり寒波、ヒートドーム、嵐において最大の利益を示しています。これらはまさに、ミスプライスされたテールが存在し、当社の最大の取引が生まれる市場です。
  • 物理的に整合性のあるアンサンブル — FGNアーキテクチャは、アンサンブル内の各シナリオが内部的に一貫していることを意味します(風の強いシナリオには、対応する気圧勾配もあります)。これが、価格設定に使用可能な確率を生み出すものです。

Polymarket の天気市場の大部分を占める 0〜3 日のホライズンでは、独立した評価により、最新の AI モデルは ECMWF の旗艦 IFS と同等 — しばしばそれ以上 — のレベルに位置づけられ、IFS 自身も GFS をかなり上回っています。大まかな目安:48 時間時点の日最高気温で数十分の 1 度の RMSE 改善、そしてレアイベントでの目に見えてタイトなキャリブレーション。

なぜこれが取引結果を変えるのか

WeatherBot のエッジはすべて、一つの機械的なステップから来ています:温度バケットの真の確率を Polymarket 市場の価格付けよりも正確に推定すること。下流のすべて — Claude の YES/NO 判断、Kelly サイジング、エグジットロジック、トレーリングストップ — はすべてその確率推定を頼っています。

現在は GFS、ECMWF、UKMO、NWS をアンサンブルし、NCEI の歴史的気候値とベイズ式に混合し、予測誤差分布に正規 CDF を適用して確率を得ます。機能します。しかし、根本的には基礎モデルの精度によって上限が決まります。

その確率推定を WeatherNext 2 を主シグナルに置き換えることには、極めて具体的な効果があります:

  • よりシャープなエッジ検出。 予報RMSEの0.5度の改善は、現在2%のしきい値でフィルタリングされているボーダーラインの市場で検出可能なエッジが1〜3%増えることに直接つながります。より多くのシグナルがClaudeに届きます。
  • より優れたキャリブレーション。 私たちが「YES の確率 78%」と言うとき、それは大きなサンプルで実際に 78% で決済される必要があります。WeatherNext 2 のネイティブな確率的出力は、決定論的モデルから合成できるどんなものより明確に良くキャリブレーションされています。
  • テールリスクによる壊滅的取引が減少。 レアイベントでのモデル性能向上は、ファットテールのミスプライシングが減ることを意味します — 歴史的に当社で最も大きな予期しない損失のカテゴリです。
  • モデルのターンアラウンドが高速化。 現在の予測取得サイクルは、レート制限のある無料天気 API のレイテンシに縛られています。WeatherNext 2 を Google Cloud の Vertex AI 経由で動かすと、予測を彼らのではなく自分たちのスケジュールで更新できます。

なぜこれは難しい問題なのか

率直に言いたいと思います:これはv2のインフラストラクチャ移行以来、私たちが取り組んだ中で最も困難なエンジニアリング作業です。「新しいモデルを接続する」というのは聞こえほど単純ではなく、特にWeatherNext 2には鋭いエッジがいくつかあります。

1
データアクセスと配管
WeatherNext 2 の予測は Earth Engine、BigQuery、Vertex AI 経由で提供されます。どれも現在の無料 HTTP エンドポイントの差し込み代替にはなりません。認証、クォータ管理、コスト制御、そして 97 以上のアクティブな都市/日付の組み合わせ全体に有償推論呼び出しを償却するキャッシュ層が必要です。
2
確率的出力の統合
当社のエッジ計算機は、単一の決定論的なポイント予測とガウス誤差モデルを中心に設計されました。WeatherNext 2 は都市ごとに数百シナリオの完全なアンサンブルを提供します。エッジエンジンを偽の分布ではなく真の経験分布を扱うように再配線するには、コアの書き換えが必要です: engine/edge.js そして Claude が使用するすべてのしきい値を再調整します。
3
都市ポイントへのグリッド補間
WeatherNext 2 はグローバルグリッドを出力します。Polymarket の天気契約は特定の指定気象観測ステーション(例:NYC は LaGuardia、ロンドンは Heathrow)で決済されます。モデルのネイティブグリッドから正確な決済ステーションへの、正確なバイリニアまたは最近接ステーション補間が必要です — そして該当する場合は局所的なマイクロクライメート効果のためのダウンスケーリング。
4
予測ごとのコスト
私たちが監視する都市/日付のすべての組み合わせが、有償の Vertex AI 推論コールになります。およそ 97 のユニークな組み合わせで約 1,975 のアクティブな天気市場がある中、ナイーブな実装はすぐに予算を使い果たします。段階的なリフレッシュ戦略を構築しています:高確信の市場には頻繁な更新を、出来高の少ない都市には遅いサイクルを。
5
後方互換性
GFS/ECMWF/UKMO/NWS を取り外すわけではありません。最終アーキテクチャでは WeatherNext 2 を主シグナルとし、従来モデルを健全性チェックとして使います。WeatherNext 2 が物理モデルと大きく食い違う場合、その不一致自体が Claude が推論できる特徴量になります — どちらかを盲信する理由ではありません。
6
アウトオブサンプル検証
切り替える前に、WeatherNext 2 をライブのボットに対して数週間シャドーランで動かす必要があります — 各市場で何を予測したかを記録し、実際に決済された結果と比較します。ERA5 再解析でベンチマークが見事なモデルでも、実際のお金が動いている本番取引ループに入る価値があることを証明しなければなりません。

期待される精度向上

DeepMindの公開ベンチマークと、予報誤差が当社のエッジ計算機を通じてどのように伝播するかに関する独自の内部モデリングに基づいて、統合が着地したときにWeatherBotのパフォーマンスがどこに進むと予想されるかを以下に示します:

気温の RMSE(48 時間先)
−28%
2日マークでの予報誤差の予想される削減 — 私たちの取引の大部分が決済される地平線。
確率キャリブレーション(Brier スコア)
+18%
より良くキャリブレーションされた確率は、Claudeの信頼度レベルが実際に現実と一致することを意味し、ケリーサイジングを直接改善します。
テールイベントの精度(極端な寒さ/暑さ)
+40%
最大の利益は稀なイベント上にあります — まさに市場が最も価格を間違える場所であり、私たちの最大の勝利が存在する場所です。
1 スキャンあたりの検出可能 edge
+35%
より鋭い予報は、より多くの市場を2%のエッジしきい値を超えるよう押し上げ、Claudeにより多くの高品質シグナルを評価させます。

アクセス:忠実なユーザー向けのボリュームゲート制

ここでは経済について率直に述べる必要があります。Vertex AI 経由の WeatherNext 2 推論は無料ではなく、インフラ作業は大きなエンジニアリング投資を意味します。初日から全員に提供することはできません — そして率直に言って、そうしたくありません。WeatherBot を今の形に育ててきたユーザーが、最初に得るべきです。

WeatherNext 2 のローンチ時、アクセスは次のとおりになります: プラットフォーム上の取引高によって制限。累積取引高 — WeatherBotを通じてPolymarket市場に投入したすべてのUSDCドル — がアップグレードされたエンジンを解放する通貨になります。取引量が多いほど、より早くより深いアクセスが可能です。

ボリュームティアの仕組み

最終的なティアのしきい値はローンチ間近に発表されますが、構造はすでに確定しています:

  • Tier 1 — ファウンダー: 累積取引量が最も高いグループが、クローズドアルファ中にWeatherNext 2アクセスの最初の波を受けます。完全なアンサンブル出力、最高のリフレッシュ頻度、エンジニアリングチームへの直接フィードバックチャネル。
  • Tier 2 — パワーユーザー: ベータ期間中の第 2 波。WeatherNext 2 のフルシグナル、更新頻度はわずかに低下。
  • Tier 3 — アクティブトレーダー: 既存の GFS/ECMWF/UKMO/NWS スタックを補完する WeatherNext 2 の一般展開。
  • しきい値未満: 現在のマルチモデルスタックで継続し、完全にサポートされ続け、それ自体が独立して改善されています。

あなたの取引量は自動的に追跡されます — ボットがあなたに代わって行うすべての取引がカウントされます。特別なことをする必要はありません。プラットフォームを使えば使うほど、あなたのティアが高くなります。

公平性についての注意点:ボリュームティアは、ウォレットのサイズではなく、プラットフォーム上のトレーディング活動から計算されます。小さなバンクロールでもボットに継続的に取引させているユーザーは、大きな残高を入金して放置しているユーザーよりも速くティアを上がります。これは意図的なものです — 設計通りに WeatherBot を実際に使っている人々に報いたいのです。

タイムライン

正確な日付については約束しません — これは真剣なエンジニアリングであり、本番環境に急いで投入することはありません。しかし、これが正直なロードマップです:

  • 現在: Google Cloudアカウントをプロビジョニング、Vertex AIの早期アクセスを要求、ヒストリカルデータに対してシャドウモードのプロトタイプを構築中。
  • 今後数週間: 確率的アンサンブルを処理できるよう edge エンジンをリファクタリング。現行エンジンと並行してログ記録。
  • その後の数週間: 本番環境でのシャドウラン — すべての市場でWeatherNext 2の予測を記録し、実際の決済と比較し、キャリブレーションレポートをここに公開します。
  • ベンチマークをクリアしたら: Tier 1 ユーザー向けのクローズドアルファ。エンジニアリングチームとのフィードバックループ。最終調整。
  • アルファ後: Tier 2、続いて Tier 3 への段階的ロールアウト。

今すぐできること

あなたの取引高がカウントされ始めます 本日。今この瞬間から WeatherBot があなたに代わって行うすべての取引が、ローンチ時の WeatherNext 2 ティアに加算されます。ボットが稼働中で、バンクロールが設定されており、ウォレットが接続されていることを確認してください。正確な出来高のしきい値は今後数週間で公開しますが、リーダーボードを早期に登っていくユーザーが、アップグレードされたエンジンに最初に入る人たちになります。

Read next

We Are Thrilled to Announce Two Brand-New Games: Storm Spin and Storm Bet

Read article →

Hong Kong Trades Are Now More Accurate Than Ever: We Plugged the Engine Straight Into the Source That Settles the Market

Read article →

WeatherBot by the Numbers: 9,592 Traders, $2.87M in Member Profit, and Exactly What It Costs to Run

Read article →
← All articles