Beranda Papan Peringkat Dasbor

WeatherNext 2: Model AI Google DeepMind Hadir di WeatherBot

Kami memulai pekerjaan upgrade akurasi prakiraan terbesar dalam sejarah WeatherBot: mengintegrasikan WeatherNext 2 Google DeepMind langsung ke dalam mesin trading. Jika kami berhasil melakukan ini, itu akan secara fundamental mengubah kualitas setiap edge yang dideteksi bot kami — dan oleh karena itu hasil yang diharapkan dari setiap perdagangan yang ditempatkan.

Pos ini menjelaskan mengapa WeatherNext 2 penting, bagaimana dibandingkan dengan model tradisional NOAA GFS yang kami andalkan hari ini, seberapa sulit integrasi ini sebenarnya, dan bagaimana akses akan dibatasi oleh volume trading di platform setelah aktif.

Apa Itu WeatherNext 2?

WeatherNext 2 adalah model prakiraan paling canggih yang pernah dirilis Google DeepMind. Diperkenalkan pada akhir 2025 dan sudah menjalankan Google Search, Gemini, Pixel Weather, dan Google Maps, ini merupakan lompatan generasi dalam prakiraan cuaca skala global.

Alih-alih memecahkan persamaan fisika yang mengatur atmosfer — pendekatan yang digunakan NOAA GFS, model ECMWF, dan setiap sistem tradisional selama puluhan tahun — WeatherNext 2 belajar perilaku atmosfer langsung dari data historis puluhan tahun. Ini dibangun di atas arsitektur yang sama sekali baru yang disebut Functional Generative Network (FGN), yang menyuntikkan noise terkontrol langsung ke dalam model sehingga setiap prakiraan yang dihasilkannya tetap konsisten secara fisik dan koheren secara internal di seluruh variabel.

Generasi 8× lebih cepat

Prakiraan ensemble lengkap memakan waktu kurang dari satu menit pada satu TPU. Model berbasis fisika butuh berjam-jam di superkomputer untuk hasil yang sama.

99,9% Variabel Ditingkatkan

Mengungguli state-of-the-art sebelumnya pada 99,9% variabel (suhu, angin, kelembaban, tekanan, presipitasi) dan semua lead time dari 0 hingga 15 hari.

Resolusi 1 jam

Prediksi per jam disegarkan empat kali sehari — jauh lebih halus daripada resolusi native 3-6 jam GFS untuk horizon yang kami perdagangkan.

Ratusan Skenario

Menghasilkan ensemble probabilistik berisi ratusan skenario masa depan yang masuk akal dalam kurang dari satu menit, memberi kami distribusi sejati — bukan satu tebakan deterministik.

Mengapa Lebih Akurat dari NOAA GFS

Global Forecast System NOAA adalah karya rekayasa yang luar biasa — tapi dirancang di era sebelum deep learning, dan batas-batas pemodelan berbasis fisika sudah jelas selama bertahun-tahun. Ada alasan mengapa ECMWF secara historis mengungguli GFS dengan sekitar satu hari penuh kemampuan prakiraan, dan mengapa hampir setiap penyedia cuaca besar diam-diam mulai menambahkan AI di atas stack tradisional mereka.

Inilah saat WeatherNext 2 unggul atas GFS, khususnya pada jenis prakiraan suhu jangka pendek hingga menengah yang menggerakkan kontrak cuaca Polymarket:

  • Pola atmosfer yang dipelajari vs. persamaan yang dipecahkan — GFS mendekati atmosfer dengan mendiskritisasinya menjadi grid dan menyelesaikan Navier-Stokes di setiap timestep. Aproksimasi itu menumpuk seiring waktu. WeatherNext 2 mempelajari perilaku non-linier penuh atmosfer dari data reanalisis ERA5, jadi tidak menumpuk kelas error numerik yang sama.
  • Keluaran probabilistik native — GFS memberi Anda satu prakiraan per run. Untuk mendapatkan distribusi Anda butuh GEFS (ensemble), yang menambah biaya dan latensi. WeatherNext 2 mengeluarkan distribusi penuh secara native, jadi kami melihat probabilitas sebenarnya bahwa sebuah kota mencapai 14°C, bukan hanya estimasi titik yang harus kami bungkus secara Bayesian sendiri.
  • Resolusi efektif lebih tinggi — WeatherNext 2 menghasilkan prakiraan global per jam. GFS beroperasi pada resolusi horizontal 13km dengan output 3 jam untuk rentang perdagangan kami. Untuk kontrak harian-maksimum dan harian-minimum khusus kota, granularitas temporal tambahan itu adalah edge yang nyata.
  • Lebih baik di ekor distribusi — benchmark DeepMind menunjukkan keuntungan terbesar pada peristiwa probabilitas rendah, dampak tinggi: cold snap, kubah panas, badai. Ini persis pasar di mana ekor yang salah harga hidup dan dari mana perdagangan terbesar kami berasal.
  • Ensemble yang koheren secara fisika — arsitektur FGN berarti setiap skenario dalam ensemble konsisten secara internal (skenario berangin juga memiliki gradien tekanan yang sesuai). Inilah yang membuat probabilitas dapat digunakan untuk penetapan harga.

Untuk horizon 0-3 hari yang membentuk sebagian besar pasar cuaca Polymarket, evaluasi independen menempatkan model AI modern di tier yang sama — dan sering kali di depan — IFS unggulan ECMWF, yang sendiri sudah jauh di depan GFS. Diterjemahkan kasar: beberapa persepuluhan derajat RMSE pada suhu maksimum harian di angka 48 jam, dan kalibrasi yang terlihat lebih ketat pada event langka.

Mengapa Ini Mengubah Hasil Trade

Seluruh edge WeatherBot berasal dari satu langkah mekanis: memperkirakan probabilitas sebenarnya dari rentang suhu lebih akurat daripada harga pasar Polymarket. Semua yang ada di hilir — keputusan YES/NO Claude, sizing Kelly, logika exit, trailing stop — semuanya bersumber dari estimasi probabilitas itu.

Hari ini kami meng-ensemble GFS, ECMWF, UKMO, dan NWS, memadukannya secara Bayesian dengan klimatologi historis NCEI, dan menerapkan CDF normal pada distribusi error prakiraan untuk mendapatkan probabilitas. Ini berhasil. Tapi secara fundamental dibatasi oleh akurasi model dasar.

Mengganti estimasi probabilitas itu dengan WeatherNext 2 sebagai sinyal utama memiliki efek yang sangat konkret:

  • Deteksi edge yang lebih tajam. Setengah derajat peningkatan RMSE prakiraan diterjemahkan langsung menjadi 1-3% edge yang lebih dapat dideteksi pada pasar borderline yang saat ini disaring oleh ambang batas 2% kami. Lebih banyak sinyal mencapai Claude.
  • Kalibrasi lebih baik. Saat kami bilang "78% probabilitas YES," itu harus benar-benar terselesaikan pada 78% di sampel besar. Keluaran probabilistik native WeatherNext 2 secara material lebih terkalibrasi dibanding apa pun yang bisa kami sintesis dari model deterministik.
  • Lebih sedikit trade tail bencana. Kinerja model yang lebih kuat pada event langka berarti kami salah memberi harga fat tails lebih jarang — secara historis kategori kerugian tak terduga terbesar kami.
  • Putaran model lebih cepat. Siklus fetch prakiraan kami saat ini terikat latensi oleh API cuaca gratis dengan rate limit. Menjalankan WeatherNext 2 melalui Vertex AI Google Cloud berarti kami bisa menyegarkan prakiraan sesuai jadwal kami sendiri, bukan jadwal mereka.

Mengapa Ini Masalah Sulit

Kami ingin terus terang: ini adalah pekerjaan rekayasa terberat yang kami ambil sejak migrasi infrastruktur v2. "Menyambungkan model baru" tidak pernah sesederhana yang terdengar, dan WeatherNext 2 khususnya memiliki sejumlah sisi tajam.

1
Akses data & pipa
Prakiraan WeatherNext 2 disampaikan melalui Earth Engine, BigQuery, dan Vertex AI. Tak satu pun adalah pengganti drop-in untuk endpoint HTTP gratis yang kami pakai sekarang. Kami butuh autentikasi, manajemen kuota, kontrol biaya, dan lapisan caching yang mengamortisasi panggilan inferensi berbayar di 97+ kombinasi kota/tanggal aktif kami.
2
Integrasi keluaran probabilistik
Kalkulator edge kami dirancang seputar satu prakiraan titik deterministik plus model error Gaussian. WeatherNext 2 memberi kami ensemble lengkap berisi ratusan skenario per kota. Mengganti pengkabelan mesin edge untuk mengonsumsi distribusi empiris nyata (bukan yang dipalsukan) membutuhkan penulisan ulang inti dari engine/edge.js dan menyetel ulang setiap threshold yang digunakan Claude.
3
Interpolasi grid ke titik kota
WeatherNext 2 menghasilkan grid global. Kontrak cuaca Polymarket diselesaikan di stasiun cuaca dengan nama spesifik (misalnya LaGuardia untuk NYC, Heathrow untuk London). Kami butuh interpolasi bilinear atau nearest-station yang akurat dari grid native model ke stasiun resolusi tepat — kemudian downscaling untuk efek mikroklimat lokal di mana relevan.
4
Biaya per prakiraan
Setiap kombinasi kota/tanggal yang kami pantau menjadi panggilan inferensi Vertex AI berbayar. Dengan ~1.975 pasar cuaca aktif di ~97 kombinasi unik, implementasi naif akan menguras anggaran dengan cepat. Kami membangun strategi penyegaran berjenjang: pasar berkeyakinan tinggi mendapat pembaruan sering, kota volume rendah mendapat siklus lebih lambat.
5
Kompatibilitas mundur
Kami tidak mencabut GFS/ECMWF/UKMO/NWS. Arsitektur akhir memakai WeatherNext 2 sebagai sinyal utama dengan model tradisional sebagai sanity check. Jika WeatherNext 2 sangat tidak setuju dengan model fisika, ketidaksepakatan itu sendiri menjadi fitur yang bisa dipikirkan Claude — bukan alasan untuk mempercayai sisi mana pun secara membabi buta.
6
Validasi out-of-sample
Sebelum menarik tuas, kami harus menjalankan WeatherNext 2 dalam mode shadow paralel dengan bot live selama berminggu-minggu — mencatat apa yang akan diprediksinya untuk setiap pasar, lalu membandingkan dengan apa yang benar-benar terselesaikan. Model yang menghasilkan benchmark indah pada reanalisis ERA5 tetap harus membuktikan dirinya layak masuk loop trading produksi dengan uang sungguhan.

Peningkatan Akurasi yang Diharapkan

Berdasarkan benchmark yang dipublikasikan oleh DeepMind dan pemodelan internal kami sendiri tentang bagaimana kesalahan prakiraan menyebar melalui kalkulator edge kami, inilah di mana kami berharap kinerja WeatherBot akan bergerak setelah integrasi mendarat:

RMSE suhu (cakupan 48 jam)
−28%
Pengurangan yang diharapkan dalam kesalahan prakiraan pada tanda 2 hari — horizon di mana sebagian besar perdagangan kami diselesaikan.
Kalibrasi probabilitas (Brier Score)
+18%
Probabilitas yang dikalibrasi lebih baik berarti tingkat kepercayaan Claude benar-benar cocok dengan kenyataan, yang secara langsung meningkatkan sizing Kelly.
Akurasi tail event (cuaca dingin/panas ekstrem)
+40%
Keuntungan terbesar ada pada peristiwa langka — tepat di mana pasar paling salah harga dan di mana kemenangan terbesar kami berada.
Edge yang terdeteksi per pemindaian
+35%
Prakiraan yang lebih tajam mendorong lebih banyak pasar di atas ambang batas edge 2% kami, memberi Claude lebih banyak sinyal berkualitas tinggi untuk dievaluasi.

Akses: Berdasarkan Volume untuk Pengguna Setia

Kita perlu jujur soal ekonominya di sini. Inferensi WeatherNext 2 lewat Vertex AI tidak gratis, dan pekerjaan infrastruktur merupakan investasi teknik yang signifikan. Kami tidak bisa memberikannya kepada semua orang di hari pertama — dan terus terang, kami tidak mau. Pengguna yang benar-benar membangun WeatherBot menjadi seperti sekarang seharusnya yang pertama mendapatkannya.

Saat WeatherNext 2 diluncurkan, aksesnya akan dibatasi oleh volume trading di platform. Volume perdagangan kumulatif Anda — setiap dolar USDC yang Anda gunakan melalui WeatherBot ke pasar Polymarket — menjadi mata uang yang membuka mesin yang ditingkatkan. Semakin banyak Anda berdagang, semakin awal dan dalam akses Anda.

Cara Kerja Tier Volume

Ambang batas tier final akan diumumkan mendekati peluncuran, tetapi strukturnya sudah dikunci:

  • Tier 1 — pendiri: kelompok dengan volume kumulatif tertinggi mendapatkan gelombang pertama akses WeatherNext 2 selama alpha tertutup. Output ensemble penuh, kadens refresh tertinggi, saluran umpan balik langsung ke tim engineering.
  • Tier 2 — pengguna mahir: gelombang kedua saat beta. Sinyal WeatherNext 2 lengkap dengan refresh rate yang sedikit lebih rendah.
  • Tier 3 — trader aktif: peluncuran umum dengan WeatherNext 2 sebagai pelengkap stack GFS/ECMWF/UKMO/NWS yang ada.
  • Di bawah ambang: berlanjut pada stack multi-model saat ini, yang tetap didukung penuh dan sendiri sedang ditingkatkan secara independen.

Volume trading Anda dilacak secara otomatis — setiap perdagangan yang ditempatkan bot atas nama Anda dihitung. Anda tidak perlu melakukan apa pun yang khusus. Semakin banyak Anda menggunakan platform, semakin tinggi tier Anda.

Catatan singkat soal keadilan: tier volume dihitung dari aktivitas trading Anda di platform, bukan ukuran wallet. Pengguna dengan modal lebih kecil tapi membiarkan bot trading secara konsisten akan naik tier lebih cepat daripada seseorang yang menyetor saldo besar lalu membiarkannya idle. Ini disengaja — kami ingin memberi penghargaan kepada orang-orang yang benar-benar menggunakan WeatherBot sesuai desainnya.

Linimasa

Tidak ada janji pada tanggal pasti — ini adalah rekayasa serius, dan kami tidak akan terburu-buru memasukkannya ke produksi. Tetapi inilah peta jalan yang jujur:

  • Sekarang: Akun Google Cloud disediakan, akses awal Vertex AI diminta, prototipe shadow-mode sedang dibangun terhadap data historis.
  • Beberapa minggu ke depan: Refaktor mesin edge untuk mengonsumsi ensemble probabilistik. Pencatatan paralel di samping mesin saat ini.
  • Minggu-minggu berikutnya: Shadow run di produksi — prediksi WeatherNext 2 dicatat untuk setiap pasar, dibandingkan dengan resolusi aktual, dengan laporan kalibrasi diterbitkan di sini.
  • Setelah benchmark lulus: Alpha tertutup untuk pengguna Tier 1. Lingkar umpan balik dengan tim teknik. Penyesuaian akhir.
  • Setelah alfa: Peluncuran bertahap melalui Tier 2, lalu Tier 3.

Yang bisa Anda lakukan sekarang

Volume trading Anda mulai dihitung hari ini. Setiap trade yang WeatherBot lakukan atas nama Anda sejak saat ini dihitung untuk tier WeatherNext 2 Anda saat peluncuran. Pastikan bot Anda berjalan, modal terkonfigurasi, dan wallet terhubung. Kami akan mempublikasikan ambang volume yang tepat dalam beberapa minggu ke depan — tapi pengguna yang menaiki leaderboard lebih awal akan menjadi yang pertama melangkah ke mesin yang ditingkatkan.

Read next

We Are Thrilled to Announce Two Brand-New Games: Storm Spin and Storm Bet

Read article →

Hong Kong Trades Are Now More Accurate Than Ever: We Plugged the Engine Straight Into the Source That Settles the Market

Read article →

WeatherBot by the Numbers: 9,592 Traders, $2.87M in Member Profit, and Exactly What It Costs to Run

Read article →
← All articles