WeatherNext 2: model AI od Google DeepMind przychodzi do WeatherBot
Zaczynamy pracę nad największą poprawą dokładności prognoz w historii WeatherBot: integracja WeatherNext 2 od Google DeepMind bezpośrednio do silnika handlowego. Jeśli nam się to uda, fundamentalnie zmieni to jakość każdego edge wykrytego przez naszego bota — a tym samym oczekiwany wynik każdej transakcji, którą zawiera.
Ten post wyjaśnia, dlaczego WeatherNext 2 ma znaczenie, jak wypada w porównaniu z tradycyjnym modelem NOAA GFS, na którym dziś polegamy, jak trudna naprawdę jest ta integracja i jak dostęp będzie uzależniony od wolumenu transakcji na platformie po uruchomieniu.
Czym jest WeatherNext 2?
WeatherNext 2 to najbardziej zaawansowany model prognozowania, jaki kiedykolwiek wypuścił Google DeepMind. Zaprezentowany pod koniec 2025 i już napędzający Google Search, Gemini, Pixel Weather i Google Maps, stanowi pokoleniowy skok w globalnym prognozowaniu pogody.
Zamiast rozwiązywać równania fizyki rządzące atmosferą — podejście stosowane od dekad przez NOAA GFS, model ECMWF i każdy tradycyjny system — WeatherNext 2 uczy się zachowania atmosfery bezpośrednio z dekad danych historycznych. Zbudowany jest na całkowicie nowej architekturze zwanej Funkcjonalna Sieć Generatywna (FGN), który wstrzykuje kontrolowany szum bezpośrednio do modelu, aby każda prognoza, którą wytwarza, pozostała fizycznie spójna i wewnętrznie spójna między zmiennymi.
8× szybsza generacja
Pełna prognoza ensemble zajmuje mniej niż minutę na jednym TPU. Modele oparte na fizyce wymagają godzin na superkomputerze, aby dać ten sam wynik.
99,9% zmiennych poprawione
Pokonuje wcześniejszy stan techniki na 99,9% zmiennych (temperatura, wiatr, wilgotność, ciśnienie, opady) i we wszystkich horyzontach od 0 do 15 dni.
Rozdzielczość 1 godzina
Prognozy godzinowe odświeżane cztery razy dziennie — znacznie precyzyjniejsze niż natywna rozdzielczość 3-6 godzin GFS dla horyzontów, na których handlujemy.
Setki scenariuszy
Generuje probabilistyczny ensemble setek prawdopodobnych przyszłości w mniej niż minutę, dając nam prawdziwy rozkład — nie pojedynczy deterministyczny strzał.
Dlaczego jest dokładniejszy niż NOAA GFS
Global Forecast System NOAA to fenomenalne dzieło inżynierii — ale został zaprojektowany w erze sprzed deep learning, a granice modelowania opartego na fizyce są oczywiste od lat. Jest powód, dla którego ECMWF historycznie wyprzedza GFS o około cały dzień skuteczności prognozy, i dlaczego niemal każdy duży dostawca pogody po cichu zaczął nakładać AI na swój tradycyjny stos.
Tu właśnie WeatherNext 2 wyprzedza GFS — szczególnie w rodzajach krótko- i średnioterminowych prognoz temperatury, które napędzają kontrakty pogodowe Polymarket:
- Wyuczone wzorce atmosferyczne vs. rozwiązane równania — GFS aproksymuje atmosferę dyskretyzując ją na siatkę i rozwiązując równania Naviera-Stokesa w każdym kroku czasowym. Te przybliżenia kumulują się w czasie. WeatherNext 2 nauczył się pełnego nieliniowego zachowania atmosfery z danych re-analizy ERA5, więc nie kumuluje tej samej klasy błędów numerycznych.
- Natywne wyjście probabilistyczne — GFS daje jedną prognozę na uruchomienie. Aby uzyskać rozkład, potrzebujesz GEFS (ensemble), co dodaje koszt i opóźnienie. WeatherNext 2 zwraca pełen rozkład natywnie, więc widzimy faktyczne prawdopodobieństwo, że miasto osiągnie 14°C, a nie tylko pojedynczą estymację, którą musimy sami opakować bayesowsko.
- Wyższa efektywna rozdzielczość — WeatherNext 2 produkuje godzinowe globalne prognozy. GFS działa operacyjnie z rozdzielczością poziomą 13 km i wyjściem 3-godzinnym dla naszego zakresu handlu. Dla kontraktów dziennych max i min specyficznych dla miasta, ta dodatkowa granularność czasowa to prawdziwy edge.
- Lepiej na ogonach — benchmarki DeepMind pokazują największe zyski przy zdarzeniach o niskim prawdopodobieństwie i wysokim wpływie: zimnych falach, kopułach upałów, burzach. To dokładnie te rynki, na których żyją źle wycenione ogony i z których pochodzą nasze największe transakcje.
- Spójne fizycznie ensemble — architektura FGN oznacza, że każdy scenariusz w zespole jest wewnętrznie spójny (wietrzny scenariusz ma również odpowiadający mu gradient ciśnienia). To właśnie sprawia, że prawdopodobieństwa są użyteczne do wyceny.
Dla horyzontów 0-3 dni stanowiących większość pogodowych rynków Polymarket, niezależne oceny stawiają nowoczesne modele AI na tym samym poziomie — a często wyżej — niż flagowy IFS ECMWF, który sam jest istotnie przed GFS. Z grubsza: kilka dziesiątych stopnia RMSE dla maksymalnej dobowej temperatury w okolicy 48 h i wyraźnie ciaśniejsza kalibracja w przypadku rzadkich zdarzeń.
Dlaczego to zmienia wynik transakcji
Cała przewaga WeatherBot bierze się z jednego mechanicznego kroku: oszacowania prawdziwego prawdopodobieństwa zakresu temperatur dokładniej niż wycenia go rynek Polymarket. Wszystko poniżej — decyzja YES/NO Claude'a, sizing Kelly'ego, logika wyjścia, trailing stopy — żywi się tą estymacją prawdopodobieństwa.
Dziś łączymy GFS, ECMWF, UKMO i NWS w ensemble, mieszamy je bayesowsko z historyczną klimatologią NCEI i stosujemy normalny CDF nad rozkładem błędu prognozy, aby uzyskać prawdopodobieństwo. Działa. Ale to jest fundamentalnie ograniczone dokładnością modeli bazowych.
Zastąpienie tej estymacji prawdopodobieństwa WeatherNext 2 jako głównym sygnałem ma bardzo konkretne skutki:
- Bardziej precyzyjne wykrywanie przewagi. Pół stopnia poprawy w RMSE prognozy przekłada się bezpośrednio na 1-3% więcej wykrywalnego edge na rynkach granicznych, które obecnie są odfiltrowywane przez nasz próg 2%. Więcej sygnałów dociera do Claude'a.
- Lepsza kalibracja. Kiedy mówimy „78% prawdopodobieństwa YES", musi to faktycznie kończyć się na 78% w dużej próbie. Natywne wyjście probabilistyczne WeatherNext 2 jest istotnie lepiej skalibrowane niż cokolwiek, co możemy zsyntetyzować z modeli deterministycznych.
- Mniej katastrofalnych transakcji na ogonach. Lepsza wydajność modelu na rzadkich zdarzeniach oznacza, że rzadziej źle wyceniamy grube ogony — historycznie nasza największa kategoria nieoczekiwanych strat.
- Szybszy obrót modelu. Nasz obecny cykl pobierania prognoz jest ograniczony latencją przez darmowe API pogodowe z rate-limit. Uruchomienie WeatherNext 2 przez Vertex AI Google Cloud oznacza, że możemy odświeżać prognozy według własnego harmonogramu, a nie ich.
Dlaczego to trudny problem
Chcemy być szczerzy: to najtrudniejsza praca inżynierska, jakiej podjęliśmy się od czasu migracji infrastruktury v2. "Podłączenie nowego modelu" nigdy nie jest tak proste, jak się wydaje, a WeatherNext 2 w szczególności ma wiele ostrych krawędzi.
engine/edge.js i ponownie dostroić każdy próg używany przez Claude'a.Oczekiwana poprawa dokładności
Na podstawie opublikowanych benchmarków DeepMind oraz naszego własnego wewnętrznego modelowania, jak błąd prognozy propaguje się przez nasz kalkulator edge, oto gdzie spodziewamy się ruchu wydajności WeatherBot, gdy integracja zostanie wdrożona:
Dostęp: zależny od wolumenu dla lojalnych użytkowników
Musimy być szczerzy co do ekonomii. Inferencja WeatherNext 2 przez Vertex AI nie jest darmowa, a prace infrastrukturalne to znaczna inwestycja inżynierska. Nie możemy dać tego wszystkim od pierwszego dnia — i szczerze mówiąc, nie chcemy. Użytkownicy, którzy faktycznie zbudowali WeatherBot do tego, czym jest dziś, powinni dostać to jako pierwsi.
Po premierze WeatherNext 2 dostęp będzie ograniczone przez wolumen handlu na platformie. Twój skumulowany wolumen handlu — każdy dolar USDC, który wdrożyłeś przez WeatherBot na rynkach Polymarket — staje się walutą, która odblokowuje ulepszony silnik. Im więcej handlowałeś, tym wcześniejszy i głębszy jest twój dostęp.
Jak będą działać poziomy wolumenu
Ostateczne progi poziomów zostaną ogłoszone bliżej premiery, ale struktura jest już ustalona:
- Tier 1 — założyciele: grupa o najwyższym skumulowanym wolumenie otrzymuje pierwszą falę dostępu do WeatherNext 2 podczas zamkniętej alfy. Pełny output ensemble, najwyższa częstotliwość odświeżania, bezpośredni kanał feedbacku do zespołu inżynieryjnego.
- Tier 2 — zaawansowani użytkownicy: druga fala podczas bety. Pełny sygnał WeatherNext 2 z lekko obniżoną częstotliwością odświeżania.
- Tier 3 — aktywni traderzy: ogólne wdrożenie z WeatherNext 2 jako uzupełnieniem istniejącego stosu GFS/ECMWF/UKMO/NWS.
- Poniżej progu: kontynuuje na obecnym stosie multi-model, który pozostaje w pełni wspierany i sam jest niezależnie ulepszany.
Twój wolumen handlu jest śledzony automatycznie — każda transakcja, którą bot zawiera w twoim imieniu, się liczy. Nie musisz nic specjalnego robić. Im więcej korzystasz z platformy, tym wyższy twój tier.
Krótka uwaga o sprawiedliwości: poziomy wolumenu są obliczane z Twojej aktywności tradingowej na platformie, a nie z wielkości portfela. Użytkownik z mniejszym kapitałem, ale pozwalający botowi handlować konsekwentnie, wspina się po poziomach szybciej niż ktoś, kto wpłaca dużą sumę i zostawia ją bezczynnie. To zamierzone — chcemy nagradzać ludzi, którzy faktycznie używają WeatherBot tak, jak został zaprojektowany.
Harmonogram
Brak obietnic co do dokładnych dat — to poważna inżynieria, i nie zamierzamy jej spieszyć do produkcji. Ale oto uczciwa mapa drogowa:
- Teraz: Konto Google Cloud uruchomione, wczesny dostęp do Vertex AI zażądany, prototyp shadow-mode budowany na danych historycznych.
- Najbliższe tygodnie: Refaktoryzacja silnika edge tak, by przyjmował zespoły probabilistyczne. Równoległe logowanie obok obecnego silnika.
- Kolejne tygodnie: Shadow run w produkcji — prognozy WeatherNext 2 logowane dla każdego rynku, porównywane z rzeczywistymi rozwiązaniami, z raportami kalibracji publikowanymi tutaj.
- Po pomyślnym przejściu testów porównawczych: Zamknięta alfa dla użytkowników Tier 1. Pętla informacji zwrotnej z zespołem inżynierskim. Końcowe dostrajanie.
- Po alfie: Wdrożenie etapowe przez Tier 2, a następnie Tier 3.
Co możesz zrobić już teraz
Twój wolumen handlu zaczyna się liczyć dziś. Każda transakcja, którą WeatherBot wykona w Twoim imieniu od tej chwili, liczy się do Twojego poziomu WeatherNext 2 w momencie startu. Upewnij się, że Twój bot działa, kapitał skonfigurowany, a portfel podłączony. Dokładne progi wolumenu opublikujemy w najbliższych tygodniach — ale to użytkownicy, którzy wcześnie wspinają się w rankingu, jako pierwsi przejdą na ulepszony silnik.