WeatherNext 2 Integration — Google DeepMind AI Comes to WeatherBot

W TRAKCIE PRAC · ALFA

WeatherNext 2: model AI od Google DeepMind przychodzi do WeatherBot

21 kwietnia 2026

Zaczynamy pracę nad największą poprawą dokładności prognoz w historii WeatherBot: integracja WeatherNext 2 od Google DeepMind bezpośrednio do silnika handlowego. Jeśli nam się to uda, fundamentalnie zmieni to jakość każdego edge wykrytego przez naszego bota — a tym samym oczekiwany wynik każdej transakcji, którą zawiera.

Ten post wyjaśnia, dlaczego WeatherNext 2 ma znaczenie, jak wypada w porównaniu z tradycyjnym modelem NOAA GFS, na którym dziś polegamy, jak trudna naprawdę jest ta integracja i jak dostęp będzie uzależniony od wolumenu transakcji na platformie po uruchomieniu.

Czym jest WeatherNext 2?

WeatherNext 2 to najbardziej zaawansowany model prognozowania, jaki kiedykolwiek wypuścił Google DeepMind. Zaprezentowany pod koniec 2025 i już napędzający Google Search, Gemini, Pixel Weather i Google Maps, stanowi pokoleniowy skok w globalnym prognozowaniu pogody.

Zamiast rozwiązywać równania fizyki rządzące atmosferą — podejście stosowane od dekad przez NOAA GFS, model ECMWF i każdy tradycyjny system — WeatherNext 2 uczy się zachowania atmosfery bezpośrednio z dekad danych historycznych. Zbudowany jest na całkowicie nowej architekturze zwanej Funkcjonalna Sieć Generatywna (FGN), który wstrzykuje kontrolowany szum bezpośrednio do modelu, aby każda prognoza, którą wytwarza, pozostała fizycznie spójna i wewnętrznie spójna między zmiennymi.

8× szybsza generacja

Pełna prognoza ensemble zajmuje mniej niż minutę na jednym TPU. Modele oparte na fizyce wymagają godzin na superkomputerze, aby dać ten sam wynik.

99,9% zmiennych poprawione

Pokonuje wcześniejszy stan techniki na 99,9% zmiennych (temperatura, wiatr, wilgotność, ciśnienie, opady) i we wszystkich horyzontach od 0 do 15 dni.

Rozdzielczość 1 godzina

Prognozy godzinowe odświeżane cztery razy dziennie — znacznie precyzyjniejsze niż natywna rozdzielczość 3-6 godzin GFS dla horyzontów, na których handlujemy.

Setki scenariuszy

Generuje probabilistyczny ensemble setek prawdopodobnych przyszłości w mniej niż minutę, dając nam prawdziwy rozkład — nie pojedynczy deterministyczny strzał.

Dlaczego jest dokładniejszy niż NOAA GFS

Global Forecast System NOAA to fenomenalne dzieło inżynierii — ale został zaprojektowany w erze sprzed deep learning, a granice modelowania opartego na fizyce są oczywiste od lat. Jest powód, dla którego ECMWF historycznie wyprzedza GFS o około cały dzień skuteczności prognozy, i dlaczego niemal każdy duży dostawca pogody po cichu zaczął nakładać AI na swój tradycyjny stos.

Tu właśnie WeatherNext 2 wyprzedza GFS — szczególnie w rodzajach krótko- i średnioterminowych prognoz temperatury, które napędzają kontrakty pogodowe Polymarket:

Wyuczone wzorce atmosferyczne vs. rozwiązane równania — GFS aproksymuje atmosferę dyskretyzując ją na siatkę i rozwiązując równania Naviera-Stokesa w każdym kroku czasowym. Te przybliżenia kumulują się w czasie. WeatherNext 2 nauczył się pełnego nieliniowego zachowania atmosfery z danych re-analizy ERA5, więc nie kumuluje tej samej klasy błędów numerycznych.
Natywne wyjście probabilistyczne — GFS daje jedną prognozę na uruchomienie. Aby uzyskać rozkład, potrzebujesz GEFS (ensemble), co dodaje koszt i opóźnienie. WeatherNext 2 zwraca pełen rozkład natywnie, więc widzimy faktyczne prawdopodobieństwo, że miasto osiągnie 14°C, a nie tylko pojedynczą estymację, którą musimy sami opakować bayesowsko.
Wyższa efektywna rozdzielczość — WeatherNext 2 produkuje godzinowe globalne prognozy. GFS działa operacyjnie z rozdzielczością poziomą 13 km i wyjściem 3-godzinnym dla naszego zakresu handlu. Dla kontraktów dziennych max i min specyficznych dla miasta, ta dodatkowa granularność czasowa to prawdziwy edge.
Lepiej na ogonach — benchmarki DeepMind pokazują największe zyski przy zdarzeniach o niskim prawdopodobieństwie i wysokim wpływie: zimnych falach, kopułach upałów, burzach. To dokładnie te rynki, na których żyją źle wycenione ogony i z których pochodzą nasze największe transakcje.
Spójne fizycznie ensemble — architektura FGN oznacza, że każdy scenariusz w zespole jest wewnętrznie spójny (wietrzny scenariusz ma również odpowiadający mu gradient ciśnienia). To właśnie sprawia, że prawdopodobieństwa są użyteczne do wyceny.

Dla horyzontów 0-3 dni stanowiących większość pogodowych rynków Polymarket, niezależne oceny stawiają nowoczesne modele AI na tym samym poziomie — a często wyżej — niż flagowy IFS ECMWF, który sam jest istotnie przed GFS. Z grubsza: kilka dziesiątych stopnia RMSE dla maksymalnej dobowej temperatury w okolicy 48 h i wyraźnie ciaśniejsza kalibracja w przypadku rzadkich zdarzeń.

Dlaczego to zmienia wynik transakcji

Cała przewaga WeatherBot bierze się z jednego mechanicznego kroku: oszacowania prawdziwego prawdopodobieństwa zakresu temperatur dokładniej niż wycenia go rynek Polymarket. Wszystko poniżej — decyzja YES/NO Claude'a, sizing Kelly'ego, logika wyjścia, trailing stopy — żywi się tą estymacją prawdopodobieństwa.

Dziś łączymy GFS, ECMWF, UKMO i NWS w ensemble, mieszamy je bayesowsko z historyczną klimatologią NCEI i stosujemy normalny CDF nad rozkładem błędu prognozy, aby uzyskać prawdopodobieństwo. Działa. Ale to jest fundamentalnie ograniczone dokładnością modeli bazowych.

Zastąpienie tej estymacji prawdopodobieństwa WeatherNext 2 jako głównym sygnałem ma bardzo konkretne skutki:

Bardziej precyzyjne wykrywanie przewagi. Pół stopnia poprawy w RMSE prognozy przekłada się bezpośrednio na 1-3% więcej wykrywalnego edge na rynkach granicznych, które obecnie są odfiltrowywane przez nasz próg 2%. Więcej sygnałów dociera do Claude'a.
Lepsza kalibracja. Kiedy mówimy „78% prawdopodobieństwa YES", musi to faktycznie kończyć się na 78% w dużej próbie. Natywne wyjście probabilistyczne WeatherNext 2 jest istotnie lepiej skalibrowane niż cokolwiek, co możemy zsyntetyzować z modeli deterministycznych.
Mniej katastrofalnych transakcji na ogonach. Lepsza wydajność modelu na rzadkich zdarzeniach oznacza, że rzadziej źle wyceniamy grube ogony — historycznie nasza największa kategoria nieoczekiwanych strat.
Szybszy obrót modelu. Nasz obecny cykl pobierania prognoz jest ograniczony latencją przez darmowe API pogodowe z rate-limit. Uruchomienie WeatherNext 2 przez Vertex AI Google Cloud oznacza, że możemy odświeżać prognozy według własnego harmonogramu, a nie ich.

Dlaczego to trudny problem

Chcemy być szczerzy: to najtrudniejsza praca inżynierska, jakiej podjęliśmy się od czasu migracji infrastruktury v2. "Podłączenie nowego modelu" nigdy nie jest tak proste, jak się wydaje, a WeatherNext 2 w szczególności ma wiele ostrych krawędzi.

Dostęp do danych i instalacja

Prognozy WeatherNext 2 dostarczane są przez Earth Engine, BigQuery i Vertex AI. Żaden z nich nie jest gotowym zamiennikiem darmowych endpointów HTTP, których teraz używamy. Potrzebujemy uwierzytelniania, zarządzania kwotami, kontroli kosztów i warstwy cache amortyzującej płatne wywołania inferencji na naszych 97+ aktywnych combo miasto/data.

Integracja wyjścia probabilistycznego

Nasz kalkulator przewagi został zaprojektowany wokół pojedynczej deterministycznej prognozy punktowej plus modelu błędu Gaussa. WeatherNext 2 daje nam pełen ensemble kilkuset scenariuszy na miasto. Przeprogramowanie silnika przewagi tak, aby konsumował realny rozkład empiryczny (zamiast go udawać), wymaga przepisania rdzenia engine/edge.js i ponownie dostroić każdy próg używany przez Claude'a.

Interpolacja siatki do punktów miast

WeatherNext 2 zwraca globalną siatkę. Pogodowe kontrakty Polymarket rozstrzygają się na konkretnych nazwanych stacjach pogodowych (np. LaGuardia dla Nowego Jorku, Heathrow dla Londynu). Potrzebujemy dokładnej interpolacji bilinearnej lub nearest-station z natywnej siatki modelu do dokładnej stacji rozstrzygnięcia — a następnie downscalingu dla efektów lokalnego mikroklimatu, gdy to istotne.

Koszt na prognozę

Każda kombinacja miasto/data, którą monitorujemy, staje się płatnym wywołaniem inferencji Vertex AI. Przy ~1975 aktywnych rynkach pogodowych na ~97 unikalnych kombinacjach naiwna implementacja szybko zjadłaby budżet. Budujemy strategię odświeżania w warstwach: rynki o wysokiej pewności otrzymują częste aktualizacje, miasta o niskim wolumenie wolniejsze cykle.

Wsteczna kompatybilność

Nie wyrywamy GFS/ECMWF/UKMO/NWS. Ostateczna architektura wykorzystuje WeatherNext 2 jako sygnał główny, a tradycyjne modele jako sanity check. Jeśli WeatherNext 2 ostro różni się od modeli fizycznych, sama ta rozbieżność staje się cechą, którą Claude może analizować — a nie powodem do ślepego zaufania jakiejkolwiek stronie.

Walidacja poza próbą

Zanim przestawimy przełącznik, musimy przez tygodnie uruchamiać WeatherNext 2 w trybie shadow równolegle z live-botem — logując, co przewidziałby dla każdego rynku, a potem porównując z faktycznymi rozstrzygnięciami. Model, który ślicznie wypada w benchmarkach na re-analizie ERA5, wciąż musi zapracować na miejsce w produkcyjnej pętli tradingu z prawdziwymi pieniędzmi.

Oczekiwana poprawa dokładności

Na podstawie opublikowanych benchmarków DeepMind oraz naszego własnego wewnętrznego modelowania, jak błąd prognozy propaguje się przez nasz kalkulator edge, oto gdzie spodziewamy się ruchu wydajności WeatherBot, gdy integracja zostanie wdrożona:

RMSE temperatury (horyzont 48 h)

−28%

Oczekiwana redukcja błędu prognozy przy znaczniku 2 dni — horyzoncie, na którym rozliczana jest większość naszych transakcji.

Kalibracja prawdopodobieństw (Brier Score)

+18%

Lepiej skalibrowane prawdopodobieństwa oznaczają, że poziomy pewności Claude'a faktycznie odpowiadają rzeczywistości, co bezpośrednio poprawia sizing Kelly'ego.

Dokładność zdarzeń skrajnych (ekstremalne zimno/upał)

+40%

Największe zyski są na rzadkich wydarzeniach — dokładnie tam, gdzie rynki najbardziej źle wyceniają i gdzie żyją nasze największe wygrane.

Wykrywalny edge na skan

+35%

Ostrzejsze prognozy popychają więcej rynków powyżej naszego progu edge 2%, dając Claude'owi więcej wysokiej jakości sygnałów do oceny.

Dostęp: zależny od wolumenu dla lojalnych użytkowników

Musimy być szczerzy co do ekonomii. Inferencja WeatherNext 2 przez Vertex AI nie jest darmowa, a prace infrastrukturalne to znaczna inwestycja inżynierska. Nie możemy dać tego wszystkim od pierwszego dnia — i szczerze mówiąc, nie chcemy. Użytkownicy, którzy faktycznie zbudowali WeatherBot do tego, czym jest dziś, powinni dostać to jako pierwsi.

Po premierze WeatherNext 2 dostęp będzie ograniczone przez wolumen handlu na platformie. Twój skumulowany wolumen handlu — każdy dolar USDC, który wdrożyłeś przez WeatherBot na rynkach Polymarket — staje się walutą, która odblokowuje ulepszony silnik. Im więcej handlowałeś, tym wcześniejszy i głębszy jest twój dostęp.

Jak będą działać poziomy wolumenu

Ostateczne progi poziomów zostaną ogłoszone bliżej premiery, ale struktura jest już ustalona:

Tier 1 — założyciele: grupa o najwyższym skumulowanym wolumenie otrzymuje pierwszą falę dostępu do WeatherNext 2 podczas zamkniętej alfy. Pełny output ensemble, najwyższa częstotliwość odświeżania, bezpośredni kanał feedbacku do zespołu inżynieryjnego.
Tier 2 — zaawansowani użytkownicy: druga fala podczas bety. Pełny sygnał WeatherNext 2 z lekko obniżoną częstotliwością odświeżania.
Tier 3 — aktywni traderzy: ogólne wdrożenie z WeatherNext 2 jako uzupełnieniem istniejącego stosu GFS/ECMWF/UKMO/NWS.
Poniżej progu: kontynuuje na obecnym stosie multi-model, który pozostaje w pełni wspierany i sam jest niezależnie ulepszany.

Twój wolumen handlu jest śledzony automatycznie — każda transakcja, którą bot zawiera w twoim imieniu, się liczy. Nie musisz nic specjalnego robić. Im więcej korzystasz z platformy, tym wyższy twój tier.

Krótka uwaga o sprawiedliwości: poziomy wolumenu są obliczane z Twojej aktywności tradingowej na platformie, a nie z wielkości portfela. Użytkownik z mniejszym kapitałem, ale pozwalający botowi handlować konsekwentnie, wspina się po poziomach szybciej niż ktoś, kto wpłaca dużą sumę i zostawia ją bezczynnie. To zamierzone — chcemy nagradzać ludzi, którzy faktycznie używają WeatherBot tak, jak został zaprojektowany.

Harmonogram

Brak obietnic co do dokładnych dat — to poważna inżynieria, i nie zamierzamy jej spieszyć do produkcji. Ale oto uczciwa mapa drogowa:

Teraz: Konto Google Cloud uruchomione, wczesny dostęp do Vertex AI zażądany, prototyp shadow-mode budowany na danych historycznych.
Najbliższe tygodnie: Refaktoryzacja silnika edge tak, by przyjmował zespoły probabilistyczne. Równoległe logowanie obok obecnego silnika.
Kolejne tygodnie: Shadow run w produkcji — prognozy WeatherNext 2 logowane dla każdego rynku, porównywane z rzeczywistymi rozwiązaniami, z raportami kalibracji publikowanymi tutaj.
Po pomyślnym przejściu testów porównawczych: Zamknięta alfa dla użytkowników Tier 1. Pętla informacji zwrotnej z zespołem inżynierskim. Końcowe dostrajanie.
Po alfie: Wdrożenie etapowe przez Tier 2, a następnie Tier 3.

Co możesz zrobić już teraz

Twój wolumen handlu zaczyna się liczyć dziś. Każda transakcja, którą WeatherBot wykona w Twoim imieniu od tej chwili, liczy się do Twojego poziomu WeatherNext 2 w momencie startu. Upewnij się, że Twój bot działa, kapitał skonfigurowany, a portfel podłączony. Dokładne progi wolumenu opublikujemy w najbliższych tygodniach — ale to użytkownicy, którzy wcześnie wspinają się w rankingu, jako pierwsi przejdą na ulepszony silnik.