WeatherNext 2: Mô hình AI của Google DeepMind đến WeatherBot
Chúng tôi bắt đầu nâng cấp độ chính xác dự báo lớn nhất trong lịch sử WeatherBot: tích hợp WeatherNext 2 của Google DeepMind trực tiếp vào engine giao dịch. Nếu chúng tôi thành công, nó sẽ thay đổi cơ bản chất lượng của mọi edge mà bot của chúng tôi phát hiện — và do đó là kết quả dự kiến của mọi giao dịch mà nó thực hiện.
Bài viết này giải thích vì sao WeatherNext 2 quan trọng, so sánh với mô hình NOAA GFS truyền thống mà chúng tôi dựa vào hôm nay, việc tích hợp này thực sự khó đến đâu, và cách quyền truy cập sẽ được giới hạn theo khối lượng giao dịch trên nền tảng sau khi ra mắt.
WeatherNext 2 là gì?
WeatherNext 2 là mô hình dự báo tiên tiến nhất mà Google DeepMind từng phát hành. Ra mắt cuối năm 2025 và đã được dùng trong Google Search, Gemini, Pixel Weather và Google Maps, đây là một bước nhảy thế hệ trong dự báo thời tiết quy mô toàn cầu.
Thay vì giải các phương trình vật lý chi phối khí quyển — cách tiếp cận mà NOAA GFS, mô hình ECMWF và mọi hệ thống truyền thống đã dùng hàng thập kỷ — WeatherNext 2 học hành vi khí quyển trực tiếp từ dữ liệu lịch sử hàng chục năm. Nó được xây dựng trên một kiến trúc hoàn toàn mới có tên Mạng tạo sinh hàm (FGN), vốn tiêm nhiễu được kiểm soát trực tiếp vào mô hình để mọi dự báo mà nó tạo ra vẫn nhất quán về mặt vật lý và mạch lạc nội tại trên các biến số.
Tạo nhanh hơn 8 lần
Một dự báo ensemble đầy đủ mất chưa đến một phút trên một TPU đơn lẻ. Các mô hình dựa trên vật lý cần nhiều giờ trên siêu máy tính để cho ra cùng kết quả.
99,9% biến được cải thiện
Vượt qua trạng thái tiên tiến trước đó trên 99,9% các biến số (nhiệt độ, gió, độ ẩm, áp suất, lượng mưa) và mọi khoảng dự báo từ 0 đến 15 ngày.
Độ phân giải 1 giờ
Dự báo theo giờ làm mới bốn lần mỗi ngày — chi tiết hơn rất nhiều so với độ phân giải gốc 3-6 giờ của GFS cho các khoảng thời gian chúng tôi giao dịch.
Hàng trăm kịch bản
Tạo ra ensemble xác suất gồm hàng trăm tương lai khả dĩ trong dưới một phút, cho chúng tôi một phân phối thực sự — không phải một dự đoán xác định duy nhất.
Vì sao chính xác hơn NOAA GFS
Global Forecast System của NOAA là một công trình kỹ thuật phi thường — nhưng được thiết kế trong thời đại trước deep learning, và những giới hạn của mô hình dựa trên vật lý đã rõ ràng từ nhiều năm nay. Có lý do để ECMWF lịch sử vượt GFS khoảng một ngày kỹ năng dự báo, và vì sao gần như mọi nhà cung cấp thời tiết lớn đã âm thầm xếp AI lên trên stack truyền thống của họ.
Đây là chỗ WeatherNext 2 vượt GFS — đặc biệt ở các loại dự báo nhiệt độ ngắn đến trung hạn, là động lực của hợp đồng thời tiết Polymarket:
- Mô hình khí quyển học được so với phương trình được giải — GFS xấp xỉ khí quyển bằng cách rời rạc hóa thành lưới và giải Navier-Stokes ở mỗi bước thời gian. Những xấp xỉ đó tích lũy theo thời gian. WeatherNext 2 đã học toàn bộ hành vi phi tuyến của khí quyển từ dữ liệu reanalysis ERA5, nên không tích lũy cùng loại lỗi số đó.
- Đầu ra xác suất nguyên bản — GFS cho bạn một dự báo cho mỗi lần chạy. Để có một phân phối, bạn cần GEFS (ensemble), điều này thêm chi phí và độ trễ. WeatherNext 2 xuất phân phối đầy đủ nguyên bản, nên chúng tôi thấy xác suất thực sự rằng một thành phố đạt 14°C, không chỉ là một ước lượng điểm mà chúng tôi phải tự bọc bằng Bayesian.
- Độ phân giải hiệu dụng cao hơn — WeatherNext 2 tạo ra các dự báo toàn cầu theo giờ. GFS hoạt động ở độ phân giải ngang 13km với đầu ra 3 giờ cho phạm vi giao dịch của chúng tôi. Đối với các hợp đồng tối đa hằng ngày và tối thiểu hằng ngày theo thành phố cụ thể, độ chi tiết thời gian thêm đó là một edge thực sự.
- Tốt hơn ở phần đuôi phân phối — các điểm chuẩn của DeepMind cho thấy lợi nhuận lớn nhất trên các sự kiện xác suất thấp, tác động lớn: đợt lạnh đột ngột, vòm nhiệt, bão. Đây chính xác là những thị trường nơi các đuôi định giá sai tồn tại và là nơi các giao dịch lớn nhất của chúng tôi đến từ đó.
- Các ensemble nhất quán về vật lý — kiến trúc FGN có nghĩa là mọi kịch bản trong ensemble đều nhất quán nội tại (một kịch bản nhiều gió cũng có gradient áp suất tương ứng). Đây là điều khiến các xác suất có thể sử dụng được cho việc định giá.
Với khoảng 0-3 ngày chiếm phần lớn các thị trường thời tiết Polymarket, các đánh giá độc lập xếp các mô hình AI hiện đại ở cùng đẳng cấp — và thường vượt — IFS chủ lực của ECMWF, vốn đã vượt GFS đáng kể. Diễn giải đại khái: vài phần mười độ RMSE cho nhiệt độ tối đa hằng ngày ở mốc 48 giờ, và hiệu chỉnh chặt chẽ hơn rõ rệt ở các sự kiện hiếm.
Vì sao điều này thay đổi kết quả giao dịch
Toàn bộ lợi thế của WeatherBot đến từ một bước máy móc: ước lượng xác suất thực của khoảng nhiệt độ chính xác hơn mức mà thị trường Polymarket đang định giá. Mọi thứ phía sau — quyết định YES/NO của Claude, sizing Kelly, logic thoát lệnh, trailing stop — đều dựa trên ước lượng xác suất đó.
Hôm nay chúng tôi ensemble GFS, ECMWF, UKMO và NWS, kết hợp Bayesian với khí hậu lịch sử NCEI và áp dụng CDF chuẩn lên phân phối lỗi dự báo để có xác suất. Nó hoạt động. Nhưng về cơ bản bị giới hạn bởi độ chính xác của các mô hình nền tảng.
Thay thế ước lượng xác suất đó bằng WeatherNext 2 làm tín hiệu chính có những hiệu ứng rất cụ thể:
- Phát hiện lợi thế sắc nét hơn. Cải thiện nửa độ trong RMSE dự báo trực tiếp chuyển thành 1-3% edge có thể phát hiện thêm trên các thị trường borderline hiện đang bị lọc bởi ngưỡng 2% của chúng tôi. Nhiều tín hiệu hơn đến được Claude.
- Hiệu chỉnh tốt hơn. Khi chúng tôi nói "xác suất YES 78%", nó phải thực sự kết thúc ở mức 78% trên một mẫu lớn. Đầu ra xác suất nguyên bản của WeatherNext 2 được hiệu chuẩn tốt hơn đáng kể so với bất cứ thứ gì chúng tôi có thể tổng hợp từ các mô hình xác định.
- Ít lệnh thảm khốc ở phần đuôi hơn. Hiệu suất mạnh hơn của mô hình trên các sự kiện hiếm có nghĩa là chúng tôi định giá sai phần đuôi dày ít hơn — lịch sử là loại tổn thất bất ngờ lớn nhất của chúng tôi.
- Vòng quay mô hình nhanh hơn. Chu trình lấy dự báo hiện tại của chúng tôi bị giới hạn độ trễ bởi các API thời tiết miễn phí có giới hạn tốc độ. Chạy WeatherNext 2 qua Vertex AI của Google Cloud nghĩa là chúng tôi có thể làm mới dự báo theo lịch của mình, không theo lịch của họ.
Vì sao đây là vấn đề khó
Chúng tôi muốn nói thẳng: đây là công việc kỹ thuật khó nhất mà chúng tôi đảm nhận kể từ khi di chuyển hạ tầng v2. "Cắm vào một mô hình mới" không bao giờ đơn giản như nghe có vẻ, và WeatherNext 2 nói riêng có một số cạnh sắc.
engine/edge.js và tinh chỉnh lại mọi ngưỡng mà Claude sử dụng.Cải thiện độ chính xác kỳ vọng
Dựa trên các điểm chuẩn được công bố của DeepMind và mô hình nội bộ của riêng chúng tôi về cách sai số dự báo lan truyền qua bộ tính toán edge của chúng tôi, đây là nơi chúng tôi mong đợi hiệu suất WeatherBot sẽ di chuyển khi tích hợp được triển khai:
Truy cập: ngưỡng theo khối lượng cho người dùng trung thành
Chúng ta cần thành thật về kinh tế ở đây. Inference WeatherNext 2 qua Vertex AI không miễn phí, và công việc hạ tầng đại diện cho khoản đầu tư kỹ thuật đáng kể. Chúng tôi không thể trao nó cho tất cả mọi người ngay từ ngày đầu — và thẳng thắn mà nói, chúng tôi không muốn. Những người dùng đã thực sự xây dựng WeatherBot thành như hôm nay nên là những người đầu tiên có nó.
Khi WeatherNext 2 ra mắt, quyền truy cập sẽ bị giới hạn theo khối lượng giao dịch trên nền tảng. Khối lượng giao dịch tích lũy của bạn — mỗi đô la USDC mà bạn đã triển khai thông qua WeatherBot vào các thị trường Polymarket — trở thành đơn vị tiền tệ mở khóa engine nâng cấp. Bạn càng giao dịch nhiều, quyền truy cập của bạn càng sớm và sâu hơn.
Cách hoạt động của các bậc khối lượng
Các ngưỡng tier cuối cùng sẽ được công bố gần thời điểm ra mắt, nhưng cấu trúc đã được chốt:
- Tier 1 — người đồng sáng lập: nhóm có khối lượng tích lũy cao nhất nhận được làn sóng đầu tiên của quyền truy cập WeatherNext 2 trong giai đoạn alpha kín. Đầu ra ensemble đầy đủ, tốc độ làm mới cao nhất, kênh phản hồi trực tiếp đến đội kỹ thuật.
- Tier 2 — người dùng nâng cao: đợt thứ hai trong giai đoạn beta. Tín hiệu WeatherNext 2 đầy đủ với tốc độ làm mới giảm nhẹ.
- Tier 3 — trader hoạt động tích cực: triển khai chung với WeatherNext 2 như một bổ sung cho stack GFS/ECMWF/UKMO/NWS hiện tại.
- Dưới ngưỡng: tiếp tục trên stack đa mô hình hiện tại, vẫn được hỗ trợ đầy đủ và bản thân nó cũng đang được cải tiến một cách độc lập.
Khối lượng giao dịch của bạn được theo dõi tự động — mỗi giao dịch mà bot thực hiện thay mặt bạn đều được tính. Bạn không cần làm gì đặc biệt. Bạn càng sử dụng nền tảng nhiều, hạng của bạn càng cao.
Một lưu ý nhanh về sự công bằng: bậc khối lượng được tính từ hoạt động giao dịch trên nền tảng của bạn, không phải kích thước ví. Một người dùng có vốn nhỏ hơn nhưng để bot giao dịch đều đặn sẽ thăng bậc nhanh hơn người gửi số dư lớn rồi để yên. Đây là chủ ý — chúng tôi muốn thưởng cho những người thực sự sử dụng WeatherBot như được thiết kế.
Lộ trình
Không có lời hứa về ngày chính xác — đây là kỹ thuật nghiêm túc, và chúng tôi sẽ không vội vàng đưa nó vào sản xuất. Nhưng đây là lộ trình trung thực:
- Bây giờ: Đã cấp tài khoản Google Cloud, đã yêu cầu quyền truy cập sớm Vertex AI, đang xây dựng prototype shadow-mode dựa trên dữ liệu lịch sử.
- Vài tuần tới: Tái cấu trúc edge engine để xử lý các tập hợp xác suất. Ghi log song song cùng engine hiện tại.
- Các tuần tiếp theo: Shadow run trong production — các dự đoán WeatherNext 2 được ghi lại cho mọi thị trường, so sánh với các giải quyết thực tế, với các báo cáo hiệu chuẩn được công bố tại đây.
- Sau khi vượt qua các benchmark: Alpha kín cho người dùng Tier 1. Vòng phản hồi với đội kỹ thuật. Tinh chỉnh cuối cùng.
- Sau alpha: Triển khai theo giai đoạn qua Tier 2, rồi đến Tier 3.
Việc bạn có thể làm ngay bây giờ
Khối lượng giao dịch của bạn bắt đầu được tính hôm nay. Mỗi lệnh WeatherBot đặt thay bạn từ thời điểm này trở đi đều tính vào bậc WeatherNext 2 của bạn khi ra mắt. Đảm bảo bot đang chạy, vốn đã cấu hình và ví đã kết nối. Chúng tôi sẽ công bố ngưỡng khối lượng chính xác trong những tuần tới — nhưng những người dùng leo lên bảng xếp hạng sớm sẽ là những người đầu tiên bước vào bộ máy nâng cấp.