Trang chủ Bảng xếp hạng Bảng điều khiển

WeatherNext 2: Mô hình AI của Google DeepMind đến WeatherBot

Chúng tôi bắt đầu nâng cấp độ chính xác dự báo lớn nhất trong lịch sử WeatherBot: tích hợp WeatherNext 2 của Google DeepMind trực tiếp vào engine giao dịch. Nếu chúng tôi thành công, nó sẽ thay đổi cơ bản chất lượng của mọi edge mà bot của chúng tôi phát hiện — và do đó là kết quả dự kiến của mọi giao dịch mà nó thực hiện.

Bài viết này giải thích vì sao WeatherNext 2 quan trọng, so sánh với mô hình NOAA GFS truyền thống mà chúng tôi dựa vào hôm nay, việc tích hợp này thực sự khó đến đâu, và cách quyền truy cập sẽ được giới hạn theo khối lượng giao dịch trên nền tảng sau khi ra mắt.

WeatherNext 2 là gì?

WeatherNext 2 là mô hình dự báo tiên tiến nhất mà Google DeepMind từng phát hành. Ra mắt cuối năm 2025 và đã được dùng trong Google Search, Gemini, Pixel Weather và Google Maps, đây là một bước nhảy thế hệ trong dự báo thời tiết quy mô toàn cầu.

Thay vì giải các phương trình vật lý chi phối khí quyển — cách tiếp cận mà NOAA GFS, mô hình ECMWF và mọi hệ thống truyền thống đã dùng hàng thập kỷ — WeatherNext 2 học hành vi khí quyển trực tiếp từ dữ liệu lịch sử hàng chục năm. Nó được xây dựng trên một kiến trúc hoàn toàn mới có tên Mạng tạo sinh hàm (FGN), vốn tiêm nhiễu được kiểm soát trực tiếp vào mô hình để mọi dự báo mà nó tạo ra vẫn nhất quán về mặt vật lý và mạch lạc nội tại trên các biến số.

Tạo nhanh hơn 8 lần

Một dự báo ensemble đầy đủ mất chưa đến một phút trên một TPU đơn lẻ. Các mô hình dựa trên vật lý cần nhiều giờ trên siêu máy tính để cho ra cùng kết quả.

99,9% biến được cải thiện

Vượt qua trạng thái tiên tiến trước đó trên 99,9% các biến số (nhiệt độ, gió, độ ẩm, áp suất, lượng mưa) và mọi khoảng dự báo từ 0 đến 15 ngày.

Độ phân giải 1 giờ

Dự báo theo giờ làm mới bốn lần mỗi ngày — chi tiết hơn rất nhiều so với độ phân giải gốc 3-6 giờ của GFS cho các khoảng thời gian chúng tôi giao dịch.

Hàng trăm kịch bản

Tạo ra ensemble xác suất gồm hàng trăm tương lai khả dĩ trong dưới một phút, cho chúng tôi một phân phối thực sự — không phải một dự đoán xác định duy nhất.

Vì sao chính xác hơn NOAA GFS

Global Forecast System của NOAA là một công trình kỹ thuật phi thường — nhưng được thiết kế trong thời đại trước deep learning, và những giới hạn của mô hình dựa trên vật lý đã rõ ràng từ nhiều năm nay. Có lý do để ECMWF lịch sử vượt GFS khoảng một ngày kỹ năng dự báo, và vì sao gần như mọi nhà cung cấp thời tiết lớn đã âm thầm xếp AI lên trên stack truyền thống của họ.

Đây là chỗ WeatherNext 2 vượt GFS — đặc biệt ở các loại dự báo nhiệt độ ngắn đến trung hạn, là động lực của hợp đồng thời tiết Polymarket:

  • Mô hình khí quyển học được so với phương trình được giải — GFS xấp xỉ khí quyển bằng cách rời rạc hóa thành lưới và giải Navier-Stokes ở mỗi bước thời gian. Những xấp xỉ đó tích lũy theo thời gian. WeatherNext 2 đã học toàn bộ hành vi phi tuyến của khí quyển từ dữ liệu reanalysis ERA5, nên không tích lũy cùng loại lỗi số đó.
  • Đầu ra xác suất nguyên bản — GFS cho bạn một dự báo cho mỗi lần chạy. Để có một phân phối, bạn cần GEFS (ensemble), điều này thêm chi phí và độ trễ. WeatherNext 2 xuất phân phối đầy đủ nguyên bản, nên chúng tôi thấy xác suất thực sự rằng một thành phố đạt 14°C, không chỉ là một ước lượng điểm mà chúng tôi phải tự bọc bằng Bayesian.
  • Độ phân giải hiệu dụng cao hơn — WeatherNext 2 tạo ra các dự báo toàn cầu theo giờ. GFS hoạt động ở độ phân giải ngang 13km với đầu ra 3 giờ cho phạm vi giao dịch của chúng tôi. Đối với các hợp đồng tối đa hằng ngày và tối thiểu hằng ngày theo thành phố cụ thể, độ chi tiết thời gian thêm đó là một edge thực sự.
  • Tốt hơn ở phần đuôi phân phối — các điểm chuẩn của DeepMind cho thấy lợi nhuận lớn nhất trên các sự kiện xác suất thấp, tác động lớn: đợt lạnh đột ngột, vòm nhiệt, bão. Đây chính xác là những thị trường nơi các đuôi định giá sai tồn tại và là nơi các giao dịch lớn nhất của chúng tôi đến từ đó.
  • Các ensemble nhất quán về vật lý — kiến trúc FGN có nghĩa là mọi kịch bản trong ensemble đều nhất quán nội tại (một kịch bản nhiều gió cũng có gradient áp suất tương ứng). Đây là điều khiến các xác suất có thể sử dụng được cho việc định giá.

Với khoảng 0-3 ngày chiếm phần lớn các thị trường thời tiết Polymarket, các đánh giá độc lập xếp các mô hình AI hiện đại ở cùng đẳng cấp — và thường vượt — IFS chủ lực của ECMWF, vốn đã vượt GFS đáng kể. Diễn giải đại khái: vài phần mười độ RMSE cho nhiệt độ tối đa hằng ngày ở mốc 48 giờ, và hiệu chỉnh chặt chẽ hơn rõ rệt ở các sự kiện hiếm.

Vì sao điều này thay đổi kết quả giao dịch

Toàn bộ lợi thế của WeatherBot đến từ một bước máy móc: ước lượng xác suất thực của khoảng nhiệt độ chính xác hơn mức mà thị trường Polymarket đang định giá. Mọi thứ phía sau — quyết định YES/NO của Claude, sizing Kelly, logic thoát lệnh, trailing stop — đều dựa trên ước lượng xác suất đó.

Hôm nay chúng tôi ensemble GFS, ECMWF, UKMO và NWS, kết hợp Bayesian với khí hậu lịch sử NCEI và áp dụng CDF chuẩn lên phân phối lỗi dự báo để có xác suất. Nó hoạt động. Nhưng về cơ bản bị giới hạn bởi độ chính xác của các mô hình nền tảng.

Thay thế ước lượng xác suất đó bằng WeatherNext 2 làm tín hiệu chính có những hiệu ứng rất cụ thể:

  • Phát hiện lợi thế sắc nét hơn. Cải thiện nửa độ trong RMSE dự báo trực tiếp chuyển thành 1-3% edge có thể phát hiện thêm trên các thị trường borderline hiện đang bị lọc bởi ngưỡng 2% của chúng tôi. Nhiều tín hiệu hơn đến được Claude.
  • Hiệu chỉnh tốt hơn. Khi chúng tôi nói "xác suất YES 78%", nó phải thực sự kết thúc ở mức 78% trên một mẫu lớn. Đầu ra xác suất nguyên bản của WeatherNext 2 được hiệu chuẩn tốt hơn đáng kể so với bất cứ thứ gì chúng tôi có thể tổng hợp từ các mô hình xác định.
  • Ít lệnh thảm khốc ở phần đuôi hơn. Hiệu suất mạnh hơn của mô hình trên các sự kiện hiếm có nghĩa là chúng tôi định giá sai phần đuôi dày ít hơn — lịch sử là loại tổn thất bất ngờ lớn nhất của chúng tôi.
  • Vòng quay mô hình nhanh hơn. Chu trình lấy dự báo hiện tại của chúng tôi bị giới hạn độ trễ bởi các API thời tiết miễn phí có giới hạn tốc độ. Chạy WeatherNext 2 qua Vertex AI của Google Cloud nghĩa là chúng tôi có thể làm mới dự báo theo lịch của mình, không theo lịch của họ.

Vì sao đây là vấn đề khó

Chúng tôi muốn nói thẳng: đây là công việc kỹ thuật khó nhất mà chúng tôi đảm nhận kể từ khi di chuyển hạ tầng v2. "Cắm vào một mô hình mới" không bao giờ đơn giản như nghe có vẻ, và WeatherNext 2 nói riêng có một số cạnh sắc.

1
Truy cập dữ liệu & đường ống
Dự báo WeatherNext 2 được phân phối qua Earth Engine, BigQuery và Vertex AI. Không cái nào là bản thay thế plug-and-play cho các endpoint HTTP miễn phí mà chúng tôi đang dùng. Chúng tôi cần auth, quản lý hạn ngạch, kiểm soát chi phí và một lớp cache phân bổ các cuộc gọi inference trả phí cho hơn 97 tổ hợp thành phố/ngày đang hoạt động.
2
Tích hợp đầu ra xác suất
Bộ tính lợi thế của chúng tôi được thiết kế xoay quanh một dự báo điểm xác định duy nhất cộng với mô hình lỗi Gaussian. WeatherNext 2 cung cấp một ensemble đầy đủ gồm hàng trăm kịch bản cho mỗi thành phố. Đấu lại bộ máy lợi thế để xử lý phân phối thực nghiệm thực sự (thay vì giả lập) đòi hỏi phải viết lại lõi của engine/edge.js và tinh chỉnh lại mọi ngưỡng mà Claude sử dụng.
3
Nội suy lưới sang điểm thành phố
WeatherNext 2 xuất ra lưới toàn cầu. Hợp đồng thời tiết Polymarket được giải quyết tại các trạm thời tiết được đặt tên cụ thể (ví dụ LaGuardia cho NYC, Heathrow cho London). Chúng ta cần nội suy bilinear hoặc nearest-station chính xác từ lưới gốc của mô hình đến trạm giải quyết chính xác — và sau đó downscale cho hiệu ứng vi khí hậu địa phương khi liên quan.
4
Chi phí mỗi dự báo
Mỗi tổ hợp thành phố/ngày chúng tôi giám sát trở thành một cuộc gọi inference Vertex AI có phí. Với khoảng 1.975 thị trường thời tiết hoạt động trên khoảng 97 tổ hợp duy nhất, triển khai ngây thơ sẽ đốt ngân sách rất nhanh. Chúng tôi đang xây dựng chiến lược làm mới phân tầng: các thị trường niềm tin cao được cập nhật thường xuyên, các thành phố khối lượng thấp được cập nhật chậm hơn.
5
Tương thích ngược
Chúng tôi không vứt bỏ GFS/ECMWF/UKMO/NWS. Kiến trúc cuối cùng dùng WeatherNext 2 làm tín hiệu chính với các mô hình truyền thống làm kiểm tra hợp lý. Nếu WeatherNext 2 không đồng ý mạnh mẽ với các mô hình vật lý, sự bất đồng đó tự nó trở thành đặc trưng để Claude lập luận — không phải lý do để tin một bên một cách mù quáng.
6
Xác thực ngoài mẫu
Trước khi gạt công tắc, chúng tôi phải chạy WeatherNext 2 ở chế độ shadow song song với bot trực tiếp trong nhiều tuần — ghi lại nó sẽ dự đoán gì cho từng thị trường, rồi so sánh với kết quả thực tế. Một mô hình đạt benchmark đẹp trên dữ liệu reanalysis ERA5 vẫn phải tự chứng minh chỗ đứng của mình trong vòng giao dịch sản xuất có tiền thật.

Cải thiện độ chính xác kỳ vọng

Dựa trên các điểm chuẩn được công bố của DeepMind và mô hình nội bộ của riêng chúng tôi về cách sai số dự báo lan truyền qua bộ tính toán edge của chúng tôi, đây là nơi chúng tôi mong đợi hiệu suất WeatherBot sẽ di chuyển khi tích hợp được triển khai:

RMSE nhiệt độ (chân trời 48 giờ)
−28%
Mức giảm dự kiến trong sai số dự báo ở mốc 2 ngày — chân trời nơi phần lớn các giao dịch của chúng tôi được giải quyết.
Hiệu chỉnh xác suất (điểm Brier)
+18%
Xác suất được hiệu chuẩn tốt hơn có nghĩa là các mức độ tin cậy của Claude thực sự khớp với thực tế, điều này trực tiếp cải thiện Kelly sizing.
Độ chính xác sự kiện đuôi (lạnh/nóng cực đoan)
+40%
Lợi nhuận lớn nhất nằm ở các sự kiện hiếm — chính là nơi thị trường định giá sai nhiều nhất và là nơi các chiến thắng lớn nhất của chúng tôi tồn tại.
Edge phát hiện được mỗi lần quét
+35%
Các dự báo sắc nét hơn đẩy nhiều thị trường vượt ngưỡng edge 2% của chúng tôi, cung cấp cho Claude nhiều tín hiệu chất lượng cao hơn để đánh giá.

Truy cập: ngưỡng theo khối lượng cho người dùng trung thành

Chúng ta cần thành thật về kinh tế ở đây. Inference WeatherNext 2 qua Vertex AI không miễn phí, và công việc hạ tầng đại diện cho khoản đầu tư kỹ thuật đáng kể. Chúng tôi không thể trao nó cho tất cả mọi người ngay từ ngày đầu — và thẳng thắn mà nói, chúng tôi không muốn. Những người dùng đã thực sự xây dựng WeatherBot thành như hôm nay nên là những người đầu tiên có nó.

Khi WeatherNext 2 ra mắt, quyền truy cập sẽ bị giới hạn theo khối lượng giao dịch trên nền tảng. Khối lượng giao dịch tích lũy của bạn — mỗi đô la USDC mà bạn đã triển khai thông qua WeatherBot vào các thị trường Polymarket — trở thành đơn vị tiền tệ mở khóa engine nâng cấp. Bạn càng giao dịch nhiều, quyền truy cập của bạn càng sớm và sâu hơn.

Cách hoạt động của các bậc khối lượng

Các ngưỡng tier cuối cùng sẽ được công bố gần thời điểm ra mắt, nhưng cấu trúc đã được chốt:

  • Tier 1 — người đồng sáng lập: nhóm có khối lượng tích lũy cao nhất nhận được làn sóng đầu tiên của quyền truy cập WeatherNext 2 trong giai đoạn alpha kín. Đầu ra ensemble đầy đủ, tốc độ làm mới cao nhất, kênh phản hồi trực tiếp đến đội kỹ thuật.
  • Tier 2 — người dùng nâng cao: đợt thứ hai trong giai đoạn beta. Tín hiệu WeatherNext 2 đầy đủ với tốc độ làm mới giảm nhẹ.
  • Tier 3 — trader hoạt động tích cực: triển khai chung với WeatherNext 2 như một bổ sung cho stack GFS/ECMWF/UKMO/NWS hiện tại.
  • Dưới ngưỡng: tiếp tục trên stack đa mô hình hiện tại, vẫn được hỗ trợ đầy đủ và bản thân nó cũng đang được cải tiến một cách độc lập.

Khối lượng giao dịch của bạn được theo dõi tự động — mỗi giao dịch mà bot thực hiện thay mặt bạn đều được tính. Bạn không cần làm gì đặc biệt. Bạn càng sử dụng nền tảng nhiều, hạng của bạn càng cao.

Một lưu ý nhanh về sự công bằng: bậc khối lượng được tính từ hoạt động giao dịch trên nền tảng của bạn, không phải kích thước ví. Một người dùng có vốn nhỏ hơn nhưng để bot giao dịch đều đặn sẽ thăng bậc nhanh hơn người gửi số dư lớn rồi để yên. Đây là chủ ý — chúng tôi muốn thưởng cho những người thực sự sử dụng WeatherBot như được thiết kế.

Lộ trình

Không có lời hứa về ngày chính xác — đây là kỹ thuật nghiêm túc, và chúng tôi sẽ không vội vàng đưa nó vào sản xuất. Nhưng đây là lộ trình trung thực:

  • Bây giờ: Đã cấp tài khoản Google Cloud, đã yêu cầu quyền truy cập sớm Vertex AI, đang xây dựng prototype shadow-mode dựa trên dữ liệu lịch sử.
  • Vài tuần tới: Tái cấu trúc edge engine để xử lý các tập hợp xác suất. Ghi log song song cùng engine hiện tại.
  • Các tuần tiếp theo: Shadow run trong production — các dự đoán WeatherNext 2 được ghi lại cho mọi thị trường, so sánh với các giải quyết thực tế, với các báo cáo hiệu chuẩn được công bố tại đây.
  • Sau khi vượt qua các benchmark: Alpha kín cho người dùng Tier 1. Vòng phản hồi với đội kỹ thuật. Tinh chỉnh cuối cùng.
  • Sau alpha: Triển khai theo giai đoạn qua Tier 2, rồi đến Tier 3.

Việc bạn có thể làm ngay bây giờ

Khối lượng giao dịch của bạn bắt đầu được tính hôm nay. Mỗi lệnh WeatherBot đặt thay bạn từ thời điểm này trở đi đều tính vào bậc WeatherNext 2 của bạn khi ra mắt. Đảm bảo bot đang chạy, vốn đã cấu hình và ví đã kết nối. Chúng tôi sẽ công bố ngưỡng khối lượng chính xác trong những tuần tới — nhưng những người dùng leo lên bảng xếp hạng sớm sẽ là những người đầu tiên bước vào bộ máy nâng cấp.

Read next

We Are Thrilled to Announce Two Brand-New Games: Storm Spin and Storm Bet

Read article →

Hong Kong Trades Are Now More Accurate Than Ever: We Plugged the Engine Straight Into the Source That Settles the Market

Read article →

WeatherBot by the Numbers: 9,592 Traders, $2.87M in Member Profit, and Exactly What It Costs to Run

Read article →
← All articles