WeatherBot giờ học từ chính những lỗi của mình — bộ máy trí tuệ tự cải tiến
Hầu hết các bot giao dịch là tĩnh. Chúng chạy cùng một logic hôm nay như chúng đã chạy vào ngày đầu tiên. Nếu chúng thực hiện một giao dịch xấu, chúng sẽ vui vẻ thực hiện chính xác giao dịch xấu đó một lần nữa vào ngày mai. Chúng tôi quyết định điều đó là chưa đủ tốt.
Kể từ hôm nay, WeatherBot có một engine tự cải tiến — một hệ thống gồm năm mô-đun kết nối với nhau liên tục theo dõi, phân tích và học hỏi từ từng giao dịch mà bot thực hiện. Bot thực sự trở nên thông minh hơn theo thời gian, điều chỉnh chiến lược dựa trên kết quả thực tế, không chỉ các mô hình lý thuyết.
Đây là cách hoạt động chính xác của từng mô-đun:
1. Trình theo dõi kết quả giao dịch & máy tính tỷ lệ thắng
Mỗi lệnh thoát — qua stop-loss, mục tiêu lợi nhuận, hoặc giải quyết thị trường — được ghi nhận vĩnh viễn với toàn bộ ngữ cảnh: câu hỏi thị trường, giá vào, giá thoát, thành phố nào, ngày nào, chế độ giao dịch nào đang hoạt động, các mô hình dự báo đã dự đoán gì và P&L cuối cùng.
Từ dữ liệu này, engine tính tỷ lệ thắng thời gian thực được phân tách theo thành phố, chế độ giao dịch, khoảng giá vào, và time period. Chỉ sau vài ngày giao dịch, các mô hình bắt đầu xuất hiện. Có thể bot thắng 85% các lệnh London nhưng chỉ 45% Seoul. Có thể nó cực kỳ hiệu quả với entry dưới 15¢ nhưng kém trên 40¢. Đây không phải linh cảm — đó là những con số thực từ giao dịch thật, đưa thẳng vào quyết định tiếp theo của Claude.
2. Vòng phản hồi sau khi giải quyết — theo dõi độ chính xác của mô hình
Đây là khoa học khí tượng thuần túy. Sau khi mỗi thị trường được giải quyết, engine ghi lại những gì mỗi mô hình thời tiết đã dự đoán so với những gì thực sự đã xảy ra. Theo thời gian, điều này xây dựng một cơ sở dữ liệu độ chính xác mô hình theo thành phố.
Kết quả? Sau 30 ngày dữ liệu, bot có thể biết rằng "ECMWF nhất quán ấm hơn 0,8°C cho Seoul vào tháng 3" hoặc "GFS lạnh hơn 1,2°C cho Miami vào mùa hè." Các thiên lệch hệ thống này được tự động đưa vào tính toán đồng thuận. Không có bot giao dịch thời tiết nào khác có điều này — hầu hết đều coi tất cả các mô hình như nhau bất kể thành tích cho một thành phố và mùa cụ thể.
3. Claude tự đánh giá các giao dịch của mình — phân tích sau giao dịch bằng AI
Đây là mô-đun mạnh mẽ nhất. Cứ mỗi 30 phút, bot xem xét các giao dịch thua lỗ gần đây của nó và gửi từng giao dịch trở lại Claude với một câu hỏi đơn giản: "Đã sai ở đâu?"
Claude xem xét lệnh trong nhìn lại — dữ liệu dự báo có sẵn, giá vào lệnh, kết quả thực tế — và viết một bài hậu kỳ ngắn gọn: sai lầm là gì và một quy tắc khả thi để tránh lặp lại trong tương lai. Những bài học này tích lũy thành một "playbook" được tiêm vào mỗi prompt AI tương lai.
Sau 100 lệnh, Claude về cơ bản đã viết cuốn sổ tay giao dịch của riêng mình dựa trên kinh nghiệm thực tế. Ví dụ bài học chúng tôi thấy trong thử nghiệm:
- "Tránh BUY_YES trên 30¢ ở các thành phố châu Á — thị trường thường đã hiệu quả ở mức giá đó"
- "Khi GFS và ECMWF chênh lệch hơn 2°C, luôn SKIP — độ bất định quá cao"
- "Nhiệt độ ở Seoul vào tháng 3 luôn thấp hơn dự đoán đồng thuận của các mô hình — áp dụng hiệu chỉnh -1°C"
4. Hiệu chỉnh độ tin cậy của AI
Khi Claude nói rằng một giao dịch có độ tin cậy "VERY_HIGH", thực tế nó thắng bao nhiêu lần? Mô-đun này theo dõi câu trả lời chính xác. Mức độ tin cậy của mỗi giao dịch được ghi lại cùng với kết quả của nó, xây dựng một bảng hiệu chỉnh:
HIGH: tỷ lệ thắng thực tế 58,1% (36/62 giao dịch)
MEDIUM: tỷ lệ thắng thực tế 41,2% (14/34 giao dịch)
LOW: tỷ lệ thắng thực tế 25,0% (3/12 giao dịch)
Dữ liệu này được tiêm trực tiếp vào prompt của Claude. Nếu Claude thấy rằng các quyết định VERY_HIGH của mình chỉ thắng 60%, nó sẽ tự nhiên trở nên chọn lọc hơn — chỉ dành VERY_HIGH cho các kết quả thực sự chắc chắn. Độ tin cậy của AI trở nên thực sự có ý nghĩa thay vì tùy tiện, điều này trực tiếp cải thiện định cỡ lệnh (vì các cược lớn hơn được đặt ở các mức độ tin cậy cao hơn).
5. Bối cảnh hiệu suất luân phiên — nhận diện mẫu
Mỗi phân tích AI giờ đây nhận được bản tóm tắt hiệu suất 7 ngày luân phiên, hiển thị:
- Hồ sơ thắng/thua tổng thể và P&L ròng
- Các thành phố hiệu suất tốt nhất (nơi bot thắng đều đặn)
- Các thành phố hiệu suất kém nhất (nơi nên giao dịch thận trọng hoặc tránh)
- Tỷ lệ thắng theo phạm vi giá vào (<15¢, 15-40¢, >40¢)
Claude tự nhiên điều chỉnh hành vi dựa trên ngữ cảnh này. Nếu các lệnh ở London đang trên chuỗi 9 thắng, nó nghiêng vào cơ hội London quyết liệt hơn. Nếu Seoul đã thua liên tục, nó đặt ngưỡng cao hơn trước khi đề xuất các lệnh Seoul. Chiến lược của bot tiến hóa hằng ngày dựa trên những gì thực sự hiệu quả.
Hiệu ứng cộng dồn
Năm mô-đun này không hoạt động độc lập — chúng cộng hưởng. Kết quả lệnh đưa vào dữ liệu hiệu chuẩn. Dữ liệu hiệu chuẩn điều chỉnh mức độ tin cậy. Mức độ tin cậy được điều chỉnh thay đổi định cỡ vị thế. Hậu kỳ tạo ra bài học. Bài học ngăn chặn sai lầm lặp lại. Theo dõi thiên lệch mô hình hiệu chỉnh dự báo. Dự báo tốt hơn cải thiện tỷ lệ thắng. Tỷ lệ thắng tốt hơn cộng hưởng thành nhiều lợi nhuận hơn. Bot chạy trong 30 ngày về cơ bản thông minh hơn bot chỉ chạy trong 3 ngày. Đây là tính năng quan trọng nhất của WeatherBot — và đã hoạt động ngay bây giờ.