WeatherBot เรียนรู้จากความผิดพลาดของตัวเองแล้ว — เครื่องยนต์อัจฉริยะที่พัฒนาตัวเอง
บอทเทรดส่วนใหญ่เป็นแบบสแตติก พวกมันรันลอจิกแบบเดียวกันในวันนี้กับที่รันในวันแรก หากพวกมันทำเทรดที่ไม่ดี พวกมันจะยินดีทำเทรดที่ไม่ดีแบบเดียวกันอีกในวันพรุ่งนี้ เราตัดสินใจว่านั่นยังไม่ดีพอ
ตั้งแต่วันนี้เป็นต้นไป WeatherBot มี เอนจินปรับปรุงตัวเอง — ระบบที่ประกอบด้วยห้าโมดูลที่เชื่อมต่อกันซึ่งติดตาม วิเคราะห์ และเรียนรู้จากทุกการเทรดที่บอททำอย่างต่อเนื่อง บอทฉลาดขึ้นเรื่อยๆ ตามเวลาอย่างแท้จริง โดยปรับกลยุทธ์ตามผลลัพธ์จริง ไม่ใช่แค่โมเดลทางทฤษฎี
นี่คือวิธีการทำงานที่แท้จริงของแต่ละโมดูล:
1. ตัวติดตามผลการเทรดและเครื่องคำนวณอัตราชนะ
ทุกออเดอร์ที่ออก — ไม่ว่าจะผ่าน stop-loss, เป้ากำไร, หรือการตัดสินของตลาด — จะถูกบันทึกถาวรพร้อมบริบทเต็มรูปแบบ: คำถามตลาด, ราคาเข้า, ราคาออก, เมืองใด, วันที่ใด, โหมดเทรดใดที่ใช้งาน, โมเดลพยากรณ์คาดการณ์อะไร และ P&L สุดท้าย
จากข้อมูลนี้ เอนจินคำนวณอัตราชนะแบบเรียลไทม์โดยแยกตาม เมือง, โหมดการเทรด, ช่วงราคาเข้า, และ time period. หลังจากเทรดเพียงไม่กี่วัน รูปแบบก็เริ่มปรากฏ บอทอาจชนะ 85% ของออเดอร์ที่ลอนดอน แต่ชนะแค่ 45% ของออเดอร์ที่โซล มันอาจทำผลงานยอดเยี่ยมในการเข้าออเดอร์ต่ำกว่า 15¢ แต่แย่เมื่อเกิน 40¢ นี่ไม่ใช่ลางสังหรณ์ — เป็นตัวเลขแข็งจากออเดอร์จริง และส่งเข้าสู่การตัดสินใจถัดไปของ Claude โดยตรง
2. ลูปข้อเสนอแนะหลังการชำระ — การติดตามความแม่นยำของโมเดล
นี่คือวิทยาศาสตร์อุตุนิยมวิทยาบริสุทธิ์ หลังจากที่แต่ละตลาดได้รับการชำระ เอ็นจินจะบันทึกว่าโมเดลสภาพอากาศแต่ละโมเดลทำนายอะไรเทียบกับสิ่งที่เกิดขึ้นจริง เมื่อเวลาผ่านไป สิ่งนี้สร้าง ฐานข้อมูลความแม่นยำของโมเดลแยกตามเมือง.
ผลลัพธ์? หลังจาก 30 วันของข้อมูล บอทอาจรู้ว่า "ECMWF เดินอุ่นเกินไป 0.8°C อย่างต่อเนื่องสำหรับโซลในเดือนมีนาคม" หรือ "GFS เย็นเกินไป 1.2°C สำหรับไมอามีในฤดูร้อน" ความเอนเอียงเชิงระบบเหล่านี้ถูกนำเข้าสู่การคำนวณค่าเฉลี่ยโดยอัตโนมัติ ไม่มีบอทเทรดสภาพอากาศอื่นใดมีสิ่งนี้ — ส่วนใหญ่จัดการกับทุกโมเดลอย่างเท่าเทียมโดยไม่คำนึงถึงผลงานสำหรับเมืองและฤดูกาลใดเฉพาะ
3. Claude ประเมินการเทรดของตัวเอง — การวิเคราะห์ย้อนหลังด้วย AI
นี่คือโมดูลที่ทรงพลังที่สุด ทุก 30 นาที บอทจะตรวจสอบการเทรดที่แพ้เมื่อเร็วๆ นี้และส่งแต่ละครั้งกลับไปยัง Claude พร้อมคำถามง่ายๆ: "อะไรผิดพลาด?"
Claude ตรวจสอบออเดอร์ย้อนหลัง — ข้อมูลพยากรณ์ที่มีในขณะนั้น ราคาที่เข้า ผลลัพธ์จริง — และเขียน post-mortem แบบกระชับ: ความผิดพลาดคืออะไรและกฎที่ทำได้จริงข้อหนึ่งเพื่อหลีกเลี่ยงในอนาคต บทเรียนเหล่านี้สะสมเป็น "playbook" ที่ถูกส่งเข้า prompt AI ในอนาคตทุกครั้ง
หลังจาก 100 ออเดอร์ Claude แทบจะเขียนคู่มือเทรดของตัวเองจากประสบการณ์จริง ตัวอย่างบทเรียนที่เราเห็นในการทดสอบ:
- "หลีกเลี่ยง BUY_YES ที่สูงกว่า 30¢ ในเมืองแถบเอเชีย — ตลาดมักมีประสิทธิภาพอยู่แล้วในระดับราคานี้"
- "เมื่อ GFS และ ECMWF ขัดแย้งกันมากกว่า 2°C ให้ SKIP เสมอ — ความไม่แน่นอนสูงเกินไป"
- "อุณหภูมิที่กรุงโซลในเดือนมีนาคมต่ำกว่าค่าฉันทามติของแบบจำลองอย่างสม่ำเสมอ — ปรับแก้ -1°C"
4. การปรับเทียบความมั่นใจของ AI
เมื่อ Claude บอกว่าการเทรดมีความมั่นใจ "VERY_HIGH" จริงๆ แล้วชนะบ่อยแค่ไหน? โมดูลนี้ติดตามคำตอบอย่างแม่นยำ ระดับความมั่นใจของทุกการเทรดจะถูกบันทึกพร้อมกับผลลัพธ์ ช่วยสร้างตารางการสอบเทียบ:
HIGH: อัตราชนะจริง 58.1% (36/62 ดีล)
MEDIUM: อัตราชนะจริง 41.2% (14/34 ดีล)
LOW: อัตราชนะจริง 25.0% (3/12 ดีล)
ข้อมูลนี้ถูกส่งเข้าสู่ prompt ของ Claude โดยตรง หาก Claude เห็นว่าการตัดสิน VERY_HIGH ของตัวเองชนะเพียง 60% ของเวลา มันจะกลายเป็นเลือกสรรมากขึ้นโดยธรรมชาติ — สงวน VERY_HIGH ไว้สำหรับผลลัพธ์ที่แน่นอนจริง ๆ ความเชื่อมั่นของ AI กลายเป็นมีความหมายอย่างแท้จริงแทนที่จะตามอำเภอใจ ซึ่งช่วยเพิ่มขนาดออเดอร์โดยตรง (เพราะการเดิมพันใหญ่ขึ้นถูกวางบนระดับความเชื่อมั่นที่สูงขึ้น)
5. บริบทประสิทธิภาพแบบหมุนเวียน — การรู้จำรูปแบบ
ทุกการวิเคราะห์ของ AI ตอนนี้จะได้รับสรุปประสิทธิภาพ 7 วันแบบหมุนเวียนที่แสดง:
- บันทึกชนะ/แพ้รวมและ P&L สุทธิ
- เมืองที่ทำผลงานดีที่สุด (ที่บอทชนะอย่างสม่ำเสมอ)
- เมืองที่ทำผลงานแย่ที่สุด (ที่ควรเทรดอย่างระมัดระวังหรือหลีกเลี่ยง)
- อัตราชนะตามช่วงราคาเข้า (<15¢, 15-40¢, >40¢)
Claude ปรับพฤติกรรมตามบริบทนี้โดยธรรมชาติ หากออเดอร์ลอนดอนอยู่ในสตรีค 9 ชนะ มันจะเอนเอียงเข้าหาโอกาสในลอนดอนอย่างรุกมากขึ้น หากโซลแพ้อย่างต่อเนื่อง มันจะตั้งเกณฑ์สูงขึ้นก่อนแนะนำออเดอร์ในโซล กลยุทธ์ของบอทพัฒนารายวันตามสิ่งที่ใช้ได้จริง
ผลกระทบแบบทบต้น
ห้าโมดูลนี้ไม่ทำงานแยกกัน — พวกมันทบต้น ผลออเดอร์เข้าสู่ข้อมูลการปรับเทียบ ข้อมูลการปรับเทียบปรับระดับความเชื่อมั่น ระดับความเชื่อมั่นที่ปรับแล้วเปลี่ยนขนาดโพซิชัน Post-mortem สร้างบทเรียน บทเรียนป้องกันความผิดพลาดซ้ำ การติดตามความเอนเอียงของโมเดลแก้ไขการพยากรณ์ การพยากรณ์ที่ดีขึ้นช่วยเพิ่มอัตราชนะ อัตราชนะที่ดีขึ้นทบต้นเป็นกำไรมากขึ้น บอตที่ทำงานต่อเนื่อง 30 วันฉลาดกว่าบอตที่ทำงานเพียง 3 วันโดยพื้นฐาน นี่คือฟีเจอร์ที่สำคัญที่สุดของ WeatherBot — และใช้งานได้แล้วในตอนนี้