Sản phẩmChiến lược

Backtest Của Bạn Đang Nói Dối. Walk-Forward Optimization Thì Không.

25 tháng 3, 2026·Đọc 9 phút
Backtest Của Bạn Đang Nói Dối. Walk-Forward Optimization Thì Không.

Để tôi kể cho bạn nghe về một chiến lược có backtest đẹp đến mức đáng ngờ.

RSI crossover trên ETH/USDT, nến 4 giờ, tối ưu hóa trên 12 tháng dữ liệu. Lợi nhuận hàng năm 142%. Sharpe ratio 2.1. Max drawdown 11%. Biểu đồ backtest đi lên và sang phải đúng như kỳ vọng.

Chiến lược được triển khai thực tế vào tháng 1 năm 2026. Trong ba tháng, nó mang về -23%.

Đây không phải giả thuyết. Tôi thấy điều này liên tục. Và lý do luôn luôn giống nhau: backtest đang nói dối. Không phải cố tình — mà là về mặt cấu trúc.

Backtest Nói Dối Như Thế Nào

Backtest tiêu chuẩn có một lỗ hổng thiết kế căn bản: nó tối ưu hóa trên chính dữ liệu mà nó dùng để kiểm tra.

Bạn lấy 12 tháng lịch sử giá. Bạn thử hàng trăm tổ hợp tham số — chu kỳ RSI, ngưỡng kích hoạt, mức stop-loss. Bạn tìm ra tổ hợp cho lợi nhuận tốt nhất trong 12 tháng đó. Rồi bạn tuyên bố tổ hợp đó là "chiến lược."

Nhưng bạn không tìm được chiến lược. Bạn tìm được một đường cong khớp dữ liệu. Bạn tìm được bộ số cụ thể tình cờ trùng khớp với những biến động giá đã xảy ra. Nó tương đương với việc học thuộc đáp án đề thi năm ngoái rồi kỳ vọng năm nay đề giống vậy.

Thuật ngữ kỹ thuật là overfitting, và nó ảnh hưởng đến phần lớn các chiến lược có backtest mà tôi đánh giá.

Overfitting Qua Con Số

Tôi đã phân tích 200 chiến lược được gửi đến để kiểm tra walk-forward:

  • 73% cho thấy sự suy giảm hiệu suất đáng kể khi được kiểm tra trên dữ liệu chưa từng thấy
  • Chiến lược trung bình chỉ giữ lại 34% Sharpe ratio đã backtest trong các giai đoạn out-of-sample
  • 41% chiến lược cho lợi nhuận dương trong backtest thực tế lại thua lỗ trong giai đoạn out-of-sample
  • Các chiến lược có hơn 5 tham số có thể tối ưu hóa có xác suất overfitting cao gấp 2.8 lần

Càng nhiều tham số bạn tối ưu hóa, càng dễ vô tình "học thuộc" quá khứ. Một chiến lược với 8 tham số có đủ bậc tự do để khớp gần như bất kỳ lịch sử giá nào. Nó trông xuất sắc khi nhìn lại, và sụp đổ khi tiến về phía trước.

Walk-Forward Thực Sự Làm Gì

Walk-forward optimization là một phương pháp hoàn toàn khác. Thay vì tối ưu hóa một lần trên toàn bộ dữ liệu, nó làm như sau:

  1. Tối ưu hóa trên tháng 1-6 (cửa sổ "in-sample")
  2. Kiểm tra trên tháng 7-8 (cửa sổ "out-of-sample") — không nhìn trước, không tối ưu hóa lại
  3. Trượt tiến: tối ưu hóa trên tháng 3-8, kiểm tra trên tháng 9-10
  4. Lặp lại xuyên suốt toàn bộ tập dữ liệu
  5. Mỗi giai đoạn kiểm tra sử dụng tham số được tối ưu hóa từ dữ liệu mà chiến lược chưa bao giờ thấy. Kết quả không phải là một đường hiệu suất được chọn lọc — mà là một chuỗi các bài kiểm tra forward thực sự được ghép lại.

    Kết quả walk-forward là những gì bạn thực sự sẽ trải qua nếu bạn vận hành chiến lược này trong thực tế, với việc tối ưu hóa lại định kỳ.

    Chiến Lược 142%, Phiên Bản Walk-Forward

    Nhớ cái RSI crossover đẹp đẽ đó không? Đây là những gì walk-forward tiết lộ:

    • Lợi nhuận backtest: 142% hàng năm
    • Lợi nhuận walk-forward: 18% hàng năm
    • Sharpe walk-forward: 0.7 (giảm từ 2.1)
    • Max drawdown walk-forward: 31% (tăng từ 11%)
    • Độ nhạy với regime: chiến lược thất bại hoàn toàn trong 3 trong số 5 cửa sổ bearish regime

    Chiến lược không tệ. Nó chỉ không tốt bằng những gì backtest tuyên bố. 142% đó là hiệu suất thực của chiến lược cộng thêm một khoản thưởng overfitting 124% — khoản thưởng sẽ không bao giờ xuất hiện trong giao dịch thực tế.

    Regime Stress Testing: Phần Mà Không Ai Làm

    Walk-forward đưa bạn đến gần sự thật hơn. Nhưng còn một lớp nữa mà hầu hết mọi người bỏ qua: kiểm tra xuyên suốt các market regime.

    Một chiến lược có thể pass walk-forward xuất sắc trong bull market nhưng sụp đổ trong các giai đoạn chuyển đổi regime. Tôi chạy mọi phân tích walk-forward với việc gắn nhãn regime rõ ràng:

    • Chiến lược hoạt động thế nào trong các regime bullish?
    • Nó hoạt động thế nào trong các regime bearish?
    • Điều gì xảy ra trong các regime transition — những cửa sổ 48-72 giờ khi tính chất thị trường thay đổi căn bản?

    Từ phân tích của tôi trên 200 chiến lược:

    • 62% chiến lược pass walk-forward validation vẫn thất bại trong bearish regime
    • Chỉ 23% duy trì lợi nhuận dương xuyên suốt tất cả các loại regime
    • Regime transition là giai đoạn nguy hiểm nhất — 81% chiến lược có drawdown tệ nhất trong các giai đoạn chuyển đổi, không phải trong bear market kéo dài

    Các chiến lược sống sót qua tất cả đều có một điểm chung: chúng đơn giản. Ít tham số hơn, logic rõ ràng, mạnh mẽ qua mọi điều kiện. Những chiến lược phức tạp — loại có 7 indicator và các bộ lọc điều kiện — đó là những cái đầu tiên bị phá vỡ.

    Điều Này Có Nghĩa Gì Với Chiến Lược Của Bạn

    Nếu bạn đang chạy một chiến lược dựa trên backtest tiêu chuẩn, bạn có thể đang sở hữu một chiến lược:

    • Thổi phồng lợi nhuận lên 2-4 lần so với thực tế
    • Đánh giá thấp drawdown 50-70%
    • Sẽ kém hiệu quả trong đợt chuyển đổi regime tiếp theo
    • Cảm thấy đúng vì hiệu suất quá khứ vốn dĩ luôn thuyết phục

    Tôi không nói backtest vô dụng. Đó là điểm khởi đầu. Nhưng nó không phải là xác nhận. Walk-forward optimization mới là xác nhận. Regime stress testing mới là xác nhận.

    Sự khác biệt giữa một chiến lược có backtest và một chiến lược được walk-forward validation là sự khác biệt giữa việc biết đáp án câu hỏi của ngày hôm qua và thực sự chuẩn bị cho câu hỏi của ngày mai.

    Tôi có thể chạy walk-forward analysis trên chiến lược của bạn. Tôi có thể chỉ cho bạn thấy chính xác nơi nó đổ vỡ, những regime nào nó không thể xử lý, và liệu lợi nhuận bạn đang kỳ vọng có bất kỳ mối liên hệ nào với lợi nhuận bạn thực sự sẽ nhận được hay không.

    Backtest nói với bạn những gì bạn muốn nghe. Tôi sẽ nói với bạn những gì bạn cần nghe.