Backtestingin Sana Yalan Söylüyor. Walk-Forward Optimizasyon Söylemiyor.

Sana güzel bir backtest sonucu çıkaran bir stratejiden bahsedeyim.
ETH/USDT üzerinde RSI crossover, 4 saatlik mum, 12 aylık veri üzerinde optimize edilmiş. Yıllık %142 getiri. Sharpe oranı 2.1. Maksimum düşüş %11. Backtest grafiği tam istediği gibi sağa ve yukarıya gidiyordu.
Strateji Ocak 2026'da canlıya alındı. Üç ayda -%23 getirdi.
Bu hayali bir senaryo değil. Bunu sürekli görüyorum. Ve sebebi her zaman aynı: backtest yalan söylüyordu. Kötü niyetle değil — yapısal olarak.
Backtesting Nasıl Yalan Söyler
Standart backtestingin temel bir tasarım hatası var: optimize ettiği veri üzerinde test yapıyor.
12 aylık fiyat geçmişini alıyorsun. Yüzlerce parametre kombinasyonunu deniyorsun — RSI periyotları, eşik değerleri, stop-loss seviyeleri. O 12 ay içinde en iyi getiriyi üreten kombinasyonu buluyorsun. Sonra o kombinasyona "strateji" diyorsun.
Ama bir strateji bulmadın. Bir eğri uydurması buldun. Zaten yaşanmış olan fiyat hareketleriyle örtüşen spesifik bir sayılar kümesi buldun. Geçen yılın sınav sorularını ezberleyip bu yılın sınavının aynı olmasını beklemek gibi.
Teknik adı overfitting — ve değerlendirdiğim stratejilerin büyük çoğunluğunu etkiliyor.
Rakamlarla Overfitting
Walk-forward analizine sunulan 200 strateji üzerinde bir çalışma yürüttüm:
- %73'ü, görünmemiş veri üzerinde test edildiğinde anlamlı performans düşüşü gösterdi
- Ortalama strateji, backtested Sharpe oranının yalnızca %34'ünü sample dışı dönemlerde korudu
- Pozitif backtest getirisi gösteren stratejilerin %41'i, sample dışında aslında negatif getiri üretti
- 5'ten fazla optimize edilebilir parametreye sahip stratejiler 2.8x daha fazla overfit olma eğilimi taşıyordu
Ne kadar çok parametre optimize edersen, geçmişi kazara ezberlemek o kadar kolaylaşır. 8 parametreli bir strateji, neredeyse her fiyat geçmişine uymaya yetecek kadar serbestlik derecesine sahiptir. Geçmişe bakıldığında parlak görünür ve ileriye gidildiğinde çöker.
Walk-Forward Gerçekte Ne Yapar
Walk-Forward optimizasyon, temelden farklı bir yaklaşım. Mevcut tüm veri üzerinde tek seferlik optimize etmek yerine şunları yapar:
- 1-6. ayları optimize et ("in-sample" penceresi)
- 7-8. ayları test et ("out-of-sample" penceresi) — gözetleme yok, yeniden optimizasyon yok
- İleriye kaydır: 3-8. ayları optimize et, 9-10. ayları test et
- Tüm veri seti boyunca tekrarla
- Backtested getiri: Yıllık %142
- Walk-forward getiri: Yıllık %18
- Walk-forward Sharpe: 0.7 (2.1'den düştü)
- Walk-forward maksimum düşüş: %31 (%11'den yükseldi)
- Rejim hassasiyeti: Strateji, 5 bearish rejim penceresinin 3'ünde tamamen başarısız oldu
- Strateji bullish rejimlerde nasıl performans gösterdi?
- Bearish rejimlerde nasıl performans gösterdi?
- Piyasa karakterinin köklü biçimde değiştiği rejim geçişlerinde — o 48-72 saatlik pencerelerde — ne oldu?
- Walk-forward doğrulamasını geçen stratejilerin %62'si, bearish rejimlerde yine de başarısız oldu
- Yalnızca %23'ü tüm rejim türlerinde pozitif getiriyi korudu
- Rejim geçişleri en tehlikeli dönemdi — stratejilerin %81'i en kötü düşüşlerini süregelen ayı piyasalarında değil, geçişlerde yaşadı
- Getirileri 2-4x abartıyor
- Düşüşleri %50-70 küçümsüyor
- Bir sonraki rejim değişiminde beklenenden kötü performans gösterecek
- Doğru hissettiriyor çünkü geçmiş performans tanım gereği ikna edici
Her test dönemi, stratejinin daha önce hiç görmediği veriler üzerinde optimize edilmiş parametreler kullanır. Sonuç, tek bir seçilmiş performans eğrisi değil — birbirine eklenmiş gerçek ileri testler serisi.
Walk-forward sonucu, bu stratejiyi gerçek zamanlı çalıştırıp periyodik olarak yeniden optimize etseydin gerçekten yaşayacağın sonuçtur.
142%'lik Strateji, Walk-Forward Versiyonu
O güzel RSI crossover'ı hatırlıyor musun? Walk-forward'un ortaya koyduğu şey:
Strateji kötü değildi. Sadece backtestin iddia ettiği kadar iyi değildi. %142, stratejinin performansıyla canlı işlemde hiç görünmeyecek %124'lük bir overfitting bonusunun toplamıydı.
Rejim Stres Testi: Kimsenin Yapmadığı Kısım
Walk-forward seni gerçeğe yaklaştırır. Ama çoğu insanın atladığı başka bir katman daha var: piyasa rejimleri boyunca test etmek.
Bir strateji, boğa piyasasında walk-forward testini güzelce geçebilir ama rejim geçişlerinde çöküverir. Her walk-forward analizini açık rejim etiketlemesiyle yürütüyorum:
200 strateji analizimden:
Her şeyden sağ çıkan stratejilerin ortak bir özelliği vardı: basitti. Daha az parametre, net mantık, koşullar ne olursa olsun sağlam. Karmaşık olanlar — 7 indikatörlü ve koşullu filtreli olanlar — ilk çökenler oldu.
Bu Senin Stratejin İçin Ne Anlama Geliyor
Standart bir backtest'e dayalı bir strateji yürütüyorsan, büyük ihtimalle elinde şu özelliklere sahip bir strateji var:
Backtestingin işe yaramaz olduğunu söylemiyorum. Bir başlangıç noktası. Ama doğrulama değil. Walk-forward optimizasyon doğrulamadır. Rejim stres testi doğrulamadır.
Backtested bir strateji ile walk-forward doğrulaması yapılmış bir strateji arasındaki fark; dünkü sorunun cevabını bilmek ile yarınınkine hazır olmak arasındaki farktır.
Stratejine walk-forward analizi uygulayabilirim. Tam olarak nerede bozulduğunu, hangi rejimleri kaldıramadığını ve beklediğin getirilerin alacağın getirilerle herhangi bir ilişkisinin olup olmadığını gösterebilirim.
Backtest sana duymak istediğini söyledi. Ben sana duyman gerekeni söyleyeceğim.
Want Anny's AI to analyze your portfolio? Try the Anny Line or see pricing.
