backtest-overfittingtrading-strategiesregime-detectioncfo-lineout-of-samplecrypto-trading-botsevergreen

왜 대부분의 크립토 트레이딩 전략은 결국 작동을 멈추는가

2026년 7월 1일·9분 읽기

90초 만에 전략을 하나 산다. 깔끔한 수익 곡선, 자신감 넘치는 Sharpe ratio, 우상향하는 트랙 레코드. 그런데 실제 자금을 연결하는 순간 — 피가 난다. 처음엔 격렬하지 않다. 그냥 조용히, 일관되게 틀린다. 운이 나쁜 거라고 생각한다. 시장이 고장났다고 생각한다. 실제 이유는 훨씬 불편하다: 그건 처음부터 엣지가 아니었다. 복권이었고, 당신에게 당첨된 면만 보여준 것이다.

이것은 대부분의 리테일 트레이딩 전략을 침몰시키는 네 가지 잘 알려진 통계적 메커니즘에 대한 설명이다 — 전략 마켓플레이스, 카피 트레이딩 리더보드, 사전 튜닝된 그리드 봇 판매자들이 거의 공개하지 않는 메커니즘들. 이것을 이해한다고 하룻밤 사이에 더 나은 트레이더가 되진 않는다. 하지만 실제 돈이 걸리기 전에, 감사 가능한 엣지와 잘 차려입은 동전 던지기를 구별하는 눈을 갖게 된다.

이것은 교육적 분석이지, 투자 조언이나 예측이 아니다 — 여기서 어떤 것도 미래 가격을 예측하지 않으며, 크립토 트레이딩에는 실제 손실 위험이 따른다 (전문 공시는 하단 참조).

백테스트는 복권이다. 당신에게는 당첨 티켓만 보여준다

모든 전략 마켓플레이스는 동일한 숨겨진 메커니즘으로 작동한다: 누군가 (혹은 어떤 알고리즘이) 수십, 수백, 때로는 수천 가지 파라미터 조합 — 진입 조건, 청산 조건, 지표 기간, 포지션 크기 — 을 테스트하고, 그중 가장 좋은 과거 수익률을 만들어낸 설정을 노출시킨다.

그게 리서치처럼 들린다. 하지만 실제로는 선택이다.

2014년 Notices of the American Mathematical Society에 발표된 논문에서 Bailey, Borwein, Lopez de Prado, Zhu는 이 문제를 Pseudo-Mathematics and Financial Charlatanism이라는 이름으로 형식화했다. 핵심 결론: 많은 전략 변형을 탐색하고 가장 좋은 백테스트 결과를 보고할 때, 당신은 노이즈가 많은 결과들의 최댓값을 추출하는 것이다 — 그리고 노이즈가 많은 결과들의 최댓값은 구조적으로, 기계적으로 상방 편향된다. 실질적인 엣지가 전혀 없는 전략도 충분히 많은 변형을 시도하면 높은 Sharpe의 백테스트를 만들어낸다.

> "천 가지 파라미터 세트를 시도하고 그중 최선을 보고하는 백테스트는 전략이 아니다. 복권의 생존자다."

Bailey와 Lopez de Prado는 Probability of Backtest Overfitting — 선택된 설정이 순전히 우연에 의해 샘플 내에서 성과를 낸 확률을 측정하는 공식적인 지표 — 도 소개한다. 불편한 발견: 적당한 수의 시도만으로도 이 확률은 빠르게 올라간다. 과적합하기 위해 부주의할 필요도 없다. 그냥 탐색하면 된다.

감사할 수 없는 Sharpe Ratio는 숫자가 아니다

학술 금융에서 사용하는 표준 유의성 기준 (t-통계량 2.0 이상)은 단일하고 사전에 명시된 가설을 위해 보정된 것이다 — 전략 리서치의 집합적 테스트 환경을 위한 것이 아니다.

Harvey, Liu, Zhu (2016)는 수익률의 횡단면에서 이 다중 검정 문제를 정면으로 다룬다. 핵심은 새로운 마법의 숫자가 아니라 논리의 교정이다: t-통계량 2는 단일하고 사전에 명시된 가설에 대해 방어 가능한 기준이지만, 일단 어떤 결과가 동일한 데이터로 테스트된 많은 전략들 중 최선이 된다면, 동일한 t-통계량 2는 더 이상 그것이 의미하는 바를 의미하지 않는다. 탐색을 반영해 유의성 기준을 높여야 하며 — 더 많은 전략을 시도할수록, 그 기준은 더 높아진다. 다중 전략 환경에서 조정되지 않은 t-통계량 2는 훨씬 너무 관대하다.

Bailey와 Lopez de Prado의 Deflated Sharpe Ratio (2014)는 이것을 확장한다: 시도된 변형의 수, 테스트 기간의 길이, 그리고 크립토가 특수하게 생성하는 두꺼운 꼬리 수익률 분포를 반영해 보고된 Sharpe ratio를 수학적으로 할인한다.

모든 마켓플레이스 리스팅에 대한 구조적 문제가 여기 있다: Deflated Sharpe를 계산하려면 시도된 변형의 수가 필요하다. 판매자들은 거의 이것을 공개하지 않는다. 수백 번의 파라미터 스윕으로 만들어진 6개월 트랙 레코드는, Bailey-Lopez de Prado 프레임워크에 따르면, 통계적으로 공허하다.

Minimum Backtest Length 개념도 같은 논리를 따른다: 더 많은 변형을 테스트할수록, 높은 Sharpe가 어떤 무게를 갖기 전에 더 많은 연도의 깨끗한 샘플 외 히스토리가 필요하다. 6개월은 너그러운 가정 하에서도 이 기준을 거의 통과하지 못한다.

시장은 움직인다. 얼어붙은 전략은 움직이지 않는다.

과적합은 백테스트가 왜 거짓말을 하는지 설명한다. 하지만 한 기간에 진짜 엣지를 가졌던 전략도 기저의 시장 레짐이 바뀌면 작동을 멈출 수 있다 — 그리고 크립토는 레짐 전환으로 정의되는 시장이다.

이 자산은 상승 추세 강세장, 지루한 약세장, 낮은 변동성 횡보 구간, 격렬한 디레버리징 쇼크 사이를 오간다. 이것들은 구조적 단절이다 — 가격의 자기상관 구조, 변동성 레짐, 상관관계 행동이 서로 진정으로 다른 기간들이다. 한 레짐에 맞춰진 전략은 다른 레짐에서 일반적으로 틀린다.

교과서적 사례는 그리드 봇이다. 제한된 범위 안에서 그리드 봇은 기계적으로 변동성을 수확한다 — 거기서는 진정으로 효과적이다. 강한 방향성 추세나 디레버리징 충격에서는 동일한 메커니즘이 역으로 작동한다: 가격이 달아나면서 그리드의 지는 쪽이 계속 체결되고, 손실이 빠르게 복리로 쌓인다. 봇 자체는 자신이 어떤 환경에 있는지 모른다.

이것은 그리드 봇 논리의 실패가 아니다. 레짐 필터 — 전략이 언제 행동해야 하고 언제 물러서야 하는지를 정의하는 명시적 조건 — 의 부재다.

> "레짐 필터가 없는 전략은 내일의 시장이 자신이 맞춰진 역사의 한 조각과 정확히 같아 보일 것이라고 조용히 베팅하는 것이다. 크립토에서는 절대 그렇지 않다."

더 나은 지표들은 여전히 과적합할 파라미터일 뿐이다. 해결책은 전략에게 이것이 당신이 설계된 환경이다 — 혹은 이것은 아니다 — 라고 말해주는 명시적이고 별도로 검증된 신호다.

리더보드는 생략을 통해 거짓말한다

카피 트레이딩 리더보드는 과적합과 레짐 무감각 위에 두 가지 복합적 실패 모드를 추가한다.

첫 번째는 생존자 편향이다. 리더보드에서 보이는 계정들은 리스팅될 때까지 살아남은 것들이다. 날아간 계정들은 상장 폐지됐거나, 버려졌거나, 조용히 재시작됐다. 당신은 분포의 오른쪽 꼬리를 보고 있는데, 중앙값인 것처럼 제시된다.

두 번째는 혼잡화와 데이터 마이닝을 통한 알파 붕괴다. 여기서 가장 엄밀한 증거는 주식 시장에서 나온다: McLean과 Pontiff는 2016년 Journal of Finance에서, 발표된 이상 현상의 수익률 중 상당 부분 — 대략 절반 정도 — 이 발표 후 사라진다는 것을 발견했다. 그들은 이 하락을 부분적으로는 최초 발견의 통계적 편향(데이터 마이닝)에, 부분적으로는 자본이 몰려들면서 발생하는 실제 차익거래에 귀속시킨다. 이 메커니즘은 크립토에만 특정되지 않지만, 크립토에서는 오히려 더 날카롭다: 복사 가능한 전략 신호는 가장 혼잡한 거래이고, 그 혼잡화는 남아 있는 실제 엣지의 압축을 가속화한다.

세 가지 역풍이 복합된다: 원래 엣지에는 과적합 위험이 있고; 그것이 맞춰진 시장 레짐은 이미 끝났을 가능성이 높으며; 그것을 대규모로 복사하는 것은 남아 있는 신호가 무엇이든 그 붕괴를 가속화한다. 이 중 어떤 것도 리더보드에 공개되지 않는다.

신뢰할 수 있다는 것이 실제로 어떻게 생겼는지

합법적인 기준은 수익을 약속하지 않는다. 당신이 심문할 수 있는 증거를 제공한다.

그 증거에는 세 가지 구성 요소가 있다.

Walk-forward validation (Pardo, 2008): 한 역사적 윈도우에서 전략을 최적화하고, 그 다음 보이지 않은 윈도우에서 테스트하고, 그런 다음 앞으로 롤링하고 반복한다. 여러 보이지 않은 기간에 걸쳐 유지되는 walk-forward 결과는 더 신뢰할 수 있다 — 확실하진 않지만, 더 신뢰할 수 있다.

완전한 공개: 수익률, 최대 낙폭, 승률, 거래 횟수, 그리고 시장 레짐에 따라 행동이 어떻게 변하는지. 수익 곡선은 보여주면서 낙폭 깊이와 약세장 행동을 숨기는 리스팅은 하이라이트 릴을 보여주는 것이지, 감사 추적이 아니다.

명시적 레짐 필터: 전략이 의도된 환경에서 작동하는 시점을 정의하는 별도로 구성된 신호. 이것 없이는 walk-forward로 검증된 전략조차 설계되지 않은 레짐에 대한 자동 방어 수단이 없다.

기준 적용: Anny의 무료 Labs가 작동하는 방식

이것이 Anny의 전략 labs가 구축된 기준이다. 모든 전략 아이디어는 전체 백테스트와 함께 표면화된다: 수익률, Sharpe, 승률, 최대 낙폭, 거래 횟수. 샘플 외 검증은 최적화 도구가 절대 건드리지 않은 홀드아웃 데이터에서 실행된다 — 선택적 추가 사항이 아니라 기본값으로.

결정적으로, 모든 전략은 CFO Anny Line 레짐 별로 분석된다 — Anny가 시장 상태를 세 가지 상태로 분류하는 데 사용하는 신호: Accumulate, Wait, Distribute. 이것이 전형적인 마켓플레이스가 갖추지 못한 레짐 필터다: 당신이 어떤 유형의 시장에 있는지에 대한 단일 판독값, 그래서 전략을 모든 레짐에 걸쳐 평균화하는 것이 아니라 설계된 환경에서 판단할 수 있다. 수년간의 Bitcoin 역사에 걸쳐 라인이 호출한 모든 레짐 변화는 공개 기록에 있다 — 직접 히스토리를 스크롤하고 전환점들을 확인할 수 있으며, 신호가 어떻게 구성되고 샘플 외 데이터에서 검증되었는지는 방법론에 문서화되어 있다.

백테스트 전략 라이브러리를 탐색할 때, 단순히 과거에 작동했는지 여부만 보는 것이 아니다 — 언제 작동했는지, 어떤 레짐 조건에서, 그리고 조건이 불리하게 바뀌었을 때 어떤 모습이었는지를 볼 수 있다. 손실도 데이터에 있다. 그것이 핵심이다.

Anny를 특정 도구와 비교하고 싶은가? 나란히 비교에서 이 기준을 Cryptohopper, 3Commas, Coinrule 및 다른 봇 플랫폼들과 함께 확인할 수 있다.

무료 포트폴리오 스캔 실행으로 현재 보유 자산이 CFO Anny Line 레짐 상태에 어떻게 매핑되는지 확인하라.

명확히 말해두겠다: 샘플 외 검증과 레짐 필터는 과적합 위험을 줄이고 과거 분석의 신뢰성을 높인다. 낙폭을 없애지는 않는다. 알파 붕괴를 막지도 않는다. 미래 성과에 대한 약속이 아니다. 이것들이 제공하는 것은 투명성이다 — 실패 모드를 포함한 증거를 볼 수 있고, 스스로 평가할 수 있다.

방법론 보기 — CFO Anny Line이 어떻게 검증되고 샘플 외 결과가 어떻게 보고되는지를 포함해서.

실제 돈을 걸기 전에 중요한 세 가지 질문

당신이 보여지는 모든 전략은 누군가가 그것을 찾아서 만들어졌다. 문제는 그 탐색이 정직했는지, 결과가 보이지 않는 데이터에서 테스트되었는지, 그리고 전략이 시장이 바뀔 때 무엇을 해야 하는지 알고 있는지다.

API 키를 연결하기 전에 이것들을 물어라:

이것을 찾기 위해 몇 가지 변형이 테스트되었는가? 숫자를 얻을 수 없다면, 과적합하기에 충분했다고 가정하라.
최적화 도구가 절대 보지 못한 데이터에서 검증되었는가? 선택에 사용된 동일한 데이터의 백테스트는 증거가 아니다.
명시적 레짐 필터 — 정의된 "언제 물러설지" 조건 — 가 있는가? 없다면, 다음 구조적 단절에 맹목적으로 달려드는 것이다.

판매자가 세 가지 모두 답할 수 없다면, 답은 이미 나온 것이다.

감사할 수 없는 전략은 다른 사람의 복권 티켓에 베팅하는 것이다. 몇 장의 티켓이 찍혔는지 알 수 없고, 당첨 번호가 이미 발표된 후에 사는 것이다.

참고문헌

Bailey, D.H., Borwein, J., Lopez de Prado, M., & Zhu, Q. (2014). "Pseudo-Mathematics and Financial Charlatanism: The Effects of Backtest Overfitting on Out-of-Sample Performance." Notices of the American Mathematical Society, 61(5).
Bailey, D.H., & Lopez de Prado, M. (2014). "The Deflated Sharpe Ratio: Correcting for Selection Bias, Backtest Overfitting, and Non-Normality." Journal of Portfolio Management, 40(5).
Bailey, D.H., & Lopez de Prado, M. "The Probability of Backtest Overfitting." Journal of Computational Finance (published 2016).
Harvey, C.R., & Liu, Y. (2015). "Backtesting." Working paper.
Harvey, C.R., Liu, Y., & Zhu, H. (2016). "… and the Cross-Section of Expected Returns." Review of Financial Studies, 29(1).
McLean, R.D., & Pontiff, J. (2016). "Does Academic Research Destroy Stock Return Predictability?" Journal of Finance, 71(1).
Pardo, R. (2008). The Evaluation and Optimization of Trading Strategies (2nd ed.). Wiley.

이 분석은 교육 목적만을 위한 것이며 — 투자 조언이 아니다. 과거 성과는 미래 결과를 나타내지 않는다. 인용된 통계는 주식 및 일반 금융 시장에 관한 참조된 학술 연구에서 가져온 것이며; 메커니즘은 크립토와의 개념적 관련성을 위해 논의되었으며 정량적으로는 이전되지 않을 수 있다. Anny는 AI 기반 분석 플랫폼이며, 등록된 투자 고문이 아니다. 이 기사는 AI 지원으로 작성되었으며 정확성을 위해 검토되었다. 크립토 자산은 변동성이 크고 전체 투자금을 잃을 수 있다.

Anny AI가 포트폴리오를 분석해 드릴까요? Anny Line 체험하기 또는 요금제 보기.

비트코인 분석 이더리움 분석 TradingView 봇 트레이딩 봇 알트시즌 지수

← 전체 글로 돌아가기