왜 대부분의 크립토 트레이딩 전략은 결국 작동을 멈추는가

2026년 7월 1일·9분 읽기
왜 대부분의 크립토 트레이딩 전략은 결국 작동을 멈추는가

90초 만에 전략을 산다. 깔끔한 수익 곡선, 자신감 넘치는 Sharpe ratio, 우상향하는 트랙 레코드. 그런데 실제 자금을 연결하는 순간 — 피가 난다. 처음엔 폭발적이지 않다. 그냥 천천히, 꾸준하게, 틀린다. 운이 나쁜 거라고 생각한다. 시장이 망가진 거라고 생각한다. 실제 이유는 훨씬 불편하다: 그건 처음부터 엣지가 아니었다. 복권이었고, 당신은 당첨된 면만 보여줬을 뿐이다.

이것은 대부분의 리테일 트레이딩 전략을 침몰시키는 네 가지 통계적 메커니즘에 대한 분석이다 — 전략 마켓플레이스, 카피 트레이딩 리더보드, 미리 튜닝된 그리드 봇 판매자들이 거의 공개하지 않는 메커니즘들. 이것을 이해한다고 해서 하루아침에 더 나은 트레이더가 되는 건 아니다. 하지만 실제 돈이 걸리기 전에 — 검증 가능한 엣지와 잘 차려입은 동전 던지기를 구별하는 눈은 생긴다.

이것은 교육적 분석이지, 금융 조언이나 예측이 아니다 — 여기서 다루는 내용은 미래 가격을 예측하지 않으며, 크립토 트레이딩은 실제 손실 위험을 수반한다 (전체 공시는 하단에).


백테스트는 복권이고, 당신은 당첨된 티켓만 보고 있다

모든 전략 마켓플레이스는 동일한 숨겨진 메커니즘 위에서 돌아간다. 누군가(또는 어떤 알고리즘이) 수십, 수백, 때로는 수천 개의 파라미터 조합을 테스트한다 — 진입 조건, 청산 조건, 지표 기간, 포지션 크기 — 그리고 가장 좋은 과거 수익을 낸 설정을 표면에 띄운다.

그것은 연구처럼 들린다. 그것은 실제로 선택이다.

Bailey, Borwein, Lopez de Prado, Zhu가 2014년 Notices of the American Mathematical Society에 발표한 논문 Pseudo-Mathematics and Financial Charlatanism은 이 문제를 공식화한다. 핵심 결론: 수많은 전략 변형을 탐색하고 가장 좋은 백테스트를 보고할 때, 당신은 대규모의 노이즈 결과 중 최댓값을 추출하고 있는 것이다 — 그리고 노이즈 결과의 최댓값은 구조적으로, 기계적으로 위쪽으로 편향된다. 실제 엣지가 전혀 없는 전략조차 충분한 변형을 시도하면 높은 Sharpe의 백테스트를 만들어낸다.

> "1,000개의 파라미터 세트를 시도하고 가장 좋은 것을 보고하는 백테스트는 전략이 아니다. 복권의 생존자다."

Bailey와 Lopez de Prado는 Probability of Backtest Overfitting도 소개한다 — 선택된 설정이 순전히 우연으로 in-sample에서 좋은 성과를 냈을 확률을 측정하는 공식적 지표다. 불편한 발견: 적당한 수의 시도만으로도 이 확률은 빠르게 올라간다. 부주의해서 과적합하는 게 아니다. 그냥 탐색하기만 해도 된다.


검증할 수 없는 Sharpe Ratio는 숫자가 아니다

학문적 금융에서 사용하는 기본 유의성 기준(t-통계량 2.0 이상)은 단일하고 사전에 명시된 가설을 위해 설계된 것이다 — 전략 연구의 집단적 테스트 환경을 위한 것이 아니다.

Harvey, Liu, Zhu(2016)는 수익률의 횡단면에 대한 다중 테스트 문제를 정면으로 다룬다. 핵심은 새로운 마법의 숫자가 아니라 논리의 수정이다. t-통계량 2는 단일하고 사전에 명시된 가설에는 합리적인 기준이지만, 같은 데이터에 대해 테스트된 수많은 전략 중 최고의 결과라면, 그 동일한 t-통계량 2는 더 이상 겉보기와 같은 의미가 아니다. 유의성 기준은 탐색을 반영해 상향 조정되어야 하고 — 시도한 전략이 많을수록 더 높이 올라간다. 다중 전략 환경에서 조정되지 않은 t-통계량 2는 훨씬 너무 관대하다.

Bailey와 Lopez de Prado의 Deflated Sharpe Ratio(2014)는 이것을 확장한다. 시도한 시행 횟수, 테스트 기간 길이, 그리고 크립토가 특히 만들어내는 팻테일 수익률 분포를 수학적으로 할인해 보고된 Sharpe ratio를 조정한다.

모든 마켓플레이스 리스팅에 대한 구조적 문제가 여기 있다. Deflated Sharpe를 계산하려면 시도한 변형의 수를 알아야 한다. 판매자들은 이것을 거의 공개하지 않는다. 수백 번의 파라미터 스윕 위에 쌓인 6개월의 트랙 레코드는, Bailey-Lopez de Prado 프레임워크에 따르면 통계적으로 공허하다.

Minimum Backtest Length 개념도 같은 논리를 따른다. 시도한 변형이 많을수록, 높은 Sharpe가 의미를 갖기 위해 더 많은 연도의 깨끗한 out-of-sample 이력이 필요하다. 6개월은 관대한 가정 아래서도 이 기준을 거의 통과하지 못한다.


시장은 움직인다. 고정된 전략은 그렇지 않다.

과적합은 왜 백테스트가 거짓말을 하는지 설명한다. 그러나 특정 기간에 실제 엣지를 가졌던 전략조차 시장의 근본적인 레짐이 바뀌면 작동을 멈출 수 있다 — 그리고 크립토는 레짐 전환으로 정의되는 시장이다.

이 자산은 상승 추세의 불마켓, 지지부진한 베어마켓, 저변동성 박스권, 폭력적인 디레버리징 충격 사이를 출렁인다. 이것들은 구조적 단절이다 — 가격의 자기상관 구조, 변동성 레짐, 상관관계 행동이 서로 진정으로 다른 기간들. 하나의 레짐에 맞춰진 전략은 다른 레짐에서 전형적으로 틀린다.

교과서적 사례는 그리드 봇이다. 제한된 레인지에서 그리드 봇은 기계적으로 변동성을 수확한다 — 그 환경에서는 진짜 효과적이다. 강한 방향성 추세나 디레버리징 충격에서는 같은 메커니즘이 역으로 작용한다. 그리드의 손실 측이 가격이 달아나면서 계속 채워지고, 손실은 빠르게 복리로 쌓일 수 있다. 봇 자체는 자신이 어떤 환경에 있는지 모른다.

이것은 그리드 봇 논리의 실패가 아니다. 레짐 필터의 부재다 — 전략이 언제 행동해야 하고 언제 멈춰야 하는지 명시적으로 정의하는 조건.

> "레짐 필터가 없는 전략은 내일의 시장이 자신이 맞춰진 역사의 한 단편과 정확히 같을 것이라고 조용히 베팅하고 있다. 크립토에서는 절대 그렇지 않다."

더 나은 지표도 결국 과적합할 파라미터일 뿐이다. 해결책은 전략에게 이것이 당신이 설계된 환경이다 — 또는 이것은 아니다 — 라고 말해주는 명시적이고 별도로 검증된 신호다.


리더보드는 누락으로 거짓말한다

카피 트레이딩 리더보드는 과적합과 레짐 맹목성 위에 두 가지 추가적인 실패 모드를 겹친다.

첫 번째는 생존자 편향이다. 리더보드에서 보이는 계정들은 살아남아 리스트에 오른 것들이다. 폭발한 계정들은 상장 폐지되거나, 버려지거나, 조용히 재시작됐다. 당신은 분포의 오른쪽 꼬리를 보고 있는데, 그것이 중간값인 것처럼 제시된다.

두 번째는 군집과 데이터 마이닝을 통한 알파 감쇠다. 이에 관한 가장 엄밀한 증거는 주식 시장에서 나온다. McLean과 Pontiff는 2016년 Journal of Finance에서, 발표된 이상 현상의 수익률 중 상당 부분 — 절반 정도의 규모 — 이 발표 이후 사라지며, 이를 원래 발견의 통계적 편향(데이터 마이닝)과 자본이 몰리면서 발생하는 실제 차익거래 양쪽 모두에 기인한다고 밝혔다. 이 메커니즘은 크립토에만 특정하지 않지만, 크립토에서는 오히려 더 날카롭다. 복사 가능한 전략 신호는 가장 붐비는 트레이드이고, 그 군집은 잔여 엣지가 실제였던 것의 압축을 가속화한다.

세 가지 역풍이 겹친다. 원래의 엣지는 과적합 위험을 안고 있고, 그것이 맞춰진 시장 레짐은 이미 끝났을 가능성이 높으며, 대규모로 복사하는 것은 남아있는 신호의 감쇠를 가속화한다. 이 중 어느 것도 리더보드에는 공개되지 않는다.


신뢰할 수 있는 것의 실제 모습

정당한 기준은 수익을 약속하지 않는다. 당신이 검증할 수 있는 증거를 제공한다.

그 증거는 세 가지 요소로 구성된다.

Walk-forward 검증 (Pardo, 2008): 하나의 역사적 구간에서 전략을 최적화하고, 다음 보지 못한 구간에서 테스트한 후, 앞으로 롤링하며 반복한다. 여러 개의 보지 못한 구간에서 유지되는 walk-forward 결과는 더 신뢰할 수 있다 — 확실한 건 아니지만, 더 신뢰할 수 있다.

완전한 공개: 수익률, 최대 낙폭, 승률, 거래 횟수, 그리고 시장 레짐에 따라 행동이 어떻게 달라지는지. 수익 곡선은 보여주면서 낙폭 깊이와 베어마켓 행동을 숨기는 리스팅은 하이라이트 릴을 보여주는 것이지, 감사 내역이 아니다.

명시적인 레짐 필터: 전략이 의도된 환경에서 작동하고 있는지를 정의하는 별도로 구축된 신호. 이것 없이는 walk-forward 검증된 전략조차 자신이 설계된 적 없는 레짐에 대한 자동적인 방어가 없다.


기준 적용: Anny의 무료 Labs가 작동하는 방식

이것이 Anny의 전략 labs가 구축된 기준이다. 모든 전략 아이디어는 완전한 백테스트와 함께 제시된다: 수익률, Sharpe, 승률, 최대 낙폭, 거래 횟수. Out-of-sample 검증은 옵티마이저가 한 번도 건드리지 않은 holdout 구간에서 실행된다 — 기본값이지 선택 사항이 아니다.

결정적으로, 모든 전략은 CFO Anny Line 레짐별로 분석된다 — Anny가 시장 상황을 세 가지 상태로 분류하는 데 사용하는 신호: Accumulate, Wait, Distribute. 이것이 전형적인 마켓플레이스에 없는 레짐 필터다. 지금 어떤 유형의 시장에 있는지에 대한 단일 판독값으로, 전략이 모든 상황에 걸쳐 평균화되는 대신 설계된 환경에서 평가될 수 있다. 해당 라인이 Bitcoin 역사 수년에 걸쳐 호출한 모든 레짐 변화가 공개 기록에 있다 — 직접 이력을 스크롤하고 전환을 확인할 수 있으며, 신호가 어떻게 구성되고 out-of-sample에서 검증됐는지는 methodology에 문서화되어 있다.

백테스트된 전략 라이브러리를 탐색할 때, 과거에 무언가가 작동했는지 여부만이 아니라 — 언제 작동했는지, 어떤 레짐 조건에서 작동했는지, 그리고 조건이 불리하게 바뀌었을 때 어떻게 보였는지를 확인할 수 있다. 손실도 데이터에 있다. 그것이 핵심이다.

무료 포트폴리오 스캔 실행으로 현재 보유 자산이 CFO Anny Line 레짐 상태에 어떻게 매핑되는지 확인하라.

명확히 말하겠다: out-of-sample 검증과 레짐 필터는 과적합 위험을 줄이고 역사적 분석의 신뢰성을 높인다. 낙폭을 제거하지 않는다. 알파 감쇠를 막지 못한다. 미래 성과를 약속하지 않는다. 제공하는 것은 투명성이다 — 실패 모드를 포함한 증거를 볼 수 있고, 스스로 판단할 수 있다.

방법론 보기 — CFO Anny Line이 어떻게 검증되고 out-of-sample 결과가 어떻게 보고되는지 포함.


실제 돈을 걸기 전에 중요한 단 세 가지 질문

당신이 보여받은 모든 전략은 누군가가 그것을 찾아 탐색한 결과다. 문제는 그 탐색이 정직했는지, 결과가 보지 못한 데이터에서 테스트됐는지, 그리고 시장이 바뀔 때 전략이 무엇을 해야 하는지 아는지다.

API 키를 연결하기 전에 이것을 물어라:

  1. 이것을 찾기 위해 몇 개의 변형을 테스트했는가? 숫자를 얻을 수 없다면, 과적합하기에 충분했다고 가정하라.
  2. 옵티마이저가 한 번도 보지 못한 데이터에서 검증됐는가? 선택에 사용된 동일한 데이터에 대한 백테스트는 증거가 아니다.
  3. 명시적인 레짐 필터가 있는가 — "언제 멈출지"에 대한 정의된 조건이 있는가? 없다면, 다음 구조적 단절을 향해 눈 감고 달리고 있는 것이다.
  4. 판매자가 세 가지 모두에 답할 수 없다면, 이미 답을 얻은 것이다.

    감사할 수 없는 전략은 다른 사람의 복권 티켓에 거는 베팅이다. 티켓이 몇 장이나 찍혔는지 모르고, 당첨 번호가 이미 발표된 후에 사는 것이다.


    참고문헌

    • Bailey, D.H., Borwein, J., Lopez de Prado, M., & Zhu, Q. (2014). "Pseudo-Mathematics and Financial Charlatanism: The Effects of Backtest Overfitting on Out-of-Sample Performance." Notices of the American Mathematical Society, 61(5).
    • Bailey, D.H., & Lopez de Prado, M. (2014). "The Deflated Sharpe Ratio: Correcting for Selection Bias, Backtest Overfitting, and Non-Normality." Journal of Portfolio Management, 40(5).
    • Bailey, D.H., & Lopez de Prado, M. "The Probability of Backtest Overfitting." Journal of Computational Finance (published 2016).
    • Harvey, C.R., & Liu, Y. (2015). "Backtesting." Working paper.
    • Harvey, C.R., Liu, Y., & Zhu, H. (2016). "… and the Cross-Section of Expected Returns." Review of Financial Studies, 29(1).
    • McLean, R.D., & Pontiff, J. (2016). "Does Academic Research Destroy Stock Return Predictability?" Journal of Finance, 71(1).
    • Pardo, R. (2008). The Evaluation and Optimization of Trading Strategies (2nd ed.). Wiley.

    이 분석은 교육 목적에 한하며 — 금융 조언이 아니다. 과거 성과는 미래 결과를 나타내지 않는다. 인용된 통계는 주식 및 일반 금융 시장에 관한 참고 학술 연구에서 가져온 것이며, 메커니즘은 크립토와의 개념적 관련성을 위해 논의된 것으로 수치적으로 전이되지 않을 수 있다. Anny는 AI 기반 분석 인텔리전스이며, 등록된 투자 고문이 아니다. 이 글은 AI의 도움으로 작성됐으며 정확성을 위해 검토됐다. 크립토 자산은 변동성이 크며 투자금 전체를 잃을 수 있다.