Usando a estrutura de duplo topo do Bitcoin de 2021 como exemplo: falar sobre o que é "vazamento futuro de dados"

Quando fazemos backtest a um conjunto de estratégias e examinamos um conjunto de indicadores, estamos realmente no momento? Este artigo parte das duas armadilhas de "vazamento de dados futuro" e "overfitting", e analisa o teste fatal da análise on-chain de topo duplo em 2021. (Sinopse: Continuação do mercado de vida: análise do topo duplo mais estranho em 2021 com dados on-chain) (Suplemento de fundo: Academia de dados on-chain (1): Você sabe qual é o custo médio do BTC em todo o mercado? Pontos principais: Fale sobre o conceito de "viés de antecipação" Fale sobre acertos na negociação: Overfitting Double top em 2021: o maior teste para esculpir a espada Análise do desempenho de três indicadores e um modelo Viés de antecipação Imagine um cenário: "Digamos que desenvolvo uma estratégia de negociação e a teste rigorosamente nos últimos 50 anos 1975 ~ 2024, e obteve um desempenho muito bom no backtest. Foi por isso que decidi lançar esta estratégia em 2025.» Caros leitores, para a descrição acima, alguém vê o que está errado? Se você realmente só fizer backtesting de 1975 ~ 2024, é realmente fácil cair na armadilha do "vazamento de dados futuro". Como simplesmente usamos todos os dados "até agora" para fazer backtesting, isso levará aos parâmetros de estratégia que treinamos, que provavelmente serão "impacientes"! Uma abordagem mais rigorosa é, por exemplo: você pode testar o desempenho de todo o ano de 2024 para "1975 ~ 2023" (assumindo que estamos em 2024) e usar a estratégia de treinamento; Claro, você também pode usar os dados do período de 1975 ~ 2022 para treinar a estratégia e, em seguida, usar a estratégia treinada para testar o desempenho de 2023 e 2024. Mais precisamente, podemos evitar, tanto quanto possível, a "fuga futura de dados" através de "rollrolling backtesting" ou "stepping backtesting". A vantagem disso é "garantir que a estratégia pós-treino possa resistir ao teste do futuro". Overfitting: o veneno mais mortal Qualquer pessoa com um conceito básico de desenvolvimento de estratégia quantitativa saberá quão graves podem ser os problemas de sobreajuste. O chamado overfitting, em termos leigos, é "esculpir o barco pela espada", o que fará com que os dados do backtest pareçam bons (baixo erro de treinamento), mas difíceis de aplicar ao combate real (alto erro de teste). Aqui pretendo introduzir um conceito matemático para explicar: (leitores que têm dor de cabeça quando veem matemática, você pode pular diretamente para o próximo parágrafo para ver a conclusão) Suponha que haja uma sequência de números: "1, 2, 4, 8, 16, ?" Os leitores que são ligeiramente sensíveis aos números devem pensar que o próximo número é 32, porque os cinco primeiros itens de dados estão obviamente relacionados com o "poder de 2". Mas, na verdade, não podemos prever qual será o próximo número. Porque de um ponto de vista matemático, podemos usar a interpolação de Lagrange para construir outro polinômio de ordem superior, de modo que o sexto dado não seja 32, mas também satisfaça a lei. Isso significa: "Previsões que são extrapoladas apenas em pontos de dados finitos não são confiáveis." 2021 Segundo Topo: O Maior Teste para a Maioria dos Indicadores Depois de falar sobre conceitos teóricos chatos, vamos falar sobre o combate real. Abaixo, vou pegar três indicadores de dados on-chain e um modelo que eu pessoalmente desenvolvi para explicar a todos os leitores: 1. MVRV Eu acredito que os leitores que estudaram um pouco a análise de dados on-chain devem ter ouvido falar de MVRV, e meu artigo anterior também fez um ensino detalhado sobre este indicador ( On-chain data school (1): Você sabe qual é o custo médio do BTC em todo o mercado? )。 Como mostrado acima, este é um gráfico dos dados históricos do MVRV. Os 1, 2, 3 e 4 marcados no gráfico correspondem ao topo de 13, 17 e 2021, respectivamente. Podemos ver claramente que as altas do MVRV no topo de cada rodada estão "diminuindo". Ouvi muitas pessoas usarem os seguintes métodos para lidar com o fenómeno da diminuição dos máximos: "Sei que está a diminuir, por isso, ao julgar o topo, vou agarrar um limiar mais conservador e mais baixo como sinal de alerta." Agora surge a pergunta: como estabelecer um limiar mais conservador? Se voltarmos a abril de 2021 e virmos apenas 13 ou 17 anos de dados históricos, o limiar conservadoramente estabelecido pode ser acionado em 21 de abril? O limiar assim estabelecido pode ser acionado no segundo topo em 2021? Se você não acha que abril de 2021 é o topo, então o segundo topo em 2021 tem ainda menos probabilidade de escapar do topo, certo? O que eu quero dizer é o seguinte: porque o tamanho da amostra de dados históricos do BTC é muito pequeno, e se você simplesmente considerar os ciclos anteriores, é provável que caia na armadilha do "vazamento de dados futuro". Uma pessoa em abril de 2021 (o primeiro topo) não saberá que o valor MVRV naquele momento é realmente o ponto mais alto desse ciclo, porque ele só pode ver os dados de 13 ou 17 anos; Da mesma forma, quando o segundo top apareceu em 2021, o valor MVRV estava em uma posição muito baixa, e se o primeiro top não escapasse, era naturalmente impossível escapar do topo de acordo com os dados do segundo top, de modo que a melhor oportunidade de escapar do topo em 2021 seria perdida. 2. Indicador AVIV AVIV pode ser considerado como um MVRV corrigido, mais bem considerado, e tem uma característica de "reversão média" mais óbvia do que MVRV. Mas, mesmo assim, o fenómeno dos "picos (máximos) decrescentes" ainda é óbvio: os 1, 2, 3 e 4 marcados na figura correspondem ao topo de 13, 17 e 2021, respetivamente. Para a mesma pergunta, copiarei diretamente o texto acima para os leitores considerarem: Como definir um limite mais conservador? Se voltarmos a abril de 2021 e virmos apenas 13 ou 17 anos de dados históricos, o limiar conservadoramente estabelecido pode ser acionado em 21 de abril? O limiar assim estabelecido pode ser acionado no segundo topo em 2021? Se você não acha que abril de 2021 é o topo, então o segundo topo em 2021 tem ainda menos probabilidade de escapar do topo, certo? RUP (Lucro Relativo Não Realizado) Eu também introduzi dados on-chain RUP em detalhes antes, os leitores interessados podem consultar os seguintes dois artigos: On-Chain Data Academy (9): Barómetro de Mercado RUPL(I) - Introdução de Dados > Aplicação de Leitura Inferior Academia de Dados On-Chain (10): Barómetro de Mercado RUPL(II) - Sinal superior mais forte & Ciclo Histórico Top Análise detalhada Um leitor perguntou uma vez: "Pode entender a lógica da divergência RUP, Mas devemos também considerar os máximos históricos que o RUP atingiu?" Como mostra a figura acima, este é o gráfico histórico do RUP, e os 1, 2, 3 e 4 marcados na figura correspondem ao topo de 13, 17 e 2021, respectivamente. Pode-se ver que, mesmo que o RUP tenha sido padronizado para capitalização de mercado, ainda há um fenômeno de picos decrescentes. Mais uma tortura da alma: como estabelecer um limiar mais conservador? Se voltarmos a abril de 2021, podemos ver que os dados históricos são de apenas 13 ou 17 anos, e o limiar conservadoramente estabelecido pode ser fixado em 21...

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)