Engenharia Reversa em Apostas Esportivas.
Hoje vou abordar 1 assunto pouco comentado em nossa comunidade brasileira com o objetivo d derivar linhas com base nas cotações oferecidas d certos mercados. Não sei se este seria o termo técnico ideal, mas dei esse nome.
Dados de Futebol
Hoje vou com um conteúdo um pouco diferente mas relacionado as apostas.
Quero indicar para vocês um pacote para utilizar em Python que permite baixar dados de vários sites, entre eles Fbref, Fotmob, Sofascore, 365Scores e Transfermark.
LOL
Bom vamos lá, antes tarde do que nunca...... não sou expert no jogo, então tive que pesquisar algumas coisas para entender como é a dinâmica do jogo e tentar montar algo com uma regressão linear. Primeiro, como toda a análise vamos aos dados.
Mercado de Gols
Tenho visto não de agora, mas há muito apenas levantamentos de ligas onde houveram x% de Over 0.50, 1.50, 2.50, 3.50 gols de acordo com médias de gols marcados durante a temporada, etc.
Obg a tds pelas msg's, compartilhamentos, conselhos etc. Em agradecimento, hj a noite após as mentorias do dia, vou montar 2 posts inéditos q muita gente pede. O 1º é p precificar 1 partida de LOL, e outra p Prop's, espero q gostem. + 1 vz, obg e 1 abraço a tds! Até amanhã!!!
O Dia a Dia na Modelagem Preditiva Para um Iniciante nas Apostas Esportivas (Sátira)
Acho que apostar na Liga Argentina, tem jogo dia 30/08 do Sarmiento contra o Lanus.
Beleza, vamos ver os dados...
Pensando seriamente em abandonar o "X" e excluir este perfil. Trago conteúdos que dificilmente se vê p aí, p/ trazer coisas novas p/ a comunidade, e qdo vejo o nº de compartilhamento dá aquela broxada legal.... vou refletir sobre isto este find. Salvem o que acharem útil.
Modelo Generalista para Eventos Binários
Vamos lá, agora vamos montar 1 simples modelo q pode ser utilizado p Props utilizando simulações, onde pegamos 1 amostra d dados e geramos milhares de simulações d acordo c/ estes dados e extraímos 1 valor estimado p/ nossas previsões.
Calcs Handicaps Asiáticos
Não tenho a pretenção d dizer q esta é a única maneira d se calcular, + é a única q eu conheço. Afinal d contas, ninguém sabe d tudo. Assim, é apenas + 1 maneira d cálculo, o q não desabona nenhuma outra maneira empregada ou divulgada p outras pessoas.
Uma Alternativa a Poisson
Muitos se enganam achando que somente Poisson pode ser utilizada para montagem de linhas, existem outras distribuições que podem ser utilizadas, e hoje vou falar sobre uma distribuição pouco conhecida, a distribuição de Skellam.
Teorema de Bayes - Aplicação Simples em Apostas Esportivas - Se gostarem -> Compartilhem
Vamos a mais um conteúdo pouco conhecido em nossa comunidade, trata-se do Teorema de Bayes. Não é o objetivo deste tratar d maneira acadêmica, mas sim d maneira simples p todos entenderem.
Canal Telegram,
Bom pessoal, como não sabemos o que irá acontecer daqui para frente com relação a esta rede, criei um Canal no Telegram para que eu possa continuar interagindo com vocês.
Evoluindo sempre.... Migrando do Excel para o R. O excel é importante para aprendermos a base, e após migrar para ferramenteas mais robustas que nos trazem vantagens incríveis e vasto conteúdo de pesquisa....
Para quem quiser aprender Python, totalmente voltado as apostas esportivas, indico o canal do Telegram: FutpythonTrader do meu amigo, professor Leandro.
e o Canal do Youtube:
Apostas em Live & Trading Esportivo - 1
Vou começar uma série de posts falando sobre situações do ponto de vista probabilístico q devem ser levados em consideração. Serão abordados Tempo, expectativa de gols e outros.
Cuidados ao utilizar Distribuições de Probabilidade
Hoje, vamos analisar como utilizar duas distribuições de Probabilidades, sendo uma delas a mais conhecida por nossa comunidade que é a Distribuição de Poisson e a outra menos conhecida a Distribuição Binomial Negativa.
Probabilidade de Gols Derivada de uma Distribuição Binomial
Como já mencionei várias vzs, é possível utilizar outras distribuições p prevermos algum resultado. Neste ex. vou utilizar uma Distr Binomial, c/ a intensão d adicionar outras variáveis além das médias simples de gols.
Depois de um período ausente das redes sociais, e finalmente recuperado, estou de volta.... foram meses turbulentos, mas já passou.... em breve postagens inéditas e insights sobre nosso universo maluco, antes q alguém resolva taxar! Um Abraço a todos!
@augustodeAB
@marciofrancasp
@augustodeAB
Pergunta de leigo, até para ficar claro para todos: se houvesse fundamento legal, na sua visão, ela também seria grave e violaria esta série de direitos ?
E a semana continua com o tema derivar xGB (Expectativa de Gols das Bookies) derivadas das Odds:
Próximo Tema: Modelando TODO o Mercado de acordo com o xGB para encontrar ineficiências....
Se gostou, dá aquela força compartilha com seus amigos, tenho certeza que lhe trarão outros insights a partir de agora para suas análises.
Até a próxima!
Mentoria
Pessoal, no início de Janeiro darei inicio a uma nova mentoria.
Aqueles que tiverem interesse, ou queiram sanar dúvidas mandem e-mail para llxprediction
@gmail
.com, será meu ÚNICO CANAL TIRA DÚVIDAS.
Incrições abertas até o dia 30/12/2023, serão apenas 15 vagas.
Me recuperando de uma pequena cirurgia, hoje finalmente pude pegar o Note e a Cabeça a Mil.... Montando um "Unabated Tabajara" () no Excel para me distrair... kkkk e não é que ficou interessante.......
Outros Esportes (Basquete, NFL, etc.)
Simplesmente pegar média d pts do time A pelo time B, e deste saldo dizer q há deu -5,00 pontos e a casa está oferecendo spread de -3,00, tem valor.... mas quanto é esste valor e de fato qual é a probabilidade do time cumprir este spread?
Mentoria a Todo Vapor
Tópicos da 1ª semana:
Análise Exploratória e Tratamento de Dados
- Resumos estatísticos - Principais fórmulas utilizadas simples e condicionais;
- xG I (Simples)
- xG II (Strengh Off e Def)
- xG III (Power Ranking)
- xG através de modelo de ZSD
"Cientistas de Dados" e "Big Data"
é assustador o que tenho visto nos últimos meses nas redes sociais e comunidades de TG. Estamos vivendo um uma era onde estão surgindo especialistas em olhar para o retrovisor e não para o para-brisas.
Depois d muito tempo, voltando ao "X". Saí de tds os grupos de Telegram, Whats e afins c exceção de 1 grupo. A Partir d agora este será meu único canal de contato e iteração. Já adianto q aqui não tem espaço p advogado de influencers, nem pessoas sensíveis a críticas aos mesmos.
Aprendizado Contínuo (é preciso sair da CAIXINHA!)
P nós Apostadores, analistas de dados, etc. , é importante sempre estarmos nos aprimorando e buscando alternativas p nossas análises e p tomadas de decisões, sejam subjetivas, objetivas, em apostas ou qualquer atividade.
Reflexão / Pensamento do Dia:
Nem tudo que reluz é Ouro! -> Planilhas, Gráficos e Modelos Preditivos bonitos não querem dizer nada.
SEJA DE QUEM FOR.
Assim como papel, Excel Também Aceita Tudo !!!
-> Obs.: Não é ataque a ninguém, é um fato!
P quem assistiu ontem o novo ep do
@Sharpcast_
e gosta de MMA e está a procura d conteúdo diferenciado e d qualidade, sugiro seguirem o
@NateLatshaw
, o mesmo criou até mesmo uma métrica avançada xR (Expected Rounds) e muito material gratuíto, garanto que não vão se arrepender.
Expectativa do Mercado, Produção e Realização
Vamos primeiro aos conceitos.
Para análise utilizarei 3 variáveis sendo duas além dos Gols que são:
- xGB: Expectativa de gols derivada das Odds de fecho da Bookie
@Pinnacle
- xG: Expectativa de Gols retirada do site
@SofascoreBR
Ficarei ausente esta semana devido ao meu serviço de mentoria estar bombando esta semana, mas semana que vem venho com conteúdo novo e inédito. Qualquer coisa chamem em Pv que assim que possível retornarei. Boa Semana a Todos!
Primeiro, como toda a análise vamos aos dados.
Encontrei o site: onde é possível baixar uma quantidade enorme de dados.
Escolhi a LCK de 2024 Summer como exemplo.
Aqui eu coloquei apenas uma opção, existem várias opções, dados por jogo, dados para mapa de chutes, valores de transferência, em fim, uma ampla variedade de opções. Espero que seja útil.
Hoje vou exibir os resultados da temporada passada em modelos não parametricos, gerados por simulação de monte carlo. Ao meu ver o Bootstrap é essencial para diferenciar os comparativos de amostra estimada e média amostral.
Com base na interpretação dos dados podemos notar que
@MrCaos1900
@Sharpcast_
A nível BR, está muito acima da expectativa, s/ dúvidas a série até agora é excelente. Quem realmente está interessado em aprender só neste ep pode-se tirar vários insights e várias lições e tópicos a pesquisar, basta querer. Ele só faltou pegar na mão e ensinar... Valorizem.
Mas o ponto principal aqui é compartilhar como as demais linhas de gols são calculadas, como as "quebradas" 1.25 Gols, 2.25 Gols, 2.75 Gols, 1.00 Gols e assim por diante.
@randolfeap
Senador com todo o respeito, não é possível, ter que instaurar outra CPI para enquadrar p PGR. Existem outros meios para isto, peçam impeachment logo de uma vez! Chega de discursos, é hora de ação. Grande Abraço!
Não que eu ache que médias tenham e ou tragam vantagens para apostar, mas para fins de conhecimento prévio pode ser útil dependendo evidentemente de como vão utilizar.
Vamos lá, vou pegar as médias de gols do campeonato Brasileiro até aqui. Não vou separar neste exemplo casa e fora, vamos aos números gerais para não tornar o post muito longo:
Após instalar o pacote, e carregá-lo, utilizando a função para baixar os dados do Sofascore basta digitar o seguinte:
sofascore.scrape_league_stats(league="Argentina Liga Profesional", season="2024", save_csv=False, accumulation="per90")
Se quiserem saber os nomes das variáveis, vejam aqui no glossário do site:
Baixei estes dados no Excel e adicionei uma coluna de Percentual de Vitórias:
🧓🏽 Sou do tempo em que e-mail era praticamente SMS! 📷 Então, juventude, deem uma olhadinha na caixa de entrada de vez em quando... (INCLUSIVE CAIXA DE SPAM) vai que tem uma mensagem minha! 📷
#OldSchool
#VintageTech
Assim, para o campeonato brasileiro, considerando apenas o realizado, de acordo com as médias simples destaco as linhas que "devem" estar mais próximas do real entre 40% e 60%:
@kkaio54
Me espanta, é q vemos coisas bizarras, como "cientistas de dados" se vangloriando d ter criado sites mirabolantes, planilhas, q apenas mostram médias, desvios padrões, coeficientes de variação, incentivando overfitting, +Ev é besteira, e a qtd de seguidores é + assustadora ainda.
Expectativa do Mercado vs Realizado
Com as ligas em sua reta final, decidi dar uma olhada em quais times estão superando a expectativa de gols derivada das odds até o momento.
xPTSB - Expected Points Bookies - Basketball
Saindo um pouco do futebol, decidi dar uma olhada de como está o desempenho das equipes da NBA em comparação com a previsão da Pinnacle. Escolhi a Pinnacle por já ter uma base de dados e webscraping pronto.
Para quem já conhece Python, está aprendendo ou quer aprender, verão que é bem fácil e prático baixar dados com este pacote, por exemplo abaixo vou baixar todos os dados de jogadores da primeira divisão da Argentina.
Escolha a opção Correlação.
Em seguida clique em intervalo de entrada e selecione todos os dados, e marque a caixinha Rótulos na primeira linha para que o Excel entenda isto e clique em OK.
Para a Linha de 2.00 gols basta pegar o Over 1.50 -> 75% Somar com a Linha 2.50 -> 75% e dividir por 2 ficando = 78.50% e assim sucessivamente ficando assim:
Atenção:
Não é intúito deste post, insentivar a apostar cegamente com estas fórmulas, mas sim trazer inspiração e ajudá-los a sair um pouco da caixa e pensar em alternativas diferentes do divulgado e conhecido em nossa comunidade. Testem, brinquempesquisem.
Por exemplo a linha 0.75 gols é a soma da linha 0.50 = 84,90% com a linha 1.00 = 84.90% e dividido por 2 que fica igual a 89,90%, assim para as demais linhas, ficando assim a tabela completa:
Vamos começar calculando as linhas de gols inteiras, o cálculo é bem simples, para calcular a linha 1.00 gols basta pegar o Over 0.50 -> 95% Somar com a Linha 1.50 -> 75% e dividir por 2 ficando = 84,90%.
Como estou de folga hoje, (trabalho de Terça a Sábado) vou dar um pouco de atenção aqui, postando duas análises ainda hoje sobre a primeira Rodada do Brasileirão.
Vamos pegar um exemplo de um jogo que irá acontecer daqui a pouco entre Sevilla e o Real Betis.
Vamos pegar a linha Total Equipe - Jogo / Partida (que é quantos gols a Pinnacle espera que cada equipe marque.
@gustavouribe
@CNNBrasil
Dúvido, já disse inclusive que só irá a debates se não tocarem em assuntos "pessoais, envolvendo seus familiares", ou seja, fiquem de olho, desculpas mais surgirão daqui para frente.
O passo seguinte foi verificar através de análise de Dados no Excel a correlação entre todas as variáveis.
Clicando em dados e posteriormente em análise de dados abrirá a seguinte janela:
Vantagens com Relação a Poisson:
- Probabilísticamente não há grandes diferenças, a grande vantagem é q apesar de a fórmula ser um pouco maior, é possível montarem suas planilhas em apenas uma linha como no exemplo abaixo, não precisando daquele famoso quadro d gols de Poisson:
Brasileirão 2023
Vamos Analisar o realizado versus a expectativa da Pinnacle com relação aos gols marcados até aqui.
Observem que por enquanto, nas últimas semanas os gols marcados (linha verde) está acima do previsto pela bookie (linha rosa).
O MKT de futebol é originado de apenas uma matriz independente da distribuição de probabilidade. Logo, se vc está modelando regressões lineares derivada de odds, evidentemente que terá correlação alta.
Na próxima Semana
- Gerando expectativa de Gols das Odds I
- Gerando expectativa de Gols das Odds II
- Gerando expectativa de Gols das Odds III
- Gerando expectativa de Pontos das Odds I
E tem muito mais.....
Obrigado pelas respostas, agora está dentro do esperado...kkkk perdi a manhã modelando, e tentando achar a razão de o modelo estar dando "estranhos"!!!!👊
Assim, bem simples, como ponta pé inicial, vocês podem utilizar estes conceitos aqui explicados para uma infinidade de coisas, números de Kills, por exemplo, é só identificarem métricas que mais se ajustam, em fim, há váaaaarias maneiras de fazerem isso.....
Podendo ainda selecionar somente uma categoria de jogadores, como Goleiros, meio campistas, Defensores, Atacantes... E também se quer totais, por 90 minutos ou por jogo:
Vamos começar pelo Sevilla, não vou me ater em qual a melhor maneira de retirar o Juice, por isto, vou usar a maneira mais simples que é apenas a divisão da probabilidade pelo total com juice :
Assim, em teoria a probabilidade dele marcar mais de 1,50 é de 45,87%.
O que vamos fazer agora, vamos usar o Solver do Excel para que nos ajude a encontrar qual seria a Expectativa de Gols através de ums distribuição de Poisson .
Primeiro precisaremos utilizar a seguinte fórmula no excel:
@eugenioleal
O que equivale a dizer que a Tombense para cada xPts ( que é derivado do xG e xGA), gerou apenas 0,50 pontos e o Novohorizontino 0,49, enquanto o Vitória tem 1,30. Já p Atletico GO está em uma "maré de sorte", pois devem ter convertidos xG's de probabilidades baixas.
Com essa simples linha de código e mudando alí na programação o save_CSV de False para True, terá dados de 831 jogadores só deste torneio e poderão abrir no Excel e pegar o que os interessa:
Na próxima postagem adicionaremos dados para simularmos entre a Expectativa xGB e uma média simples de Gols de ambas as equipes para identificarmos se a mesma tivesse valor, se o mesmo (+EV), se perde ou aumenta também no decorrer do tempo.