<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/e5d961b4-c1af-420c-a44a-a3ec27d18604/866f9dbc-b624-4d9e-85c4-d3478210d4b9/Facetime.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/e5d961b4-c1af-420c-a44a-a3ec27d18604/866f9dbc-b624-4d9e-85c4-d3478210d4b9/Facetime.png" width="40px" /> "The true measure of a man is not his intelligence or how high he rises in this freak establishment. No, the true measure of a man is this: how quickly can he respond to the needs of others and how much of himself he can give" — Philip K. Dick

</aside>


Olá! Se você encontrou este documento, significa que ou foi tapeado ou me conhece... De qualquer forma, seja bem-vindo!

Meu nome é Lucas Leão, sou Cientista de Dados — ou pelo menos tento ser. Se você, assim como eu, já se sentiu estagnado e desejava se aperfeiçoar em alguma tecnologia ou teoria que só ouvia falar, saiba que estamos no mesmo barco.

Durante minha jornada criando modelos de Machine Learning, uma dúvida persistia: como posso ter mais confiança nos meus modelos? Não me entenda mal! Confio nas minhas habilidades, mas busco uma garantia extra na modelagem para evitar futuras dores de cabeça, tendo melhor noção sobre as incertezas das predições.

Segundo o artigo Is there a role for statistics in artificial intelligence?, a quantificação de incerteza é frequentemente negligenciada em aplicações de inteligência artificial por dois motivos principais:

Nos últimos anos, surgiram diversas propostas para quantificar incerteza em modelos de Machine Learning e Deep Learning. No entanto, apenas o método de Previsão Conforme teve sua validade teórica comprovada, demonstrando intervalos de previsão que fornecem cobertura empírica efetiva para dados futuros — ou seja, um intervalo de previsão que de fato cobre valores futuros em (1 - α) das vezes.

Este documento é um diário dessa jornada para explorar tanto a quantificação de incerteza quanto novos métodos de balanceamento de modelo. Nele, desenvolvi duas camadas adicionais ao modelo de RandomForestClassifier, atrelado ao meu objetivo de estudo. Se encontrar qualquer erro ou tiver sugestões de melhoria, por favor, mande-me um e-mail sem receio. Ficarei grato em revisar. Se estiver pensando em aplicar essa metodologia a outro problema, não hesite em me contatar. Valeu!

Conteúdos


Antes de Começarmos…

Probabilidade e Calibração de Modelo

Previsão Conforme

Aprendizado Sensível ao Custo

Classificador Conforme

Extras


Artigos Online