Prevendo os resultados do Oscar 2020 com inteligência artificial!

Caíque Coelho
4 min readFeb 3, 2020

--

O ano começa depois do carnaval ou depois do Oscar?

Nesse artigo você não irá encontrar a resposta para a pergunta acima, talvez você encontre mais perguntas do que respostas, ou uma resposta que é uma pergunta ou até uma pergunta que é uma resposta! Afinal, parafraseando uma conhecida citação:

Não são as respostas que movem a inteligência artificial, e sim as perguntas!

Mas pensando em Oscar e Inteligência Artificial, quais perguntas nós realmente queremos fazer aqui? Refletindo um pouco cheguei em algumas indagações:

Dado o histórico de concorrentes as categorias do Oscar e seus devidos vencedores, é possível prever os próximos vencedores? Existe algum padrão entre os ganhadores? Uma inteligência artificial seria capaz de descobrir os futuros vencedores baseado em certas características relevantes sobre os vencedores passados?

Desde 2018 eu tenho trabalhado em respostas e perguntas para essas questões e perante mais um novo ano estou aqui para apresentar os avanços encontrados.

Em 2019 após algumas refatorações e melhorias, como transformação de variáveis categóricas, normalização dos dados e principal component analysis (PCA) os resultados das predições caíram de uma performance de 62.5% de acerto para 37.5%, ou seja, de 5 acertos em 8 predições, para 3 acertos em 8.

Diante da degradação do resultado investi o meu tempo neste ano em simplificar o código, mas ainda mantendo algumas melhorias importantes, como a aplicação de normalização de dados utilizando o algoritmo RobustScaler e transformando as variáveis categóricas em binárias já no próprio dataset, como por exemplo a classificação etária do filme.

Explicando brevemente o código, a estratégia pensada foi utilizar os mais variados algoritmos de classificação como ExtraTreesClassifier, RandomForestClassifier, KNN e etc, para treinar(processo onde o algoritmo lê os dados passados e aprende com eles), gerar o modelo(aqui temos a “inteligência artifical” pronta) e testar a acurácia olhando para resultados passados. Por fim organizei três tipos de resultados seguindo a ordem de prioridade abaixo:

  1. Todos os modelos gerados pelos algoritmos tentam prever os resultados de 2020, após isso todos os resultados são somados e podemos ter um candidato que foi escolhido mais vezes por todos os modelos.
  2. Apenas os modelos com precisão superior a 79% de acerto prevendo os candidatos de teste tentam prever os resultados de 2020, após isso todos os resultados são somados e podemos ter um candidato que foi escolhido mais vezes por todos os modelos.
  3. Utilizo o modelo com maior precisão de acerto para prever os resultados de 2020.

Assim como no passado os modelos de inteligência artificial são treinados utilizando as seguintes informações:

  • Vencedores do Producers Guild of America Awards
  • Vencedores do Golden Globe
  • Tempo do filme em minutos
  • Bilheteria em dólares (Ponto negativo para candidatos da Netflix)
  • IMDB Score
  • Score dos usuários (Metacritic)
  • Score dos críticos (Metacritic)
  • Se o filme foi produzido nos Estados Unidos
  • Classificação Etária
  • Trimestre de lançamento do filme

Neste ano continuei a realizar predições das seguintes categorias:

  • Atriz coadjuvante
  • Ator coadjuvante
  • Roteiro Original
  • Roteiro Adaptado
  • Atriz
  • Ator
  • Filme
  • Diretor

Finalmente vamos ao que interessa para os apostadores, as predições do ano 2020:

Melhor ator coadjuvante: Brad Pitt em Once Upon a Time… in Hollywood

Melhor atriz coadjuvante: Laura Dern em Marriage Story

Melhor roteiro adaptado: Joker, Coringa

Melhor roteiro original: Parasite

Melhor diretor: Sam Mendes em 1917

Melhor ator: Joaquin Phoenix em Coringa

Melhor atriz: Renée Zellweger em Judy

Melhor filme: 1917

Como diria Júlio César: “Alea jacta est”, o dado foi lançado! Agora basta esperar o grande dia, 9 de fevereiro e torcer para Academia não nos surpreender, afinal o que importa é a opinião dos acadêmicos e “Sem dados você é apenas mais uma pessoa com uma opinião.” — William Edwards!

Link para o projeto no Github:

--

--

Caíque Coelho

A QA lover and App Developer on weekends and a Data Scientist on free time. Founder App Teste Eneagrama.