Instruções para a entrega do trabalho final

Parte da avaliação consiste na apresentação de um projeto para solução de um problema prático utilizando um modelo de aprendizado de máquina baseado em rede neural MLP.

No dia 29/10, deverá ser entregue um plano de trabalho, que consiste em um resumo de uma página, descrevendo o problema e o banco de dados a ser utilizado.

  • Considere utilizar um banco de dados público como os disponíveis em https://research.google/resources/datasets/ ou https://www.kaggle.com/datasets. Busque um problema que seja complicado o suficiente para demandar um modelo não linear mas que não seja excessivamente complicado para não demandar um tempo de treinamento muito grande;
  • Procure encontrar um problema menos explorado, no sentido de não ter um número grande de soluções publicadas. Leve em conta que a solução apresentada deve ser original e não deve ser baseada em modelos já publicados;
  • Lembre-se que o banco de dados deverá ser dividido em uma parte para treinamento e outra para teste do modelo.

No dia 10/12, deverá ser entregue um texto no formato de artigo, com 5 páginas, que não será publicado.

  • O texto deve descrever o problema, o banco de dados, o modelo utilizado, as métricas utilizadas para medida de desempenho, os resultados obtidos e as conclusões;
  • O texto pode ser escrito em português ou inglês;
  • Devem ser incluídas justificativas para as escolhas realizadas: arquitetura do modelo, hiperparâmetros, função custo, otimizador, medidas de desempenho, etc.;
  • O modelo deve obrigatoriamente consistir em uma rede neural MLP;
  • Não é permitido o uso de modelos pré-treinados, ainda que seja para inicialização do treinamento (estratégia de ajuste fino);
  • Para implementação do modelo e treinamento da rede neural, a sugestão é que seja utilizado um framework de redes neurais, como o PyTorch. No entanto, isso não é obrigatório, podendo ser utilizada outra solução ou mesmo outra linguagem de programação, caso desejado;
  • Além do texto, deverão ser entregues os códigos para (i) preparação do ambiente (configurações gerais, transformação dos dados, etc.) (ii) treinamento e (iii) avaliação do modelo treinado. A sugestão é que seja utilizado um Jupyter Notebook com o código e texto explicativo.

O trabalho deve ser apresentado no dia 11/12, durante a aula e as apresentações devem durar 20 minutos (~15 minutos de apresentação e ~5 minutos para perguntas).