Problema 3

Título do Desafio: Diversidade na Análise de Clusters.

Breve descrição do desafio:

Na Análise de Clusters, dado um conjunto de dados X e uma matriz de distâncias em X, procura-se uma partição de X em p subconjuntos, de tal forma que os elementos do mesmo grupo fiquem próximos uns dos outros (e os elementos de subconjuntos diferentes fiquem distantes uns dos outros). Ao mesmo tempo, um representante de cada grupo é escolhido.

Suponhamos um problema em que a equidade é considerada: temos uma ou várias características categóricas (no caso mais simples, uma variável binária), identificando questões sensíveis (e.g. raça, género, nacionalidade, etc.). Os protótipos selecionados podem não ser diversificados o suficiente em termos de tais características.

O desafio é modelar o problema incorporando um critério de diversidade para os representantes escolhidos. Um modelo de otimização matemática será desenvolvido e um algoritmo será desenhado e implementado para enfrentar o desafio.

 

Conhecimentos de matemática | Os estudantes necessitam de ter conhecimentos básicos de alguma linguagem de programação, estatística básica e/ou análise de dados.

Coordenador | Emilio Carrizosa, Departamento de Estatística e Investigação Operacional da Universidade de Sevilha, Espanha.