Problema 3

Título |Diversidad en el análisis de conglomerados.

Breve descripción | En el análisis de conglomerados, dado un conjunto de datos X y una matriz de distancias en X, se busca una partición de X en p subconjuntos de tal manera que los elementos del mismo grupo estén cerca unos de otros (y los elementos de diferentes subconjuntos estén lejos unos de otros). otro). Al mismo tiempo, se elige un representante de cada grupo. Supongamos un problema en el que se considera la equidad: tenemos una o varias características categóricas (en el caso más simple, una variable binaria), que identifican cuestiones sensibles (por ejemplo, raza, género, nacionalidad, etc.). Los prototipos seleccionados pueden no ser lo suficientemente diversos en términos de tales características.

El desafío es modelar el problema incorporando un criterio de diversidad para los representantes elegidos. Se desarrollará un modelo de optimización matemática y se diseñará e implementará un algoritmo para abordar el desafío.

Antecedentes matemáticos | Los estudiantes necesitan tener conocimientos básicos de algún lenguaje de programación, estadísticas básicas y/o análisis de datos.

Coordinador | Emilio Carrizosa, Departamento de Estadística e Investigación Operativa, Universidad de Sevilla, España