Procedimientos de clasificación con recortes

Alumna investigadora: Pablo Andrés Salgado

Departamento o Instituto Universitario: Departamento de Estadística e investigación Operativa

Tareas realizadas:

En una primera fase del proyecto he realizado una recopilación de textos acerca de los primeros métodos de clustering que incluyeron un recorte de los datos, como las k-medias recortadas y sus posteriores evoluciones. A continuación, he dedicado una etapa a la comprensión y estudio de estos textos y de sus resultados teóricos, sentando así una base de conocimiento necesaria para el posterior desarrollo. Tras esto llevé a cabo una síntesis de los aspectos más importantes de estos métodos de clustering robusto, como sus motivaciones, desarrollo y evolución, con la consecuente redacción en LaTeX. Además, realicé una adaptación de los de ayuda en la elección de los parámetros de los modelos previamente descritos, así como de otras variantes y generalizaciones de principales resultados teóricos, unificando la notación de los distintos textos y generalizando algunos resultados solamente probados para un caso concreto en la bibliografía original. Una vez desarrollada la parte teórica de esta primera mitad del trabajo empleé el lenguaje de programación R para ejecutar la aplicación de los distintos métodos sobre conjuntos de datos reales como ‘palmerpenguins’ o ‘faithful’, obteniendo representaciones gráficas de las clasificaciones obtenidas, las cuales usé para discutir y comparar la adecuación de estos modelos a distintos contextos. La segunda mitad del trabajo incluye la descripción de herramientas los mismos. En esta etapa también lleve a cabo una revisión y estudio de textos acerca de estos temas, su síntesis y desarrollo, y por un recorte de los datos, como las k-medias recortadas y sus posteriores evoluciones. A continuación, he dedicado una etapa a la último la implementación en R de alguno de ellos como apoyo de las explicaciones y discusiones contenidas en la memoria del proyecto. Durante el transcurso del desarrollo de este trabajo he realizado numerosas reuniones con mi tutor, el cual ha ido me ha dirigido hacia los temas más importantes de este amplio campo, ha resuelto las dudas que me han ido surgiendo y me ha proporcionado funciones de R desarrolladas en el departamento de Estadística e investigación Operativa necesarias para la implementación de algunos de los métodos presentes en mi trabajo.

Objetivos alcanzados:

  • Elaborar un resumen crítico de la evolución de los métodos de clustering robusto basados en el recorte.
  • Unificar y completar los resultados de existencia y consistencia de las k-medias recortadas.
  • Discutir y comparar la utilización de estos métodos en distintos contextos.
  • Generar gráficas con ejemplos visuales de aplicación de los métodos facilitando el seguimiento del desarrollo planteado: lenguaje de programación R.

Sectores de aplicación:

Los métodos de clustering robusto presentados en este trabajo tiene aplicación en campos diversos como biología, marketing, sociología,
machine learning… y prácticamente cualquier sector en el que haya que llevar a cabo una clasificación de datos.

Metodología utilizada:

Para la realización del estudio de los distintos métodos de clustering robusto se ha seguido la siguiente estructura:

  • Búsqueda de datasets incluídos en R apropiados para el correspondiente estudio o generación de conjuntos de datos propios ante la ausencia de conjuntos apropiados ya existentes.
  • Aplicación de los métodos presentados en el trabajo mediante funciones incluídas en paquetes de R: tclust, trimcluster…
  • Aplicación de herramientas de decisión como las curvas CTL o el TBIC para la elección de los parámetros de cada modelo.
  • Representación gráfica de las clasificaciones obtenidas y conclusiones.

Opinión sobre la experiencia investigadora desarrollada:

Esta experiencia ha sido muy enriquecedora tanto a nivel académico como a nivel personal. Me ha permitido conocer otros jóvenes investigadores a través de las reuniones de becarios organizadas, compartiendo nuestras experiencias y aprendiendo de profesionales de la investigación. Además, la realización de un proyecto de este tipo me ha hecho crecer enormemente a muchos niveles, adquiriendo experiencia y desarrollando habilidades clave como el pensamiento crítico, la gestión del tiempo y la comunicación científica.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies