Proyectos


SISTEMA AUTOMÁTICO DE APRENDIZAJE DE MÁQUINA BASADO EN REDES NEURALES PARA LA CLASIFICACIÓN DE DATOS DESBALANCEADOS

 

INVESTIGADOR(ES) PRINCIPAL(ES):

NOMBRE
DEDICACIÓN

Jhoan Keider Hoyos Osorio

0 horas

 

CODIGO CIE

E6-18-5

NOMBRE DEL GRUPO DE INVESTIGACIÓN
PROPONENTE

AUTOMÁTICA

SI
NOMBRE
PARTICIPACION
DEDICACIÓN

Alvaro Angel Orozco Gutiérrez

Tutor

0 Horas

 

TIPO DE CONVOCATORIA

2017. Estudiantes De Posgrado

TIPO DE PROYECTO

Investigación Básica

OBJETIVO(S)

Objetivo general: Desarrollar un sistema automático de aprendizaje de máquina para la clasificación de conjuntos de datos desbalanceados, basada en técnicas de muestreo y redes neuronales, que permita identificar estructuras relevantes de datos y que evite el sobre ajuste de entrenamiento en términos de medidas de sensibilidad y especificidad. Objetivos específicos: 1) Desarrollar una metodología de sub-muestreo basada en técnicas de agrupamiento no supervisado, con el fin de codificar estructuras relevantes de datos en tareas de clasificación desbalanceadas. 2) Formular una metodología discriminante de sub-muestreo para problemas de clasificación con grandes cantidades de datos, a partir del uso de métodos de ensamble, en aras de favorecer la escalabilidad del sistema de aprendizaje. 3) Desarrollar una técnica de sintonización automática de parámetros libres de redes neuronales, para clasificación de datos desbalanceados con el fin de disminuir la sensibilidad del rendimiento de clasificación con respecto a los datos disponibles.

RESUMEN

En el campo del aprendizaje de máquina existen algunos patrones difíciles de detectar, debido a su carácter inusual. Dichos eventos implican bases de datos desbalanceadas, lo que en términos de tareas de clasificación sucede cuando hay más muestras de entrenamiento de una clase que de la otra. El problema del desbalance de clase tiene una importancia crucial, ya que se encuentra en un gran número de dominios de gran importancia ambiental, comercial, biomédico entre otros. Estas bases de datos disminuyen el rendimiento de la mayoría de los algoritmos de clasificación, haciendo que el clasificador se sesgue a la clase mayoritaria, e ignore la clase minoritaria, que en la mayoría de casos es la de mayor relevancia y clasificar erróneamente eventos de esta naturaleza puede resultar en costos elevados. Por tal razón este proyecto tiene como finalidad desarrollar un sistema automático de aprendizaje de máquina para la clasificación de conjuntos de datos desbalanceados, basada en técnicas de muestreo avanzadas, que permita eliminar de manera inteligente muestras de la clase mayoritaria identificando estructuras relevantes de datos, y redes neuronales para su posterior clasificación. Tras finalizar el proyecto se espera contar con una metodología de clasificación de datos desbalanceadas, robusta en términos de los datos disponibles, así como con productos científicos que puedan ser transmitidos en entornos académicos y profesionales del área del aprendizaje de máquina.

ESTADO

Concluye Satisfactoriamente

FECHA DE INICIO

22/01/2018

FECHA DE FINALIZACION

22/01/2020

PRODUCTOS

NOMBRE
CATEGORÍA
ENLACE

Emotion recognition with ensemble using mRMR-based feature selection

Artículos en revista A1 ó A2

metodologia de clasificación de datos desbalanceados bsado en metodos de submuestreo

Maestría o Especialidad clínica

RIS-RELEVANT INFORMATION-BASED SAMPLING

Software

SISTEMA AUTOMÁTICO DE APRENDIZAJE DE MÁQUINA BASADO EN REDES NEURALES PARA LA CLASIFICACIÓN DE DATOS DESBALANCEADOS

Ponencia en evento especializado