Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo

Sarria Paja, Milton Orlando (2009) Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.

Texto completo

[img]
Vista previa
PDF - Versión Enviada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

1MB

Resumen

En esta tesis se presenta una metodología orientada a mejorar la identificación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas específicas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimiento de patrones. Para clasificar datos que se desarrollan a lo largo de un argumento como el tiempo entre otras técnicas, es de amplio conocimiento el uso de modelos ocultos de Markov. Al emplear un sistema de clasificación basado en modelos ocultos de Markov, necesariamente se debe resolver el problema de entrenamiento, que implica el ajuste de los parámetros del modelo mediante la optimización de una función objetivo. La forma y características de dicha función viene determinado por el criterio de entrenamiento que puede ser generativo o discriminativo, donde las técnicas de entrenamiento discriminativo se consideran mucho más adecuadas en la solución de problemas como el que se ha puesto en consideración. Por lo tanto abordando la filosofía de entrenamiento discriminativo se propone emplear un criterio de entrenamiento que no solo esté enfocado minimizar la probabilidad del error o generar fronteras de decisión adecuadas, si no también en la optimización de una medida de desempeño mucho más general que el error de clasificación, para tal fin se sugiere el empleo de una función de costo que se relacione indirectamente con el área que encierra una curva de desempeño mediante una distancia entre modelos de clases. En particular se propone emplear la distancia de Mahalanobis como función objetivo, y como medida de desempeño el area de la curva ROC, complementando esto con una técnica de selección y/o extracción de características relativamente simple. Los resultados experimentales se presentan sobre dos bases de datos de patologías de voz y muestran que la metodología propuesta permite mejorar el desempeño de un sistema de clasificación, incluso cuando la dimensión del espacio de entrenamiento se ha reducido significativamente.

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Castellanos Domínguez, César Germán
Palabras clave:Reconocimiento automático de la voz; Reconocimiento de modelos; Procesos de Markov.
Temática:6 Tecnología (ciencias aplicadas) / Technology > 62 Ingeniería y operaciones afines / Engineering
Unidad administrativa:Sede Manizales > Facultad de Ingeniería y Arquitectura
Código ID:2089
Enviado por : Biblioteca Digital Universidad Nacional de Colombia - Sede Manizales
Enviado el día :29 Septiembre 2010 16:43
Ultima modificación:15 Febrero 2011 02:44
Ultima modificación:15 Febrero 2011 02:44
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Registry of Open Access Repositories OpenDOAR Metabiblioteca BDCOL OAIster Red de repositorios latinoamericanos DSpace BASE Open archives La referencia Colombiae Open Access Theses and Dissertations Tesis latinoamericanas CLACSO
Este sitio web se ve mejor en Firefox