Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Modelo de identificación de locutor en entornos GSM, aplicación en Colombia / Speaker recognition in GSM environments, application in Colombia

Garavito Neira, Elkin Ramón (2010) Modelo de identificación de locutor en entornos GSM, aplicación en Colombia / Speaker recognition in GSM environments, application in Colombia. Maestría thesis, Universidad Nacional de Colombia.

Texto completo

[img]
Vista previa
PDF - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

1MB

Resumen

Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente, los algoritmos planteados no arrojan niveles satisfactorios de éxito cuando se aplican sobre registros de voz que se han obtenido a partir de teléfonos celulares. Aquí se propone un modelo que arroje una tasa de éxito satisfactoria, aplicada a los registros de voz tomados a través de teléfonos celulares en Colombia, y así abrir un amplio espectro de aplicaciones interesantes que van desde la posibilidad de hacer entrevistas de trabajo a través del teléfono celular, hasta hacer compras o transacciones bancarias; además, consultar los mensajes del contestador a través del celular, identificar a los locutores que hablan en una conversación interceptada con fines delincuenciales, con el objeto de procesar a los culpables, etc. Todo ello sin utilizar claves que usualmente son robadas u olvidadas, ni tarjetas que se puedan perder. La voz convertida en un elemento de identificación inequívoca, como las huellas digitales, y soportado sobre la tecnología celular más difundida en el mundo (GSM) se convierte en una prometedora técnica de gran impacto. Este documento muestra los resultados de un arduo trabajo en la búsqueda de este objetivo, y las conclusiones que se pudieron obtener. / Abstract. A voice recognition system is a system that recognizes a person who is speaking, given his or her voice registry. Nevertheless, all the developments that are found in the databases of papers, libraries and internet researchers, are always warning us about the same inconvenient, the given algorithms don´t throw statistic levels of success when those are applied over voice registries that have been obtained from cellular phones. The purpose of this work, is to propose a model that gives a satisfying success rate applied to voice registries taken through cellular phones in Colombia, and in this way open a interesting and new applications spectrum, that come from doing work interviews through the cellular phone until doing shopping o big bank transactions; form consulting the voice messages in the answering machine through the cell phone, until identify the speaker that talk in an intercepted communication in a law apprehension effort. All of this without the using of keys that can be stolen or forgotten, neither cards that can be lost. The voice would become an element of identification without errors, such as fingerprints, and supported in the most well known cellular technology in the world (GSM), with all these elements, this becomes a promising technology of great impact. This document pretends to show the results of the hard work in pursue for that objective, and the conclusions that could have got.

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Rojas Camacho, Oswaldo
Información adicional:Maestría en ingeniería - Telecomunicaciones
Palabras clave:Reconocimiento de voz; Procesamiento de señales; MFCC; Coeficientes cepstrales de frecuencia MEL; LPCC; Coefficientes Cepstrales de predicción lineal; DWT; Transformada discreta de Wavelet; Voice recognition Signal Processing; MFCC; Mel Frequency Cepstral Coefficients; LPCC; Linear Predicting Coding Coefficients; DWT; Discrete Wavelet Transform
Temática:3 Ciencias sociales / Social sciences > 38 Comercio, comunicaciones, transporte / Commerce, communications & transportation
6 Tecnología (ciencias aplicadas) / Technology > 62 Ingeniería y operaciones afines / Engineering
Unidad administrativa:Sede Bogotá > Facultad de Ingeniería > Departamento de Ingeniería de Sistemas e Industrial
Código ID:3149
Enviado por : Universidad Nacional de Colombia Biblioteca Digital - Sede Bogotá
Enviado el día :18 Febrero 2011 17:22
Ultima modificación:18 Febrero 2011 17:22
Ultima modificación:18 Febrero 2011 17:22
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Registry of Open Access Repositories OpenDOAR Metabiblioteca BDCOL OAIster Red de repositorios latinoamericanos DSpace BASE Open archives La referencia Colombiae Open Access Theses and Dissertations Tesis latinoamericanas CLACSO
Este sitio web se ve mejor en Firefox