Reconocimiento de patrones auditivos en ambientes ruidosos

Miniatura
Date
2009
Director(es) - Asesor(es)
Journal Title
Journal ISSN
Volume Title
Publisher
Fundación Universitaria San Martín
Abstract
El presente proyecto desarrolla una aplicación orientada al reconocimiento de patrones de voz en ambientes ruidosos mediante la utilización de un algoritmo de filtrado Mel, herramienta matemática ampliamente empleada en el análisis y procesamiento digital de señales de audio para la identificación de palabras y fonemas. La investigación parte del proceso de digitalización de la señal de audio, mediante el cual las señales de voz son convertidas del dominio del tiempo continuo al dominio del tiempo discreto, utilizando archivos de audio en formato WAV obtenidos a partir de grabaciones realizadas previamente. Posteriormente, las señales son sometidas a un proceso de filtrado digital con el propósito de reducir el ruido y mejorar las condiciones para su análisis, generando archivos con un ancho de banda de 8 kHz. Como parte del procesamiento de la información, se aplica la Transformada Discreta de Fourier (DFT), permitiendo representar la señal de audio en el dominio de la frecuencia y obtener características espectrales relevantes para el reconocimiento de patrones. Adicionalmente, se realiza un análisis sinusoidal de la voz que facilita la identificación y representación de los componentes más significativos de la señal mediante espectrogramas de frecuencia. El sistema contempla la representación temporal y espectral de la energía de la señal de audio, permitiendo la observación y análisis de espectrogramas tanto en ambientes con presencia de ruido como en condiciones controladas. Finalmente, se efectúa una comparación entre los espectrogramas obtenidos con el fin de verificar la existencia o ausencia de una palabra o fonema específico dentro de la señal analizada. Los resultados obtenidos demuestran la utilidad del filtrado Mel y del análisis espectral para el reconocimiento de patrones auditivos en entornos ruidosos, constituyéndose en una herramienta de apoyo para aplicaciones de procesamiento digital de voz y reconocimiento automático del habla.
Description
Keywords
patrones auditivos, análisis espectral, transformada discreta de Fourier
Citation