Filtro pasa banda en Matlab implementado en ESP32-CAM, el INMP441 y el amplificador MAX98357
Para filtrar la voz humana, un filtro pasa banda ideal suele situarse entre los 300 Hz y 3400 Hz (el estándar de telefonía), lo que elimina ruidos de baja frecuencia (motores, zumbidos eléctricos) y siseos de alta frecuencia.
Dado que el INMP441 y el MAX98357 funcionan de maravilla a 16000 Hz de muestreo, diseñaremos el filtro para esa frecuencia.
Paso 1: Diseño del Filtro en MATLAB
Usaremos un filtro IIR de tipo Butterworth porque es eficiente para procesar en tiempo real en un microcontrolador.
fs = 16000; % Frecuencia de muestreo
f1 = 300; % Corte inferior (Voz)
f2 = 3400; % Corte superior (Voz)
order = 2; % Orden del filtro (2 es suficiente y estable)
% Diseñar el filtro pasa banda
[b, a] = butter(order, [f1 f2]/(fs/2), 'bandpass');
% Mostrar coeficientes para C++
fprintf('Coeficientes B (Numerador): %.10f, %.10f, %.10f, %.10f, %.10f\n', b);
fprintf('Coeficientes A (Denominador): %.10f, %.10f, %.10f, %.10f, %.10f\n', a);
% Opcional: Ver la respuesta en frecuencia
freqz(b, a, 1024, fs);
Paso 2: Implementación en la ESP32-CAM
Para implementar esto en la ESP32 sin consumir toda la CPU, usaremos la Ecuación en Diferencias. Un filtro de orden 2 genera 5 coeficientes para el numerador ($b$) y 5 para el denominador ($a$).
Nota sobre la PSRAM: Como mencionaste antes, evitaremos usar malloc y usaremos variables de punto flotante para el cálculo del filtro.
#include <driver/i2s.h>
#define I2S_WS 15
#define I2S_SD_IN 13
#define I2S_SD_OUT 2
#define I2S_SCK 14
#define SAMPLE_RATE 16000
// Coeficientes obtenidos de MATLAB (Ejemplo para 300-3400Hz @ 16kHz)
float b[] = {0.2452, 0, -0.4905, 0, 0.2452};
float a[] = {1.0000, -1.1322, 0.5824, -0.1982, 0.0461};
// Variables de estado del filtro (Delays)
float x[5] = {0, 0, 0, 0, 0}; // Entradas pasadas
float y[5] = {0, 0, 0, 0, 0}; // Salidas pasadas
void setup() {
Serial.begin(115200);
i2s_config_t i2s_config = {
.mode = (i2s_mode_t)(I2S_MODE_MASTER | I2S_MODE_RX | I2S_MODE_TX),
.sample_rate = SAMPLE_RATE,
.bits_per_sample = I2S_BITS_PER_SAMPLE_32BIT,
.channel_format = I2S_CHANNEL_FMT_ONLY_LEFT,
.communication_format = I2S_COMM_FORMAT_STAND_I2S,
.intr_alloc_flags = ESP_INTR_FLAG_LEVEL1,
.dma_buf_count = 4,
.dma_buf_len = 256,
.use_apll = false
};
i2s_pin_config_t pin_config = {
.bck_io_num = I2S_SCK,
.ws_io_num = I2S_WS,
.data_out_num = I2S_SD_OUT,
.data_in_num = I2S_SD_IN
};
i2s_driver_install(I2S_NUM_0, &i2s_config, 0, NULL);
i2s_set_pin(I2S_NUM_0, &pin_config);
}
void loop() {
int32_t sample_in = 0;
int32_t sample_out = 0;
size_t bytes_read, bytes_written;
// Leer 1 muestra (4 bytes debido a 32 bits)
if (i2s_read(I2S_NUM_0, &sample_in, 4, &bytes_read, portMAX_DELAY) == ESP_OK) {
// 1. Convertir a flotante y normalizar (el INMP441 es de 24 bits efectivos)
float input = (float)(sample_in >> 8);
// 2. Aplicar Ecuación en Diferencias (Filtro IIR)
// y[n] = b0*x[n] + b1*x[n-1] ... - a1*y[n-1] - a2*y[n-2] ...
float output = b[0]*input + b[1]*x[1] + b[2]*x[2] + b[3]*x[3] + b[4]*x[4]
- a[1]*y[1] - a[2]*y[2] - a[3]*y[3] - a[4]*y[4];
// 3. Actualizar estados (Shifting)
for(int i=4; i>0; i--) {
x[i] = x[i-1];
y[i] = y[i-1];
}
x[0] = input;
y[0] = output;
// 4. Evitar saturación y reconvertir a entero para el MAX98357
// Aplicamos una ganancia digital (0.5) para dejar margen de seguridad
sample_out = (int32_t)(output * 0.5f) << 8;
// Enviar al amplificador
i2s_write(I2S_NUM_0, &sample_out, 4, &bytes_written, portMAX_DELAY);
}
}
Cómo evitar la saturación en este código:
-
Atenuación en el Filtro: En la línea
sample_out = (int32_t)(output * 0.5f) << 8;, el factor0.5freduce la amplitud a la mitad. Si escuchas que se corta el sonido, baja ese valor a0.2f. -
Manejo de Bits: El INMP441 envía datos de 24 bits alineados a la izquierda en una palabra de 32 bits. Por eso hacemos el desplazamiento
>> 8al leer y<< 8al escribir para mantener la precisión. -
Estabilidad: Los filtros IIR pueden volverse inestables si los coeficientes son muy grandes. El diseño Butterworth de orden 2 es muy robusto para la ESP32.
Consejo para la ESP32-CAM: Si notas que el audio hace «clics», intenta deshabilitar el Wi-Fi (WiFi.mode(WIFI_OFF);), ya que las interrupciones del radio suelen interrumpir el flujo constante del I2S.
