Filtro pasa banda en Matlab implementado en ESP32-CAM, el INMP441 y el amplificador MAX98357

Para filtrar la voz humana, un filtro pasa banda ideal suele situarse entre los 300 Hz y 3400 Hz (el estándar de telefonía), lo que elimina ruidos de baja frecuencia (motores, zumbidos eléctricos) y siseos de alta frecuencia.

Dado que el INMP441 y el MAX98357 funcionan de maravilla a 16000 Hz de muestreo, diseñaremos el filtro para esa frecuencia.

Paso 1: Diseño del Filtro en MATLAB

Usaremos un filtro IIR de tipo Butterworth porque es eficiente para procesar en tiempo real en un microcontrolador.

Matlab

fs = 16000;       % Frecuencia de muestreo
f1 = 300;         % Corte inferior (Voz)
f2 = 3400;        % Corte superior (Voz)
order = 2;        % Orden del filtro (2 es suficiente y estable)

% Diseñar el filtro pasa banda
[b, a] = butter(order, [f1 f2]/(fs/2), 'bandpass');

% Mostrar coeficientes para C++
fprintf('Coeficientes B (Numerador): %.10f, %.10f, %.10f, %.10f, %.10f\n', b);
fprintf('Coeficientes A (Denominador): %.10f, %.10f, %.10f, %.10f, %.10f\n', a);

% Opcional: Ver la respuesta en frecuencia
freqz(b, a, 1024, fs);

Paso 2: Implementación en la ESP32-CAM

Para implementar esto en la ESP32 sin consumir toda la CPU, usaremos la Ecuación en Diferencias. Un filtro de orden 2 genera 5 coeficientes para el numerador ($b$) y 5 para el denominador ($a$).

Nota sobre la PSRAM: Como mencionaste antes, evitaremos usar malloc y usaremos variables de punto flotante para el cálculo del filtro.

C++

#include <driver/i2s.h>

#define I2S_WS      15
#define I2S_SD_IN   13
#define I2S_SD_OUT  2
#define I2S_SCK     14
#define SAMPLE_RATE 16000

// Coeficientes obtenidos de MATLAB (Ejemplo para 300-3400Hz @ 16kHz)
float b[] = {0.2452, 0, -0.4905, 0, 0.2452};
float a[] = {1.0000, -1.1322, 0.5824, -0.1982, 0.0461};

// Variables de estado del filtro (Delays)
float x[5] = {0, 0, 0, 0, 0}; // Entradas pasadas
float y[5] = {0, 0, 0, 0, 0}; // Salidas pasadas

void setup() {
  Serial.begin(115200);
  
  i2s_config_t i2s_config = {
    .mode = (i2s_mode_t)(I2S_MODE_MASTER | I2S_MODE_RX | I2S_MODE_TX),
    .sample_rate = SAMPLE_RATE,
    .bits_per_sample = I2S_BITS_PER_SAMPLE_32BIT,
    .channel_format = I2S_CHANNEL_FMT_ONLY_LEFT,
    .communication_format = I2S_COMM_FORMAT_STAND_I2S,
    .intr_alloc_flags = ESP_INTR_FLAG_LEVEL1,
    .dma_buf_count = 4,
    .dma_buf_len = 256,
    .use_apll = false
  };

  i2s_pin_config_t pin_config = {
    .bck_io_num = I2S_SCK,
    .ws_io_num = I2S_WS,
    .data_out_num = I2S_SD_OUT,
    .data_in_num = I2S_SD_IN
  };

  i2s_driver_install(I2S_NUM_0, &i2s_config, 0, NULL);
  i2s_set_pin(I2S_NUM_0, &pin_config);
}

void loop() {
  int32_t sample_in = 0;
  int32_t sample_out = 0;
  size_t bytes_read, bytes_written;

  // Leer 1 muestra (4 bytes debido a 32 bits)
  if (i2s_read(I2S_NUM_0, &sample_in, 4, &bytes_read, portMAX_DELAY) == ESP_OK) {
    
    // 1. Convertir a flotante y normalizar (el INMP441 es de 24 bits efectivos)
    float input = (float)(sample_in >> 8); 

    // 2. Aplicar Ecuación en Diferencias (Filtro IIR)
    // y[n] = b0*x[n] + b1*x[n-1] ... - a1*y[n-1] - a2*y[n-2] ...
    float output = b[0]*input + b[1]*x[1] + b[2]*x[2] + b[3]*x[3] + b[4]*x[4]
                              - a[1]*y[1] - a[2]*y[2] - a[3]*y[3] - a[4]*y[4];

    // 3. Actualizar estados (Shifting)
    for(int i=4; i>0; i--) {
      x[i] = x[i-1];
      y[i] = y[i-1];
    }
    x[0] = input;
    y[0] = output;

    // 4. Evitar saturación y reconvertir a entero para el MAX98357
    // Aplicamos una ganancia digital (0.5) para dejar margen de seguridad
    sample_out = (int32_t)(output * 0.5f) << 8;

    // Enviar al amplificador
    i2s_write(I2S_NUM_0, &sample_out, 4, &bytes_written, portMAX_DELAY);
  }
}

Cómo evitar la saturación en este código:

  1. Atenuación en el Filtro: En la línea sample_out = (int32_t)(output * 0.5f) << 8;, el factor 0.5f reduce la amplitud a la mitad. Si escuchas que se corta el sonido, baja ese valor a 0.2f.

  2. Manejo de Bits: El INMP441 envía datos de 24 bits alineados a la izquierda en una palabra de 32 bits. Por eso hacemos el desplazamiento >> 8 al leer y << 8 al escribir para mantener la precisión.

  3. Estabilidad: Los filtros IIR pueden volverse inestables si los coeficientes son muy grandes. El diseño Butterworth de orden 2 es muy robusto para la ESP32.

Consejo para la ESP32-CAM: Si notas que el audio hace «clics», intenta deshabilitar el Wi-Fi (WiFi.mode(WIFI_OFF);), ya que las interrupciones del radio suelen interrumpir el flujo constante del I2S.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *