
Revista Elektron, Vol. 10, No. 1, pp. 41–51 (2026)
https://doi.org/10.37537/rev.elektron.10.1.227.2026
Original Article
Tabla V: Estimaci
´
on de recursos requeridos por cada bloque sobre un microcontrolador con 520 kB RAM y 4 MB Flash.
Bloque Flash [kB] RAM [kB] Uso de CPU Porcentaje del recurso
Filtro Butterworth 6º orden (3 SOS) – 0.10 3–5 % <0.01 % Flash, 0.02 % RAM
Extracci
´
on de caracter
´
ısticas (catch22) ≈15 ≈5 15–25 % 1.0 % Flash, 1.0 % RAM
Clasificador TFLite (int8) 4.46 1.48 <1 % 0.1 % Flash, 0.3 % RAM
Las estimaciones reportadas en la Tabla V se obtuvieron
mediante una combinaci
´
on de herramientas de simulaci
´
on y
an
´
alisis directo de implementaci
´
on. En el caso del clasifi-
cador, el consumo de memoria (Flash y RAM) se obtuvo a
partir de la herramienta TensorFlow Lite, que proporciona
autom
´
aticamente el tama
˜
no del modelo y la asignaci
´
on de
tensores durante la inferencia. Para la etapa de extracci
´
on de
caracter
´
ısticas (catch22), los valores se estimaron a partir de
su implementaci
´
on en C, considerando tanto el tama
˜
no del
c
´
odigo compilado como la memoria necesaria para buffers
intermedios. En el caso del filtrado digital, los requerimientos
de memoria y c
´
omputo se estimaron anal
´
ıticamente a partir
de la estructura del filtro IIR, teniendo en cuenta la cantidad
de secciones de segundo orden y las variables de estado
asociadas. El uso de CPU se aproxim
´
o en funci
´
on del n
´
umero
de operaciones por muestra y fue contrastado mediante per-
files de ejecuci
´
on en plataformas embebidas representativas.
La referencia a un microcontrolador con 520 kB de RAM
y 4 MB de Flash corresponde a una configuraci
´
on t
´
ıpica
dentro de la familia STM32 (por ejemplo, dispositivos de la
serie STM32F4), comparable con plataformas ampliamente
utilizadas como ESP32. El objetivo de esta referencia es
validar la viabilidad del sistema en hardware de bajo costo,
m
´
as que apuntar a un dispositivo espec
´
ıfico. En este sentido,
los valores reportados deben interpretarse como estimaciones
de orden de magnitud orientadas al dise
˜
no del sistema.
En la Tabla V se observa que la etapa de extracci
´
on
de caracter
´
ısticas mediante catch22 constituye el bloque
m
´
as costoso del sistema en t
´
erminos de memoria y uso de
CPU. Esta etapa requiere aproximadamente 15 kB de Flash,
5 kB de RAM y entre un 15 % y un 25 % del tiempo de
procesamiento, superando ampliamente a los requerimientos
del filtrado y del clasificador cuantizado.
En contraste, el filtrado digital presenta un impacto m
´
ınimo
sobre los recursos del sistema. El filtro Butterworth pasa-
banda de sexto orden requiere del orden de 100 bytes de
memoria y un uso de CPU inferior al 5 %, lo que confirma
que su implementaci
´
on directa en el microcontrolador resulta
viable y no constituye un factor limitante. En t
´
erminos
de desempe
˜
no del clasificador, no se observan diferencias
significativas entre el uso de filtrado digital y anal
´
ogico, tal
como se evidenci
´
o en las simulaciones comparativas realiza-
das. Por otra parte, dado que el filtrado digital presenta un
impacto m
´
ınimo en el uso de recursos del microcontrolador
(Tabla IV), su implementaci
´
on resulta suficiente dentro del
esquema propuesto.
Asimismo, el an
´
alisis presentado en esta secci
´
on respecto
del filtrado se centra exclusivamente en su impacto en los
recursos del sistema embebido y en la viabilidad de su
implementaci
´
on, y no en una comparaci
´
on exhaustiva entre
distintas t
´
ecnicas de filtrado. En este sentido, las considera-
ciones realizadas tienen como objetivo justificar la elecci
´
on
de una soluci
´
on compatible con las restricciones de hardware
sin afectar el desempe
˜
no del clasificador.
En relaci
´
on con el submuestreo considerado durante la
etapa de entrenamiento, se observa que una tasa efectiva equi-
valente a 300 kHz/16 resulta compatible con las prestaciones
de un microcontrolador de bajo costo, cumpliendo con las
restricciones de hardware de recursos limitados. Si bien esta
frecuencia no satisface estrictamente el criterio de Nyquist
para toda la banda de inter
´
es (0–20 kHz), el submuestreo con
factor 16 proporciona el mejor desempe
˜
no del clasificador en
las pruebas realizadas. Cabe se
˜
nalar que el criterio de Nyquist
garantiza la reconstrucci
´
on fiel de una se
˜
nal original, pero
no constituye un requisito estricto en tareas de clasificaci
´
on,
donde el objetivo es preservar informaci
´
on discriminativa
y no la forma exacta de la se
˜
nal. En este contexto, el
submuestreo con factores elevados introduce aliasing; sin
embargo, dicha transformaci
´
on no implica necesariamente
la p
´
erdida de las caracter
´
ısticas relevantes para distinguir
entre clases. Esto sugiere que la informaci
´
on discriminativa
de los eventos ac
´
usticos de inter
´
es se encuentra concentrada
en componentes espectrales que se preservan incluso bajo
un submuestreo agresivo, permitiendo una representaci
´
on
suficiente para la tarea de clasificaci
´
on. En este esquema,
el almacenamiento del dato ac
´
ustico completo puede reali-
zarse mediante un sistema de adquisici
´
on externo de mayor
velocidad, desacoplando la etapa de clasificaci
´
on en tiempo
real del proceso de registro de alta resoluci
´
on.
Respecto del dise
˜
no del modelo maestro utilizado para la
destilaci
´
on del conocimiento, se observa que arquitecturas
de mayor complejidad logran un desempe
˜
no ligeramente
superior sobre los datos de entrenamiento, pero no producen
mejoras significativas en los resultados de validaci
´
on. Este
comportamiento indica que el aumento de complejidad no se
traduce en una mejor capacidad de generalizaci
´
on y sugiere la
existencia de un l
´
ımite impuesto por la calidad y la naturaleza
del conjunto de datos disponible.
En relaci
´
on con la composici
´
on del conjunto de datos, se
observa una menor disponibilidad de registros correspondien-
tes a la especie Cyrtograpsus angulatus, lo que se traduce en
una menor cantidad de eventos
´
utiles respecto de otras clases.
Aunque el balanceo asegura que la cantidad de eventos sea
igualitaria.
Finalmente, si bien la red neuronal representa concep-
tualmente la etapa m
´
as compleja del sistema, su versi
´
on
cuantizada presenta una carga computacional muy reducida.
El clasificador final cuenta con 1.427 par
´
ametros y requiere
menos del 1 % de uso de CPU, lo que lo vuelve pr
´
acticamente
despreciable desde el punto de vista computacional. En
ISSN 2525-0159
https://elektron.fi.uba.ar
49