Red adversaria generativa aplicada a la
eliminaci
´
on de ruido y artefactos en sinogramas
de tomograf
´
ıa optoac
´
ustica
Generative Adversarial Network Applied to the Elimination of Noise and Artifacts in Optoacoustic
Tomography Sinograms
Delfina Montilla
1
, Mart
´
ın G. Gonz
´
alez
, Leonardo Rey Vega
Facultad de Ingenier
´
ıa, Universidad de Buenos Aires
Paseo Col
´
on 850, C1063ACV, Buenos Aires, Argentina
Consejo Nacional de Investigaciones Cient
´
ıficas y T
´
ecnicas, (CONICET)
Godoy Cruz 2290, C1425FQB, Buenos Aires, Argentina
1
dmontilla@fi.uba.ar
Resumen— El objetivo de este trabajo es el estudio de
un m
´
etodo de pre-procesamiento de los datos medidos
por un tom
´
ografo optoac
´
ustico bidimensional para
reducir o eliminar los artefactos introducidos por la
escasa cantidad de detectores en el sistema experimental
y el acotado ancho de banda de estos. Para esta tarea, se
utiliz
´
o una red neuronal profunda generativa adversaria
y se compar
´
o su rendimiento con una red neuronal de
referencia U-Net. En la mayor
´
ıa de los casos de testeo
realizados, se encontr
´
o una leve mejora aplicando la
red propuesta al medir la correlaci
´
on de Pearson y la
relaci
´
on se
˜
nal a ruido piso entre la imagen reconstruida
producto de los datos procesados por el modelo y la
imagen de alta resoluci
´
on de referencia.
Palabras clave: tomograf
´
ıa optoac
´
ustica; aprendizaje
profundo; GAN.
Abstract— The goal of this work is to study a
preprocessing method for the data measured by a
two-dimensional optoacoustic tomograph in order to
reduce or eliminate artifacts introduced by the low
number of detectors in the experimental setup and
their limited bandwidth. A generative adversarial deep
neural network was used to accomplish this task and
its performance was compared with a reference U-Net
neural network. In most of the test cases carried out, a
slight improvement was found by applying the proposed
network when measuring the Pearson correlation and
the peak signal noise ratio between the reconstructed
image product of the data processed by the model and
the high-resolution reference image.
Keywords: optoacustic tomography; machine learning;
GAN.
I. INTRODUCCI
´
ON
Un enfoque muy prometedor para la obtenci
´
on de
im
´
agenes biol
´
ogicas es la tomograf
´
ıa optoac
´
ustica (TOA),
tambi
´
en conocida como tomograf
´
ıa fotoac
´
ustica o PAT por
sus siglas en ingl
´
es [1]–[3]. Es una t
´
ecnica no invasiva,
segura y de elevada resoluci
´
on que puede utilizarse para
una variedad de aplicaciones en la investigaci
´
on cl
´
ınica
y precl
´
ınica [4], [5], incluyendo la detecci
´
on de tumores
[6], [7]. Combina la excitaci
´
on
´
optica con la detecci
´
on
ultras
´
onica, lo que ofrece varias ventajas para la obtenci
´
on
de im
´
agenes biol
´
ogicas [8], como permitir la diferenciaci
´
on
de estructuras espec
´
ıficas en el tejido, dependiendo de la
longitud de onda utilizada. La luz incidente s
´
olo necesita
ser absorbida por el objeto que se pretende estudiar para
generar una se
˜
nal ac
´
ustica que pueda ser detectada de
manera confiable en lo profundo del tejido. Otra ventaja
es que, comparado con la microscop
´
ıa
´
optica, proporciona
una penetraci
´
on mucho mayor con una resoluci
´
on espacial
escalable al ser aplicada a tejido biol
´
ogico [9], [10]. Adem
´
as,
es una t
´
ecnica de imagen que no se basa en el uso de la
radiaci
´
on ionizante, como la tomograf
´
ıa computada (TC),
o de la fluorescencia; sino en la relajaci
´
on no radiativa de
las mol
´
eculas. Por lo tanto, sirve para visualizar cualquier
mol
´
ecula siempre y cuando se produzca esta relajaci
´
on no
radiativa. Incluso ser
´
ıa posible el desarrollo de un equipo
port
´
atil de TOA, a diferencia del caso de la TC donde existen
limitaciones de seguridad por la utilizaci
´
on de radiaci
´
on
ionizante, o la resonancia magn
´
etica donde se requiere
de superconductores para la generaci
´
on de los campos
magn
´
eticos.
El mayor desaf
´
ıo en lo que concierne a la TOA es
la adquisici
´
on de datos a velocidad elevada con una ma-
triz de transductores ultras
´
onicos de elementos m
´
ultiples.
Si bien los sistemas de adquisici
´
on de datos multicanal
( 128 canales) est
´
an disponibles comercialmente, estos
son todav
´
ıa costosos [11]. La calidad de la imagen OA
reconstruida depende en gran medida de la cantidad de datos
disponibles, que a su vez es proporcional al n
´
umero de
detectores empleados. En caso de datos limitados (debido
a la menor cantidad de detectores causado por restricciones
de costo/instrumentaci
´
on), las im
´
agenes reconstruidas sufren
de artefactos y, a menudo, son ruidosas. Asimismo, otra
desventaja para adquirir grandes cantidades de datos es un
mayor tiempo de escaneo de la muestra bajo estudio [12],
Revista elektron, Vol. 7, No. 1, pp. 7-18 (2023)
ISSN 2525-0159
7
Recibido: 30/05/23; Aceptado: 13/06/23
Creative Commons License - Attribution-NonCommercial-
NoDerivatives 4.0 International (CC BY-NC-ND 4.0)
https://doi.org/10.37537/rev.elektron.7.1.180.2023
Original Article
[13]. Adem
´
as, los detectores utilizados para las mediciones
tomogr
´
aficas tienen un ancho de banda limitado y s
´
olo
pueden cubrir un rango de apertura, por lo cual es posible
que no cubran todo el objeto, resultando en datos limitados
en cantidad y calidad [14]. Por otro lado, el sinograma es la
representaci
´
on gr
´
afica de las se
˜
nales ac
´
usticas en funci
´
on del
tiempo medidas por los detectores de ultrasonido (se
˜
nales
OA). Contiene la informaci
´
on sobre la distribuci
´
on espacial
y la amplitud de las se
˜
nales OA capturadas por los detectores
durante el escaneo.
En este trabajo se estudia el uso de una red adversaria
generativa (GAN) [15] para la super-resoluci
´
on (aumento
de la calidad de reconstrucci
´
on con un n
´
umero limitado
de datos), la mejora del ancho de banda, y la remoci
´
on
de artefactos y ruido en se
˜
nales ac
´
usticas provenientes de
mediciones de un sistema para TOA bidimensional. Se tiene
como antecedente el trabajo de investigaci
´
on [16], donde
se propuso el primer uso de una red neuronal profunda
aplicada exclusivamente al pre-procesamiento de las se
˜
nales
OA medidas, en vez de hacerlo sobre la imagen reconstruida.
Es interesante destacar que uno de los atributos m
´
as impor-
tantes de un esquema basado en una red neuronal profunda
es la velocidad con la que pueden procesar los datos de
entrada. Para redes peque
˜
nas, esto puede ser
´
util en entornos
donde se requiere la obtenci
´
on de im
´
agenes din
´
amicas o
en tiempo real [17]. Otra motivaci
´
on adicional para usar
modelos de aprendizaje profundo en la reconstrucci
´
on de
im
´
agenes OA, es la disponibilidad de herramientas como
TensorFlow [18] y PyTorch [19], que hacen que el empleo
de estos nuevos m
´
etodos presente una curva de aprendizaje
suave al proveer una documentaci
´
on completa y tutoriales
para los nuevos usuarios. El c
´
odigo correspondiente a este
trabajo se encuentra disponible en un repositorio de GitHub,
https://github.com/delfimontilla/PATGAN.
II. M
´
ETODOS
A. Generaci
´
on de los datos de entrenamiento, validaci
´
on y
testeo
Los componentes principales del sistema experimental
TOA incluyen un l
´
aser de pulsos cortos para la generaci
´
on
eficiente de se
˜
nales de banda ancha (BW), un transductor
ultras
´
onico de banda ancha o una matriz de transductores
para la detecci
´
on de se
˜
nales, un sistema de adquisici
´
on de
datos para amplificaci
´
on y digitalizaci
´
on de se
˜
nales y una
computadora para la sincronizaci
´
on del sistema, recolecci
´
on
de datos y reconstrucci
´
on de las im
´
agenes [8]. El modelo
directo para la generaci
´
on de im
´
agenes de TOA se expresa
mediante la siguiente ecuaci
´
on:
Ax = b (1)
donde A es la matriz del sistema que contiene las respuestas
al impulso de todos los p
´
ıxeles en la regi
´
on de la imagen,
x es el vector que representa el aumento de presi
´
on inicial
y b es el sinograma [20]. En este contexto, las respuestas
al impulso representan el comportamiento de los p
´
ıxeles
individuales dentro de la regi
´
on correspondiente a la imagen
cuando se aplica un pulso. Cada p
´
ıxel tiene su propia
respuesta, la cual captura c
´
omo reacciona este a la se
˜
nal,
incluyendo factores como la absorci
´
on, la dispersi
´
on y otras
propiedades f
´
ısicas. El n
´
umero de columnas en la matriz (A)
es igual al n
´
umero de p
´
ıxeles en el dominio de im
´
agenes;
y el n
´
umero de filas es equivalente a la cantidad de p
´
ıxeles
en el dominio del sinograma. En consecuencia, construir la
matriz del sistema es una tarea costosa desde el punto de
vista computacional cuando se desea una resoluci
´
on elevada.
Existen varios algoritmos para obtener una imagen a partir
del sinograma; se pueden clasificar como m
´
etodos anal
´
ıticos
o m
´
etodos iterativos basados en modelos. Dentro del primer
grupo mencionado, uno de los m
´
etodos matem
´
aticamente
m
´
as simples es el denominado retroproyecci
´
on lineal (LBP,
por sus siglas en ingl
´
es). En este enfoque, la reconstrucci
´
on
aproximada de la imagen x
bp
se puede obtener a trav
´
es de
la siguiente ecuaci
´
on:
x
bp
= A
T
b (2)
donde A
T
representa la transpuesta de la matriz que modela
el sistema experimental y b es el sinograma en forma
vectorial unidimensional [21]. Este m
´
etodo fue elegido para
este trabajo ya que tiene bajo tiempo de procesamiento
(sin tener en cuenta el tiempo que conlleva generar A
T
)
y no posee ning
´
un par
´
ametro de ajuste. Aunque es posible
utilizar esquemas basados en modelos para lograr una mayor
calidad de imagen se decidi
´
o utilizar LBP para reforzar que
la mejora en la calidad de la imagen reconstruida se debe
exclusivamente a la mejora en los datos del sinograma [16].
En este trabajo, los sinogramas se obtuvieron a partir de
una base de datos de 59 mil fantomas mamarios computa-
cionales generados a partir del procesamiento de resonancias
magn
´
eticas de alta resoluci
´
on adquiridas de pacientes, en
las cuales se clasific
´
o cada p
´
ıxel seg
´
un el tipo de material
al que correspond
´
ıa (aire, tejido adiposo, tejido glandular
y tejido cut
´
aneo) [22]. En primer lugar, de este conjunto
de datos se seleccion
´
o cuidadosamente un subconjunto de
2126 im
´
agenes de forma tal de evitar redundancia y sesgos
innecesarios. A su vez fue dividido de forma azarosa en
tres grupos: 70 % para el entrenamiento (1500 im
´
agenes),
19% para la validaci
´
on (400 im
´
agenes) y 11% para el testeo
(226 im
´
agenes). Los primeros dos grupos fueron utilizados
en la etapa de entrenamiento de las redes neuronales y el
´
ultimo grupo se reserv
´
o para testear el modelo resultante. En
segundo lugar, se generaron los sinogramas multiplicando
los fantomas mamarios, en forma de vector unidimensional,
por la matriz del sistema experimental. Utilizando Python, se
construy
´
o la matriz del sistema con los mismos par
´
ametros
experimentales que en [16]. Como se puede ver en la
Fig. 1, se emple
´
o una cuadr
´
ıcula computacional de n × n
p
´
ıxeles. Para la generaci
´
on de datos, se utiliz
´
o una grilla
de alta dimensi
´
on de nx
g en
× nx
g en
p
´
ıxeles; en cam-
bio, para la reconstrucci
´
on de los datos, la grilla era de
nx
recon
× nx
recon
p
´
ıxeles. Se colocaron transductores en
el l
´
ımite del tejido de manera circularmente equidistante
en un radio dsa; estos muestrearon observaciones con una
frecuencia F . En total, se tomaron N t muestras temporales.
Se supuso que la velocidad del sonido en el medio, el tejido
bajo investigaci
´
on, era uniforme sin absorci
´
on ni dispersi
´
on
e igual a 1500 m/s.
Para la generaci
´
on de sinogramas de alta calidad se
simularon N s
hq
detectores de ultrasonido sin limitaci
´
on de
Revista elektron, Vol. 7, No. 1, pp. 7-18 (2023)
ISSN 2525-0159
8
http://elektron.fi.uba.ar