Supercompresión de video y aplicaciones.

Autor: Mastriani, Mario

Resumen

Este trabajo de tesis propone el uso de la técnica conocida como super-resolución en compresión de imágenes, sean estas imágenes fijas, cuadros de un video, TV Digital de alta definición, Cine Digital, y cualquier otro tipo de imagen a comprimir para su posterior almacenamiento y/o transmisión. Mediante la técnica de super-resolución se disminuye precisamente la resolución de la imagen en el codificador con lo cual se baja notablemente su peso en bytes, para luego comprimirlo mediante cualquier técnica conocida y almacenarlo y/o transmitirlo. Posteriormente, y ya en el decodificador, se descomprime la imagen y se restaura su resolución y nitidez mediante técnicas de super-resolución. Originalmente, las técnicas de super resolución son empleadas en aquellos casos donde se desea obtener una imagen de mayor nitidez y resolución a partir de un conjunto de imágenes de baja resolución y poco nítidas, las cuales son el resultado de una notable diferencia de velocidad entre el objeto a capturar en pantalla vs la velocidad del obturador de la cámara, por lo cual las imágenes salen movidas, con un desplazamiento uniforme (es decir, en un solo sentido) o no y que en inglés se lo conoce como blur, mientras que en español es llamado emborronamiento. Cabe destacarse que todo el proceso puede verse también afectado por ruido, por lo cual deberá recurrirse en dicho caso a una técnica robusta de super-resolución, las cuales exigen para su tratamiento una elevada complejidad computacional. En este trabajo se lidia con imágenes sin ruido, el cual ha sido suprimido con otra técnica en un lugar diferente de aquellos donde actúa la super-resolución. Por otra parte, mientras la compresión consiste en bajar en promedio el número de bit-porpixel de la imagen, la super-compresión se define como una combinación de la disminución de la resolución de una imagen seguida de la compresión de esta. En otras palabras, la supercompresión es una sobre-compresión o compresión adicional de la imagen. Consecuentemente, mientras la disminución y aumento de la resolución se llevan a cabo mediante un sub y sobre-muestreos, respectivamente, la restauración de la nitidez se realiza mediante una pequeña máscara convolutiva bidimensional, la cual realiza un barrido sobre la imagen. Estos procesos son de una elevada complejidad computacional, por ende, tanto en el codificador, como en el decodificador son implementados sobre placas de cálculo de Propó-sitos Generales en Unidades de Procesamiento Gráfico (en inglés, GPGPU). De hecho, la máscara mencionada es codificada en la memoria de texturas (la cual es la más pequeña de los cuatro tipos de memoria de estas placas, no obstante, la más rápida de todas) de una GPGPU.
Específicamente, los aportes del presente trabajo son:
1. Empleo de la técnica conocida como super-resolución de una imagen o video para ser utilizado en un proceso que será llamado super-compresión, sobre-compresión o compresión adicional, el cual consiste en los siguientes pasos:
1.1. codificador:
1.1.1. Bajar la resolución de una imagen o cada cuadro de un video (submuestreo)
1.1.2. Comprimir con algún compresor (con o sin pérdidas)
1.2. transmitir y/o almacenar
1.3. decodificador:
1.3.1. Descomprimir con el descompresor (con o sin pérdidas) respectivo como proceso inverso del item 1.1.2.
1.3.2. Restaurar la resolución original de la imagen o cuadro (sobre-muestreo)
1.3.3. Restaurar la nitidez original de la imagen o cuadro (realce)
2. Establecer las diferencias fundamentales entre compresión y super-compresión
3. Desarrollar un esquema de super-resolución para compresión
4. Establecer las diferencias fundamentales entre super-resolución y realce
5. Deducción de las herramientas más conspícuas a los efectos de los items anteriores
6. Aplicaciones adicionales: Imágenes médicas, satelitales, biométricas y documentales, incluyendo cine digital
Para terminar, es importante mencionar que los módulos algorítmicos del decodificador, es decir, sobre muestreo y restauración de nitidez mediante máscara convolutiva bidimensional son fácilmente implementables también en un chip CMOS en inglés: Complementary Metal–Oxide–Semiconductor) y tecnología ARM (en inglés: Advanced RISC Machine, donde RISC en inglés: Reduced Instruction Set Computer), lo cual permite un reemplazo económicamente accesible de la GPGPU, además de bajo consumo de energía y una notable reducción del tamaño del dispositivo de decodificación, el cual, por ejemplo en el caso de la TV Digital se lo conoce como set-top-box.

Ver tesis completa