• Hits: 24207

Entrelazado y desentrelazado

Ratio: 5 / 5

Inicio activadoInicio activadoInicio activadoInicio activadoInicio activado
 

Muchas veces trabajamos con el entrelazado y desentralazado de vídeo, tanto a través del visualizador como de la fuente o el receptor. Su correcto tratamiento y uso puede mejorar considerablemente la imagen. Aquí les descubrimos los orígenes y secretos de ambos procesos.

Texto: Redacción

Es frecuente que demos más importancia al escalado que al entrelazado en nuestros equipos de vídeo, cuando la realidad es que la imagen final es más dependiente del desentrelazado que del escalado. Vamos a ver qué es y cómo funciona, empezando por su definición.

El entrelazado es una técnica consistente en organizar la información digital de forma no contigua para mejorar las prestaciones de un sistema.

Se emplea principalmente en telecomunicaciones (por ejemplo vía satélite o ADSL), tecnologías multimedia, acceso a memoria y formatos de archivo. El término “multiplexado” se utiliza a veces para referirse al entrelazado de una señal digital o, lo que es lo mismo, basado en un multiplex. También se emplea para organizar estructuras de datos multidimensionales. Como es lógico, nosotros nos vamos a centrar en el vídeo.

En un principio, las televisiones emitían sólo en blanco y negro, con lo que era suficiente con un único haz de electrones. Ahora, para poder ver una película debes escribir ésta por toda la pantalla, así que el haz debe barrerla entera. La frecuencia de barrido se conoce como tasa de refresco (refresh rate). Ésta se escogió de acuerdo con los ciclos de funcionamiento eléctrico: Norteamérica y parte de Japón utilizan 60 Hz, mientras que Europa, Oriente Medio y parte de Asia emplean 50 Hz. Esto dio lugar a dos sistemas de TV que aún coexisten:



NTSC (National Television Standard Committee): El sistema NTSC tiene 525 líneas horizontales, de las cuales apenas 487 se ven en la pantalla, y una tasa de refresco de 60 Hz entrelazada.



PAL (Phase Alternating Line): El sistema PAL cuenta con 625 líneas horizontales, de las cuales apenas 540 se ven en la pantalla, y dispone de una tasa de refresco de 50 Hz entrelazada.



Hay básicamente dos modos de visualizar vídeo: “escaneo” progresivo y “escaneo” entrelazado.

El primero de ellos se usa en monitores de ordenador, proyectores y televisión digital y visualiza todas las líneas horizontales de una sola vez como si fuesen un único fotograma.

Por su parte, el segundo se utiliza en los formatos estándar de televisión NTSC, PAL y SECAM y visualiza sólo la mitad de las líneas horizontales en cada pasada (cada fotograma se divide en dos campos, el primero contiene todas las líneas de número impar y el segundo las de par). Debido al fenómeno de persistencia de nuestra visión, en nuestro cerebro unimos las dos pasadas del fotograma entrelazado, quedándonos con una sola imagen. Esto se ha empleado tradicionalmente para obtener altas velocidades de refresco (50 Hz en PAL, 60 Hz en NTSC) con únicamente la mitad del flujo de datos. A cambio, la resolución horizontal queda afectada, ya que cada fotograma se compone de dos mitades, que al mezclarse pueden dar lugar a parpadeo, doble imagen (ghosting), y otros artefactos de la misma.

Por comparación, una cámara de cine filma a 24 cuadros completos por segundo, mientras que una de vídeo escanea campos de líneas pares e impares alternativamente, en intervalos de 1/60 segundos (NTSC) ó 1/50 segundos (PAL).

La imagen de vídeo en los DVD está almacenada normalmente en formato entrelazado.

En NTSC, la conversión de 24 fotogramas (completos) por segundo a 60 campos (cada uno con la mitad de líneas) por segundo se hace mediante el proceso “pull-down 2-3”. En ámbitos profesionales este mecanismo se denomina bajada.

Los cuatro fotogramas se convierten en cinco (para compensar el paso de 24 a 30 imágenes por segundo) y cada uno de ellos contiene dos campos de líneas (pares e impares). Esto tiene el inconveniente de que algunos se muestran durante un período de tiempo mayor que otros, causando oscilaciones o movimiento irregular.

Los reproductores de DVD con salida progresiva (para NTSC), convierten la señal entrelazada a progresiva (mediante un proceso de duplicación de líneas y de interpolación), con lo que si se conectan a un proyector, monitor de ordenador o TV con entrada de vídeo de este tipo, se obtiene una imagen de mucha más calidad (mayor resolución “real” vertical).

De cada seis cuadros de vídeo, dos de ellos mezclan campos de dos fotogramas distintos, proporcionando un defecto visual de movimiento poco suave, a saltos y borroso.

Cuando un cambio de secuencia en la película coincide con uno de los dos cuadros de vídeo que mezclan campos de dos fotogramas, se fusionan ambas imágenes en una, con lo que el resultado es aún mucho peor.

En el caso del PAL, puesto que no hay campos repetidos y un fotograma se obtiene siempre sumando los dos que lo componen, el inconveniente es mucho menor. Aunque normalmente la salida de vídeo del reproductor es entrelazada (puesto que los dispositivos habituales de visualización lo son), este proceso genera menor pérdida de calidad (cada 1/50” se envían las líneas pares o impares de cada fotograma). Además, si nuestro dispositivo de reproducción es progresivo (monitor de ordenador, proyector o TV) y el reproductor dispone de salida de vídeo por componentes progresiva, no es necesario ningún proceso de la señal (ni duplicación de líneas, ni interpolación), para disfrutar de ella en toda su resolución.

La persistencia de imágenes en la retina se establece aproximadamente en una décima de segundo: según esto, las que van “a saltos” más rápidos se aprecian como de movimiento continuado (experimento de pasar rápidamente hojas de papel con dibujos). Las imágenes se mueven con cierta suavidad pero esta velocidad no excluye el centelleo.

En el cine hay 24 cuadros por segundo, o sea que, en la décima de segundo de la que hablábamos antes, pasan 2,4 cuadros. Se tomó esta cantidad, superior a 10 por segundo, para obtener un movimiento más suave.

Un tubo de imagen o pantalla de TV (o de un ordenador) tiene una superficie más o menos plana, recubierta en su interior de unos materiales que se iluminan (fósforos) cuando cae sobre ellos un haz de electrones (fenómeno similar al de los tubos fluorescentes).

En el caso de un barrido no entrelazado, el haz comienza en la parte superior izquierda de la pantalla, dibujando una línea horizontal de izquierda a derecha. Rápidamente regresa a la izquierda (flyback) pero un poco más abajo, donde empieza la segunda línea. Y así sucesivamente, hasta que ha dibujado 600 líneas. Entonces tarda el tiempo de 25 líneas para regresar al origen (arriba, izquierda) y volver a empezar. En total, hay 625 líneas en un cuadro (frame), es decir, en el recorrido de las 625 líneas se ha formado un cuadro. El tiempo que tarda es de 1/25 de segundo. En cada instante del barrido la intensidad del haz de electrones va variando, con lo que se van formando las imágenes por una serie de luces y sombras. En un ordenador, la frecuencia básica será de 60 Hz, por venir los diseños de EE.UU, por lo que en lugar de hablar de 25 tendríamos 30 cuadros por segundo.

Esto origina dos problemas. El primero de ellos es que el cine va a 24 cuadros por segundo y la TV a 25. El segundo es que se crea un molesto centelleo ya que lo que se ilumina 25 veces por segundo no es toda la pantalla de golpe, sino que hay un punto luminoso que la recorre. No podemos darle más persistencia al fósforo porque interferiría negativamente en las imágenes en movimiento (se crearían estelas). Tampoco en los principios de la TV era posible diseñar sistemas con frecuencias de cuadro mayores que 25 Hz (30 Hz en EE.UU).

La forma de solucionar el problema consiste en entrelazar dos campos (fields) para formar un cuadro (frame). También sigue habiendo 25 cuadros en un segundo, pero ahora hay 50 semicuadros o campos (fields) en un segundo. El parpadeo se reduce notablemente.

De esta forma, se han fabricado millones de televisores. Lo cierto es que en ellos el resplandor es soportable, pero se percibe en determinadas condiciones. Hace años que existen otros televisores con nuevas tecnologías que ofrecen una frecuencia de cuadro mayor. Puesto que la emisora sigue enviando lo mismo, lo que hacen es repetirlo dos veces en la mitad de tiempo (o más veces en menos tiempo), por lo que ahora el centelleo resulta indetectable.

En informática se comenzó con imágenes entrelazadas, puesto que se aprovecharon los desarrollos básicos que se habían utilizado en los televisores. Puesto que la gente suele pasar muchas horas frente a las pantallas de sus ordenadores, se vio que el brillo les producía fatiga y disminuía el rendimiento laboral. La primera mejora consistió en aumentar la frecuencia de cuadro (también llamada frecuencia de refresco). De los 60 originales - no olvidemos el origen americano - se pudo pasar a 75 o hasta 100 ó 120 Hz. No contentos con esto, además se emplea el método no entrelazado, con lo cual se mejoran aún más las condiciones de visualización.

Actualmente, casi todas las pantallas de ordenador se fabrican para poder funcionar de esa manera y con frecuencias de refresco altas.

Las pantallas LCD no tienen este problema. Los puntos están permanentemente iluminados hasta que deben apagarse. Básicamente, la diferencia consiste en la capacidad de captura y reproducción de un dispositivo: el entrelazado (i, de interleaced) va capturando o generando líneas pares e impares construyendo la imagen; el desentrelazado (p, de progressive) las captura y muestra a cuadro completo, éstas son de mejor calidad pero también requieren más potencia en el dispositivo.

Las TV normales reproducen por desentrelazado, muestran líneas pares e impares en milisegundos formando la imagen. Aquí hay dos opciones, impares o pares primero. En ocasiones, surgen errores de reproducción por el modo en cómo entran las líneas, y la solución es usar el vídeo progresivo, que, al ser capturado de desentrelazado, no ofrece la mejor calidad, pero sí evita los problemas de sincronización. Ahora bien, si se coge en progresivo, la calidad aumenta al no existir líneas horizontales en movimientos rápidos diagonales.

Cuando hablamos de vídeo entrelazado nos referimos a que la imagen se compone no por un cuadro completo, sino por dos campos de líneas pares e impares.

En el momento de filmar, las cámaras especifican si lo hacen de manera progresiva o entrelazada (interlaced) con las nomenclaturas “p” para progresivo o cuadros completos y con “i” para interlaced o entrelazado. Normalmente, la grabación se hace de forma entrelazada, a menos que se especifique que es en progresivo, y hay cámaras que pueden llevarlo a cabo de las dos formas. También la manera en que lo hacen algunos dispositivos que no son específicamente cámaras de vídeo es mediante secuencias de imágenes que son vídeo progresivo.

Lo ideal sería desentrelazar todos los vídeos para obtener cuadros completos, pero este proceso hace perder calidad. Esto nos debe hacer pensar en que debemos conocer cómo vamos a presentar el vídeo o cuál es el tipo de salida que vamos a darle, para definir si debemos o no desentrelazarlo. Sólo si vamos a mostrarlo en TV analógica debemos mantenerlo desentrelazado. Si está pensado para mostrarlo en web, en monitor o en TV digital, se debe desentrelazar. La calidad que pueda perderse al desentrelazar será siempre menor en comparación con las líneas de barrido que se notarán al usar vídeo entrelazado en reproductores progresivos.

Si tenemos un vídeo progresivo y debemos reproducirlo en TV analógica, la imagen se verá bien, sin ningún problema.

Al intentar comprender cómo se almacena y se muestra el vídeo debemos retroceder en el tiempo y fijarnos en una tecnología muy obsoleta: la televisión por tubo de rayos catódicos (CRT). Básicamente, un tubo de un televisor es un gran trozo de metal que no tiene aire dentro. Dentro de éste, tenemos un cátodo que emite electrones cuando se calienta. Hay también un fuerte campo electromagnético que acelera los electrones hacia la parte frontal del tubo, y que posiciona el haz. La parte frontal del cilindro está cubierta de fósforo y cuando los electrones la golpean, emite luz hacia el otro lado, es decir, el del espectador.

Ahora, en la época en la que aparecieron en el mercado las primeras TVs, la tecnología que permitía escribir 525 líneas 60 veces por segundo, o 625 líneas 50 veces por segundo tenía un precio que no era adecuado para el mercado de consumo. Reducir la tasa de refresco habría requerido circuitos más complicados y no era una opción viable. Pero los ingenieros de TV tuvieron una idea: ¿Qué pasaría si escribiésemos únicamente una de cada dos líneas en cada barrido, y lo hiciéramos con la otra mitad durante el siguiente barrido? De este modo, sólo necesitaríamos 25/30 imágenes por segundo (lo que implica menos ancho de banda, y más canales de TV en la misma banda de frecuencia), y el ojo humano seguiría aceptando esto como movimiento continuo. A esta idea de partirla en dos mitades se la llamó entrelazado (interlacing), y al resultado, campos (fields). Visto de modo gráfico, un campo es básicamente una imagen con una línea negra de cada dos. Durante el primer barrido, el campo superior se escribe en la pantalla. Una vez que se han escrito todas las líneas impares, el haz de electrones regresa a la esquina superior izquierda de la pantalla y comienza a escribir las pares. Como el fósforo tarda un momento en dejar de emitir luz y dado que el cerebro humano es demasiado lento, en vez de dos campos distintos, lo que vemos es una combinación de los dos o, lo que es lo mismo, la imagen original.

Cuando finalmente llegó la TV en color, la tecnología de entrelazado siguió siendo la misma, pero se necesitaba un tubo de rayos catódicos más sofisticado. En vez de emitir un único haz de electrones, se emiten tres, con los RGB (rojo, verde y azul). Cuando se colocan puntos de distintos colores lo suficientemente cerca unos de otros, el ojo humano no verá puntos individuales, sino uno solo y unirá las tonalidades para crear una nueva. Las TVs usan un sistema de color aditivo para mostrar la gama completa de éstos.

En el mundo del NTSC, el cambio requirió una modificación más: la tasa de refresco debía disminuirse ligeramente, de 60 Hz a 59.97 Hz (quedando en 29.97 imágenes por segundo) para ajustarse a los colores. Por este motivo, tenemos estas tasas de refresco tan extrañas en el NTSC en la actualidad.

Ya hay en el mercado pantallas de TV que trabajan en modo de escaneo progresivo. Estos modelos requieren una señal distinta, ya que la forma tradicional de conectar los vídeos, reproductores de DVD o cámaras a la TV no trabaja con imágenes progresivas. Las pantallas de LCD y de plasma sólo pueden escribir imágenes progresivas. Cuando reciben una señal entrelazada necesitan otros métodos para mostrar una imagen razonable. A estas técnicas se las llama normalmente desentrelazado (deinterlacing).

Como conclusión, confiamos en haber resuelto todas las dudas que estos procesos generan y que no pocos quebraderos de cabeza han ocasionado a los usuarios.