Estándares de vídeo: NTSC y PAL

Estándares de vídeo: NTSC y PAL

El vídeo que vemos en una pantalla de televisión sigue unas normas establecidas en los años 50 del siglo pasado, cuando apareció la televisión en color, los formatos más importantes utilizados hoy en día son NTSC y PAL:

NTSC (National Television System Committee) y PAL (Phase Alternating Line). En términos generales, NTSC es el estándar utilizado en América del Norte y del Sur y en Japón, mientras que PAL se utiliza en Europa, Australia, Oriente Medio y Asia.

Ninguno de estos estándares de vídeo resulta óptimo para su presentación en monitores de equipos informáticos; cada uno de ellos plantea diferentes dificultades a la hora de optimizar el vídeo para su publicación en la Web:

  • Tamaño de fotogramas: NTSC y PAL tienen tamaños de imagen diferentes, que también difieren de los tamaños de imágenes disponibles en los monitores de equipos informáticos.
  • Velocidad de reproducción de fotogramas: NTSC y PAL utilizan diferentes velocidades de reproducción de fotogramas para mostrar imágenes, que también difieren de las utilizadas por los monitores de equipos informáticos.
  • Proporción de aspecto de píxeles: NTSC y PAL comparten la misma proporción de aspecto de píxeles (conocida como proporción de aspecto D1, que es básicamente rectangular), pero dicha proporción difiere de la utilizada por los monitores de equipos informáticos (que es cuadrada).
  • Visualización: NTSC y PAL constan de dos campos “entrelazados” independientes, mientras que los monitores de equipos informáticos muestran imágenes “progresivas”.

NTSC y PAL

En la tabla siguiente se resumen estas diferencias del NTSC y PAL:

  Tamaño de imagen Velocidad de reproducción de fotogramas Proporción de aspecto Visualización
NTSC 720 x 480 29.97 D1 Entrelazado
PAL 720 x 576 25 D1 Entrelazado
Equipo informático Varía
(mucho mayor)
Cuadrado Progresiva

Tamaño de fotogramas

Las pantallas de televisión convencionales están formadas por líneas horizontales, mientras que los monitores de equipos informáticos constan de una serie de píxeles horizontales y verticales. La resolución de línea estándar para una televisión NTSC es de 525; para PAL, 576 líneas. Los monitores de equipos informáticos más modernos tienen resoluciones verticales muy superiores (medidas en píxeles), por ejemplo, 768 ó 1024, lo que exige la ampliación de la escala vertical para llenar el monitor.

En el caso de las imágenes de vídeo NTSC, el estándar profesional SMPTE 259M especifica que las 525 líneas se representen como 720 x 486: es decir, 720 píxeles horizontales por 486 píxeles verticales. El tamaño de vídeo predeterminado se conoce comúnmente como D1. La captura de imágenes con las tarjetas de captura de vídeo más modernas de una fuente profesional BetaSP o Digital Betacam da como resultado un fotograma de tamaño D1. La captura de imágenes mediante una fuente DV (vídeo digital), sin embargo, proporciona un fotograma de 720 x 480. La diferencia entre la especificación D1 y la especificación DV es de tan sólo 6 píxeles verticales. Muchos algoritmos de compresión, incluida la compresión DV, funcionan mejor cuando los tamaños de imagen son múltiplos de 16. Al quitar los 6 píxeles de una resolución D1, el formato DV pudo disponer de una resolución nativa con un múltiplo de 16.

En el caso de las imágenes de vídeo PAL, los fotogramas son siempre de 720 x 576 píxeles, con independencia de la fuente de vídeo de que se trate. Dado que la resolución vertical de PAL, 576, es un múltiplo de 16, no es necesario realizar ningún cambio para la compresión DV.

Velocidad de reproducción de fotogramas

El vídeo consiste fundamentalmente una secuencia rápida de imágenes que se proyectan en pantalla y producen la ilusión de que existe movimiento. El número de fotogramas mostrados cada segundo se conoce como velocidad de reproducción de fotogramas y se mide en fotogramas por segundo (fps). Cuanto mayor es la velocidad de reproducción de fotogramas, mayor es el número de fotogramas por segundo que se utilizan para mostrar la secuencia de imágenes, lo que origina un movimiento más suave. La desventaja, sin embargo, es que una mayor velocidad de fotogramas requiere una mayor cantidad de datos para mostrar el vídeo y esto requiere un mayor ancho de banda.

Normalmente se dice que NTSC funciona a 30 fps, mientras que PAL funciona a 25 fps. En realidad, NTSC funciona a 29,97 fps. El motivo de esta velocidad de reproducción de fotogramas tan extraña proviene de la transición de la televisión en blanco y negro a las señales de televisión en color, en las que se eligió la velocidad de 29,97 fps para garantizar la compatibilidad con los aparatos de televisión ya existentes. Continúa habiendo 30 fotogramas, pero se muestran a una velocidad que es 0,1 por ciento más lenta que el tiempo real, lo que da una velocidad de reproducción de fotogramas de 29,97 fps.

Al trabajar con vídeo comprimido en un formato como el de Flash Video, cuantos más fotogramas hay que mostrar en un segundo, mayor es el tamaño del archivo. Para reducir el tamaño del archivo final, tendrá que reducir la velocidad de reproducción de fotogramas o la velocidad de datos. Si reduce la velocidad de datos y mantiene la velocidad de reproducción de fotogramas, la calidad de la imagen se reduce para lograr un tamaño de archivo menor. Si reduce la velocidad de reproducción de fotogramas y mantiene la velocidad de datos, el tamaño del archivo se reduce pero el vídeo puede dar saltos y el movimiento puede resultar menos fluido de lo deseado.

Siempre que se reduce la velocidad de reproducción de fotogramas, es recomendable utilizar una fracción exacta de la velocidad de reproducción de fotogramas original. Si la fuente tiene una velocidad de fotogramas de 24 fps, deberá reducir la velocidad de fotogramas a 12 fps, 8 fps, 6 fps, 4 fps, 3 fps o 2 fps. Si la velocidad de reproducción de fotogramas de la fuente es de 30 fps, en la mayoría de los casos podrá utilizar una velocidad de reproducción de fotogramas de 30 fps, 15 fps, 10 fps, 6 fps, etc. Si el vídeo tiene una duración superior a los 10 minutos, la desincronización del sonido será perceptible si no se cumple la velocidad de 29,97 fps o una fracción exacta para lograr velocidades de reproducción de fotogramas inferiores (como, por ejemplo, 14,98, que es la mitad de 29,97).

Proporción de aspecto de píxeles

Las especificaciones NTSC y PAL D1/DV establecen píxeles no cuadrados (lo que se conoce como proporción de aspecto D1), mientras que los píxeles de los monitores de equipos informáticos son cuadrados. Los píxeles D1 son más cortos verticalmente. Por esta razón, al observar una imagen de vídeo D1 en un monitor, las imágenes parecen aplastadas verticalmente (lo que provoca que los actores parezcan más bajos). Cuando esta imagen se muestra en un monitor de difusión, los píxeles son más anchos que altos, por lo que se visualizan perfectamente, como se muestra en la siguiente imagen.

Por esta razón, las imágenes de vídeo pensadas para ser visualizadas en monitores informáticos deben someterse a una corrección de aspecto de píxel aplicando escala a la imagen con una proporción válida 4:3. Para NTSC, la resolución de píxel cuadrado completo es de 720 x 540 (compensación vertical), mientras que para PAL es de 768 x 572 (compensación horizontal). Las resoluciones de visualización de vídeo que se utilizan habitualmente en Internet son 640 x 480, 512 x 384, 320 x 240 y 160 x 120.

La mayoría de las aplicaciones de edición de vídeo compensan la diferencia de proporciones aplicando escala a la imagen de vídeo en tiempo real al mostrarla en el monitor del equipo informático. Esto se hace así porque, finalmente, las imágenes están pensadas para ser mostradas de nuevo en monitores de televisión, con lo que la aplicación de escala a los píxeles reales del archivo de vídeo introduciría una pequeña distorsión innecesaria. No obstante, para visualización en la Web, esta compensación en tiempo real no es un método adecuado, ya que la secuencia de vídeo está destinada a ser visualizada en monitores de píxeles cuadrados, por lo que es preciso compensar esta discrepancia para el hardware utilizado.

Vídeo entrelazado y progresivo

Las imágenes de vídeo constan de dos campos entrelazados que, conjuntamente, forman un fotograma. Este sistema comenzó a utilizarse cuando se inventó la televisión debido a una limitación técnica que impedía que un fotograma completo pudiera mostrarse “progresivamente” en el monitor (de arriba a abajo) sin una distorsión visual perceptible; las imágenes parecían mostrarse en la pantalla como en efecto cortinilla. Al romper la imagen en dos campos (dos mitades) y mostrar una después de la otra, desaparece este efecto. Esta técnica antigua ha supuesto un tremendo obstáculo en la era digital del vídeo y los equipos informáticos, por lo que ha sido eliminada de los nuevos estándares para televisión de alta definición, que son progresivos (las imágenes se muestran en una pasada de arriba a abajo). Un grupo de líneas forman un campo. Los dos campos se conocen como superior e inferior, o Campo 1 y Campo 2, o impar y par; no existe una terminología uniforme.

Con imágenes de vídeo reales, los dos campos entrelazados parecen muy similares y no se aprecian distorsiones al observar un fotograma de vídeo en un monitor de un equipo informático. Sin embargo, con imágenes de vídeo que incluyan mucho movimiento y cambios rápidos (como el movimiento de la cámara o de personas en el fotograma), aparecen distorsiones de campo bastante evidentes cuando los campos se muestran juntos en un monitor informático, lo que confiere a la imagen un aspecto de estela o rastro fantasmagórico. Esto se debe a la composición conjunta de dos momentos en el tiempo en un sólo fotograma.

Por consiguiente, para mostrar vídeo con buena definición en un monitor de equipo informático, los fotogramas de vídeo deben desentrelazarse mediante la eliminación de uno de los campos. Se omite la mitad de la información de cada fotograma y se mantiene la información doblada o interpolada. En el caso de NTSC, da como resultado 30 fotogramas de 30 puntos diferentes en el tiempo.

Los estándares de vídeo modernos para televisión digital han eliminado el entrelazado en favor de técnicas de visualización con exploración progresiva. Las cámaras de vídeo de exploración progresiva normalmente tienen capacidad para cambiar de exploración progresiva a vídeo entrelazado; además de la mayoría de estas cámaras disponen de diversas velocidades de fotogramas con y sin entrelazado. Las velocidades de reproducción de fotogramas habituales se conocen como 60p (60 fps progresivo), 30i (30 fps entrelazado), 30p (30 fps progresivo) y 24p (24 fps progresivo). Al utilizar imágenes progresivas, no es necesario desentrelazar el material antes de publicarlo en la Web.

+ Sobre Vídeo en esta pagina.