LA VIDEO NUMERIQUE

Normalisation et Formats Numériques (2013)

Pour une fois, dans le monde de la vidéo et de l’imagerie électronique on a réussi à concrétiser et on a créé un format commun, issu d’un accord international susceptible de s’appliquer à tous les formats, SD et HD.

– CCIR 601 – NORMALISATION Vidéo NUMERIQUE SD (1982)

La norme CCIR 601 définit le format numérique 4:2:2 à partir d’un signal vidéo composante Y, Y-Cr & Y-Cb avec un échantillonnage à 4 fois la sous porteuse pour la luminance et à 2 fois la sous-porteuse pour chacune des composantes couleurs Cr & Cb.
En fait la fréquence de 13,5 MHz ne correspond pas exactement à 4 fois la sous-porteuse (3,58 en NTSC et 4,43 en PAL). L’important était de définir une valeur facilement utilisable, tant pour les normes européennes à 625 lignes que pour celles des Etats Unis et du reste du monde à 525 lignes.
C’est donc la fréquence d’échantillonnage luminance SD de 13,5 MHz qui a été retenue.
Cette fréquence est un multiple commun aux différentes fréquences ligne.
F 13,5 MHz = 864 fois la fréquence lignes des systèmes à 625 lignes et 858 fois celle des systèmes à 525 lignes.
La fréquence d’échantillonnage des composantes couleurs Cr & Cb étant de la moitié, soit = 6,75 MHz.
L’image numérique PAL est composée de 576 lignes de 720 pixels chacune avec une quantification sur 10 bits (1024 valeurs par point) ce qui correspond à un flux numérique de 270 Mbits/s.
(2 x 6,75 = 13,5 MHz + 13,5 MHz = 27 MHz x 10 = 270 MHz)

– ITU R 709 - Les BASES de la HD NUMERIQUE (1990)

Au début, la concertation est apparue difficile mais on a finalement réussi à déboucher sur un format unique en matière de HD.
Les paramètres essentiels de la normalisation sont :
- CIF = Common Image Format = Format d’Image Commun
- CDR = Common Data Rate = Flux Numérique Commun
Auquel il faut rajouter
- CSL = Common Sampling Lattice = Structure d’Echantillonnage Commun

- CIF - Format d’Image Commun :

Le premier format HD, qui ait fonctionné, est celui de la NHK en 1125 lignes qui comprenait déjà une image composée de 1920 pixels par ligne avec une bande passante luminance théorique de 30 MHz.
Le pixel, qui était rectangulaire à l’origine, est vite devenu carré de manière incontournable car c’était beaucoup plus pratique et plus rationnel.
Avec 1920 Pixels carrés à la ligne et un format de 16/9, on obtient mathématiquement une hauteur d’image de 1080 pixels. Une image HD est donc composée de 1080 lignes actives.
Format Commun d’Image (CIF ) : 1920 x 1080

- CDR - Flux Numérique Commun :

Nous avions enfin un format d’image qui faisait l’unanimité qu’en était-il de l’échantillonnage et du flux numérique ?
Il y avait 2 fréquences différentes, 72 MHz en Europe et 74,250 MHz partout ailleurs.
En fonction du théorème de Nyquist, si l’on veut disposer de 30 MHZ de bande passante luminance il nous faut une fréquence d’échantillonnage au moins 2 fois supérieure, soit, de l’ordre de 70 MHz.
La fréquence d’échantillonnage de 74,250 MHz, retenue pour la HD, a été définie en fonction des critères suivants :
- 13,5 x 4 x 1,375 = 74 250 MHz
13,5 représente la fréquence d’échantillonnage SD et 1,375 représente le facteur de compensation entre la largeur d’image 4/3 et 16/9.
La quantification a été fixée à 10 bits.
- Flux Numérique Commun – CDR :
- 74,250 MHz luminance et 37,125 MHz pour les signaux Cr & Cb
- Quantification sur 10 Bits.
On obtient donc le Flux HD SDI normalisé de 1,485 Gbits/s (2 x 37,125 = 74,250 Cr & Cb + 74,250 Y x 10 bits = 1 485 Mbits/s)

– SMPTE 274 M - HD NUMERIQUE (1995)

La norme SMPTE 274 définit donc une image avec un format universel susceptible de répondre aux différents systèmes de balayage.

- Quelques chiffres pour définir un signal vidéo HD.

Maintenant que nous connaissons tout de la normalisation, de l’échantillonnage et de la quantification, voyons comment toutes ces données interviennent dans notre vie quotidienne.
L’image active, c'est-à-dire l’ensemble des données qui correspondent à la description de l’image réelle que l’on voit, est définie par la norme internationale 1920 x 1080.
On dispose donc de 1080 lignes de 1920 pixels, en pixels carrés, pour décrire le contenu des images HD.
La partie active du signal de 1920 x 1080 est accompagnée de nombreuses informations complémentaires visant à sécuriser le contenu des données, à annoncer la fin de la ligne, la fin de la trame, etc.
Globalement, un signal HD c’est 1125 lignes de 2640 échantillons, soit 2 970 000 informations par image pour un contenu actif d’image de 2 073 600 données.
L’image active ne représente en fait que 70% du signal vidéo.

On retrouve bien les 1024 paliers de la numérisation sur 10 bits allant de la valeur 0000000000 à 1111111111.
La luminance “normale” s’étend de 64 à 940 avec une marge de sécurité.
Les valeurs maximales autorisées étant 4 (0000000100) et 1019 (1111111011)
La chrominance “normale” s’étend de 64 à 960 avec une marge de sécurité.
Les valeurs maximales autorisées étant 4 (0000000100) et 1019 (1111111011)

- En matière de flux et débit vidéo.

Une image numérique couleur HD active représente 4 147 200 échantillons en 4:2:2.
1 920 x 1 080 = 2 073 600 x 2 (1 fois Y & 1 fois (Cr + Cb)) = 4 147 200
Avec une quantification 10 bits, pour chacun des pixels de l’image il faut compter sur 10 chiffres qui décriront chaque pixel en 1024 niveaux différents.
Une image couleur 10 bits contient donc :
4 147 200 x 10 = 41 472 000 informations pour chaque image.
En Europe, nous sommes en 1080i, ce qui signifie que nous disposons de 1080 lignes entrelacées à 25 images par seconde.
41 472 000 x 25 = 1 036 800 000
Soit, un peu plus d’un milliard d’informations par seconde. Le présent signal représente donc un débit ou un flux d’un peu plus de 1 GHz.
Nous sommes vraiment dans des débits élevés, il n’est plus question de faire n’importe quoi.
Ces chiffres, ne concernant que l’image active, correspondent à 70% des informations. Si l’on rajoute les bits de parité et de contrôle ainsi que les différentes données complémentaires, on arrive à un flux HD SDI de 1, 485 GHz
(2 970 000 x 2 x 10 x 25 = 1 485 000 000)
Et, comme tout ceci est simplement mathématique, on retombe, bien heureusement, sur les mêmes valeurs que celles que nous avions trouvées en faisant des calculs à partir de la fréquence d’échantillonnage et de la quantification.

Dans un environnement numérique HD, chacune des lignes de l’image est définie par 1920 pixels. (picture element – point élémentaire).
Chacun des pixels de l’image correspond à une information numérique.
La ligne vidéo est une suite de 1920 ensemble de données, caractérisant chaque pixel et contenant des informations de type 0 & 1.

Le processus de numérisation d’un signal consiste à découper le signal en “tranches”, en fonction d’une fréquence d’échantillonnage et à évaluer le niveau pour chacune des tranches avec un certain nombre de paliers.
Les 2 facteurs principaux de la numérisation sont : D’une part la quantification et d’autre part la fréquence d’échantillonnage.
- Quantification :
- Combien de niveaux ou d’états faut-il utiliser pour reproduire le signal ?
– Ce qui correspond au nombre de bits – 10 bits, 12 bits, 14 bits…

- Fréquence d’échantillonnage
- Combien de fois par seconde doit-on mesurer le signal ?
– Ce qui correspond à la fréquence – 44,1 KHz, 48 KHz, 96KHz …

En dessous de 8 bits, c'est-à-dire avec moins de 256 niveaux d’information par pixel les dégradés vidéo sont en marches d’escalier, car l’écart de niveau entre 2 paliers est trop important pour passer inaperçu.
Communément, on travaille aujourd’hui sur 10, voire 12 ou 14 bits de quantification, ce qui permet de valoriser chacun des échantillons de l’image par 1 024, 4 096 ou 16 384 niveaux.
Ce qui n’est finalement pas si mal.
Dans la normalisation internationale ITU R 709, le signal HD SDI est quantifié sur 10 Bits.

On pourrait favoriser la fréquence d’échantillonnage afin de compenser l’insuffisance de quantification. C'est-à-dire choisir une fréquence plus élevée et faire des mesures plus fréquentes, avec un nombre modéré de paliers à chaque échantillon.

En vidéo, l’échantillonnage est immuable et fait partie des fondamentaux de la norme vidéo numérique 4:2:2 , ou le chiffre 4 représente l’échantillonnage luminance à 4 fois la fréquence de la sous porteuse les chiffres 2 représentent l’échantillonnage des 2 composantes chroma (Y-Cr et Y-Cb) à 2 fois la sous porteuse chacune.
Pour un signal HD, les fréquences sont les suivantes :
- 74,250 MHz pour la luminance et 37,125 MHz pour la chroma Cr & Cb.

bg-10/2013