Dossier Technique: Passer de CBR à VBR pour Améliorer la Qualité Globale et Éviter les Problèmes de Qualité Transitoires

Résumé (Le MPD)

De nombreux producteurs de streaming utilisent le codage à débit constant (CBR) comme technique de contrôle du débit, soit dans le but de créer le flux le plus efficace pour la diffusion, soit pour se conformer aux exigences Apple perçues pour le streaming en direct HTTP (HLS). Cependant, le CBR offre la qualité globale la plus basse de toutes les techniques de contrôle du débit binaire et présente le potentiel de problèmes de qualité transitoire dramatiques comme ceux illustrés à la figure 1.

Figure 1. Comparaison du codage CBR par rapport au codage VBR (cliquez sur l’image pour une vue en taille réelle).

Une enquête récente indique que de nombreux producteurs sont passés au codage à débit variable (VBR) et ignorent les recommandations d’Apple susmentionnées. Les tests révèlent que le VBR contraint à 110% évite les problèmes de qualité transitoires causés par l’encodage CBR. Les producteurs qui utilisent encore le CBR devraient envisager de passer au VBR contraint pour éviter ces problèmes de qualité transitoire et améliorer la qualité vidéo globale.

Segment 1: Le contrôle du débit binaire est l’une des options d’encodage les plus fondamentales sélectionnées pour chaque fichier compressé

Chaque fois que vous encodez un fichier pour une distribution en streaming, vous choisissez un débit binaire et une technique de contrôle du débit binaire. Ceci est illustré à la figure 2, à partir de l’encodeur multimédia Adobe.

Figure 2. Techniques de contrôle du débit disponible dans Adobe Media Encoder.

Les deux techniques les plus courantes sont:

• Codage à débit constant (CBR), où le même débit est appliqué à l’ensemble du fichier, quelle que soit la complexité de la scène. Avec CBR, vous définissez le débit cible (Figure 2) mais pas le maximum, car le débit binaire n’est pas censé varier de manière significative, bien qu’il le fasse généralement dans une certaine mesure, comme le montre la figure 3.

La figure 3 montre un fichier codé à l’aide de CBR. Comme vous pouvez le voir dans la légende à droite, le débit moyen est de 4936 kbps, tandis que le pic est de 5557 kbps. La ligne bleu clair ondulée est le débit de données flottant, qui varie peu sur la durée du fichier. Les colonnes individuelles sont de la taille de chaque groupe d’images codées dans le fichier, avec une image clé toutes les trois secondes dans ce fichier de 29,97 images par seconde.

Figure 3. Un fichier codé CBR dans Bitrate Viewer.

Notez que le CBR n’est jamais une ligne plate complète; une variabilité d’environ 5 à 10% est normale.

• Codage à débit variable (VBR), où le même débit de données cible global est atteint, mais le débit de données varie sur la durée du fichier pour correspondre à la complexité de la scène. Avec VBR, vous définissez la Cible et le maximum (Figure 2), et dans certaines applications, le minimum également. Lorsque vous définissez un maximum, le codage VBR est considéré comme contraint, et VBR est souvent décrit par le pourcentage de la contrainte. Dans la Figure 2, le débit maximal est de 2,4 Mbps, soit 200% du Débit cible de 1,2 Mbps. Cette technique serait appelée VBR contraint à 200%.

La figure 4 montre le même fichier que la figure 3 codé en utilisant un VBR contraint à 200% au même débit cible de 5000 kbps. Le débit moyen est à peu près le même (4988 kbps contre 4936 kbps), mais le débit binaire de pointe est de 9301 kbps, pas tout à fait 200% mais dans le stade. La ligne de débit de données bleue ondulée varie beaucoup plus significativement que dans la figure 3, avec des débits faibles au début et des pics tout au long.

Figure 4. Le même fichier encodé en utilisant 200% de VBR contraint.

•De nombreux producteurs utilisent CBR par défaut pour tout ou partie de leur encodage. Dans les premiers jours de la diffusion en continu, les connexions étaient si limitées que CBR a été recommandé pour éviter les pics de débit de données qui pourraient bloquer la lecture en douceur. Dans la note technique TN2224 d’Apple, Apple déclare que « La variabilité du débit binaire ne doit pas dépasser 10% du débit cible. »Plus inquiétant encore, le validateur de flux multimédia d’Apple, un outil utilisé pour tester les flux HLS, crée un avertissement si le débit binaire d’un segment de flux varie de plus de 10% par rapport au débit cible. Sans surprise, dans un récent sondage du Streaming Learning Center, 11 des 16 répondants ont indiqué qu’ils utilisaient toujours l’encodage CBR pour certains de leurs flux (figure 5). Certes, le nombre de répondants est trop faible pour être statistiquement significatif, bien que les réponses soient valables à des fins d’information.

Figure 5. Onze répondants sur 16 utilisaient encore le CBR sur certains de leurs flux, ainsi que d’autres techniques.

Comme vous pouvez le voir sur la figure 5, d’autres techniques de contrôle du débit existent, y compris le Facteur de débit constant (CRF) et le CRF plafonné. Cependant, comme ils sont mieux utilisés dans des cas très limités (principalement du contenu synthétique comme des screencams et des vidéos PowerPoint avec audio), ils ne sont pas inclus dans cette discussion.

Segment 2. Le CBR offre une qualité globale inférieure à celle du VBR

Le tableau 1 montre les résultats d’un ensemble de comparaisons de qualité exécutées pour le prochain livre de Jan Ozer, Encoding by the Numbers, qui doit sortir à l’été 2016. Ces tests impliquaient des fichiers codés en résolution 720p à 2 Mbps à l’aide de FFmpeg, avec des scores VQM mesurés par l’Outil de Mesure de la Qualité vidéo de l’Université de Moscou (VQMT). Avec VQM, les scores inférieurs sont meilleurs, et dans le tableau, les scores en rouge sont les pires, les scores en vert les meilleurs.

Tableau 1. Comparaison de la qualité PSNR pour différentes techniques de contrôle du débit binaire.

Notez les colonnes delta de qualité du tableau 1. La première affiche la différence de qualité totale entre le fichier de qualité la plus basse et la plus élevée du groupe. La seconde montre la différence de qualité entre les clips codés en utilisant 110% et 200% de VBR contraint. Comme vous le verrez, les producteurs peuvent éviter les problèmes de qualité transitoires et respecter les recommandations d’Apple en utilisant un VBR contraint à 110%. Cependant, les producteurs qui recherchent un fichier de la plus haute qualité possible et qui ne se soucient pas des recommandations d’Apple devraient utiliser un VBR contraint à 200%.

Dans tous les cas de test, le CBR à 2 passes a fourni la pire qualité, et dans cinq des six cas, le VBR contraint à 200% a fourni la plus haute qualité. La seule exception était le clip de tête parlante, où 1 pass CBR a livré la plus haute qualité. Ce résultat semble être une anomalie; dans des tests similaires effectués sur des clips à trois mouvements bas et à tête parlante, les résultats étaient cohérents avec tous les autres fichiers du tableau 1. La variabilité la plus élevée a été observée dans le clip Big Buck Bunny, qui a montré un différentiel de qualité de 14,54% entre les clips de qualité la plus basse et la plus élevée (colonne Delta de qualité totale).

La différence de qualité globale est par ailleurs relativement mineure dans la plupart des autres clips. En fait, ce n’est probablement même pas observable pendant la lecture normale. Cependant, dans certains cas, les fichiers CBR peuvent présenter un problème plus grave; la qualité transitoire diminue illustrée à la figure 1.

Segment 3:Les problèmes de qualité transitoire de CBR Sont Beaucoup Plus préoccupants

Lorsque vous encodez des clips difficiles en paramètres agressifs, l’encodage CBR peut provoquer des problèmes de qualité passagère graves comme ceux illustrés à la figure 1. La figure 6 est l’écran de visualisation des résultats de l’outil VQMT de l’Université de Moscou, qui montre les scores VQM (meilleurs scores inférieurs) pour deux fichiers. Le fichier en rouge a été encodé en utilisant un VBR contraint à 110%, tandis que le fichier en bleu est CBR. Les pics de données encerclés montrent des trames, ou des groupes de trames, où la qualité du fichier CBR a considérablement souffert par rapport au fichier VBR contraint à 110%. Le pire de ces écarts est illustré à la figure 1.

Figure 6. Les pics de débit de données dans la figure du bas montrent des trames, ou des groupes de trames, où la qualité CBR est nettement inférieure à 110% contrainte.

Ce qui est intéressant, c’est que le débit binaire maximal du fichier CBR dépasse en fait celui du fichier VBR. Vous pouvez le voir sur la figure 7, qui montre la visionneuse de débit binaire analysant le fichier CBR (en haut) et le fichier VBR. Les buffets à droite affichent les débits binaires moyens et de pointe pour les deux fichiers. La moyenne est presque identique, tandis que le débit de pointe pour le fichier CBR est de 2623 kbps par rapport à 2539 kbps pour le fichier VBR contraint à 110% (mais voir la note 5 ci-dessous). Que votre préoccupation soit l’efficacité du streaming, en tenant compte des recommandations de variabilité de 110% d’Apple, ou des deux, le VBR contraint obtient un résultat supérieur, tout en offrant une qualité globale supérieure et en évitant les baisses de qualité transitoires observées dans le fichier CBR.

Figure 7. Visionneuse de débit binaire analysant le fichier CBR en haut et le fichier VBR contraint à 110% en bas.

Vous pouvez regarder une courte vidéo illustrant et expliquant ces problèmes immédiatement ci-dessous.

Cette vidéo illustre les problèmes de qualité transitoires parfois observés avec la vidéo CBR. Meilleur affichage en plein écran (cliquez sur l’icône en bas à droite dans la fenêtre de lecture).

Sans surprise, les résultats de notre enquête ont révélé que la contrainte de pourcentage la plus fréquemment utilisée par les répondants était de 110% de la cible, bien qu’il soit vrai que, comme pour les résultats de l’enquête en général, le nombre de répondants est trop faible pour être statistiquement significatif.

Figure 8. 110 % de l’objectif était la contrainte la plus courante.

Segment 4: De nombreux producteurs Ignorent la recommandation de variabilité de 110% d’Apple

La figure 9 montre certains des résultats les plus intéressants de l’enquête. Autrement dit, parmi ceux qui produisent des fichiers HLS, la majorité des producteurs ignorent entièrement la recommandation d’Apple. Fait intéressant, la seule question démographique posée dans l’enquête était le nombre de fichiers vidéo produits chaque semaine. Dix répondants ont indiqué qu’ils produisaient plus de 100 fichiers par semaine; de ce groupe, cinq suivaient religieusement la recommandation d’Apple, cinq l’ignoraient complètement.

Figure 9. La plupart des producteurs ignorent la recommandation d’Apple.

Une question de suivi intéressante aurait été de savoir si les répondants qui ont ignoré la restriction distribuaient sur des appareils iOS via une application. Malheureusement, nous n’avons pas posé cette question, laissant ouverte la crainte qu’Apple rejette les applications lorsque la vidéo lue par l’application ne répond pas à l’exigence de variabilité de 110%.

Segment 5: Conclusions

1. Dans tous les tests, CBR a fourni la qualité globale la plus basse de toutes les alternatives de débit binaire.

2. Dans tous les tests sauf un, le VBR contraint a fourni la meilleure qualité

3. Avec des séquences difficiles et des paramètres d’encodage agressifs, la vidéo codée par CBR peut présenter des baisses de qualité transitoires, parfois dramatiques.

4. Produire en utilisant un VBR contraint à 110% semble éviter ces problèmes de qualité sans introduire de variabilité significative du débit de données.

5. Dans la plupart des cas, l’encodage avec un VBR contraint à 200% offre la qualité maximale.

6. De nombreux producteurs ignorent la recommandation d’Apple de produire des fichiers HLS avec une variabilité maximale de flux de 110%.

Segment 6: Recommandations

1. Les producteurs qui utilisent actuellement le CBR pour certains ou la totalité de leurs codes devraient envisager de passer au VBR contraint.

•* Un VBR contraint à 110% devrait éviter les problèmes de qualité transitoires.

• Le VBR contraint à 200% offrira la meilleure qualité absolue.

2. Les producteurs distribuant des vidéos HLS via une application devraient probablement choisir un VBR contraint à 110% pour éviter les problèmes d’approbation de l’App Store lors de la soumission initiale ou lors de la soumission des mises à jour. Ceux qui expédient pour la lecture sur ordinateur de bureau et mobile basée sur un navigateur (par exemple, sans application) devraient envisager un VBR contraint à 200%.

3. Ces résultats varieront selon le codec et l’outil d’encodage. Comme décrit ci-dessous, nous avons produit tous les fichiers de ces tests en FFmpeg en utilisant le codec x264. Nous avons observé des problèmes de qualité transitoires avec les fichiers CBR dans d’autres outils d’encodage basés sur x264, mais ils peuvent ne pas apparaître dans tous les outils d’encodage.

4. Tout changement d’encodage majeur tel que ceux recommandés ici ne doit pas être mis en œuvre sans tests pour assurer la qualité et la jouabilité.

Annexe I:Comment Nous avons testé

Voici une brève description des procédures utilisées pour ces tests.

1. Nous avons produit tous les fichiers en utilisant FFmpeg sur une station de travail HP Z840 exécutant Windows 7 Professional avec 64 Go de RAM.

2. Les paramètres d’encodage généraux étaient des images clés toutes les 3 secondes et le préréglage veryslow.

3. Nous avons produit des fichiers CBR en utilisant le même débit cible, le même débit maximal et un paramètre de tampon d’une seconde de vidéo. Pour les cibles de 4 mbps, la chaîne était :

-b:v 4000k

– maxrate 4000k

– bufsize 4000k

4. Nous avons produit des fichiers VBR contraints en ajustant le paramètre de débit maximum et en utilisant une valeur de tampon de 1 seconde. Pour une cible de 4 mbps avec un CBR contraint à 110%, la chaîne était :

-b:v 4000k

– maxrate 4400k

– bufsize 4000k

Pour CBR et VBR, le codage avec un tampon plus grand a amélioré la qualité du flux, mais il a également augmenté la variabilité du flux.

5. Nous avons produit les fichiers CBR analysés dans les figures 6 et 7, et dans la vidéo, en utilisant le CBR à 1 passe, ce qui a augmenté la qualité du fichier par rapport au 2 passes (voir tableau 1), mais a également augmenté la variabilité du fichier. L’encodage avec CBR 1 passe a également produit des fichiers bien en dessous de la cible, nous avons donc dû encoder plusieurs fois à des débits de plus en plus élevés pour atteindre le débit de données cible. L’utilisation de l’encodage CBR à 2 passes fournit des fichiers de qualité légèrement inférieure, mais également une plus grande précision du débit de données et une variabilité réduite du flux.

6. Nous avons vérifié que le débit de données cible de tous les fichiers se situait à moins de 5% de la cible.

7. Nous avons produit tous les scores de qualité inclus ci-dessus à l’aide de l’Outil de Mesure de la Qualité vidéo de l’Université de Moscou.

À propos du Centre d’apprentissage en streaming

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.