Summary (MPD)
Mnoho streaming výrobci použít konstantní datový tok kódování (CBR) jako datový tok řídicí technika, a to buď ve snaze vytvořit co nejúčinnější proud pro dodávky, nebo v souladu s vnímanou požadavky Apple HTTP Live Streaming (HLS). Nicméně, CBR přináší nejnižší celkovou kvalitu všech datový tok řídicí techniky a představuje potenciál pro dramatické přechodné problémy s kvalitou, jako jsou uvedeny na Obrázku 1.
Obrázek 1. Porovnání kódování CBR vs. VBR (klikněte na obrázek pro zobrazení v plné velikosti).
nedávný průzkum naznačuje, že mnoho výrobců přešlo na kódování variable bitrate (VBR) a ignoruje výše uvedená doporučení společnosti Apple. Testování ukazuje, že 110% omezený VBR zabraňuje přechodným problémům s kvalitou způsobeným kódováním CBR. Výrobci stále používají CBR by měli zvážit přechod k omezené VBR, aby se zabránilo tyto přechodné problémy s kvalitou a zlepšit celkovou kvalitu videa.
Segment 1: Bitrate control je jednou z nejzákladnějších možností kódování vybraných pro každý komprimovaný soubor
kdykoli zakódujete Soubor pro distribuci streamování, zvolíte bitrate a techniku řízení datového toku. To je znázorněno na obrázku 2, z Adobe Media Encoder.
Obrázek 2. Techniky řízení datového toku jsou k dispozici v kodéru Adobe Media Encoder.
dvě nejběžnější techniky jsou:
• Constant bitrate encoding (CBR), kde stejný datový tok je aplikován na celý soubor, bez ohledu na složitost scény. S CBR nastavíte cílový datový tok (Obrázek 2), ale ne maximální, protože datový tok se nemá výrazně lišit, ačkoli to obvykle dělá v určité omezené míře, jak je znázorněno na obrázku 3.
obrázek 3 ukazuje soubor kódovaný pomocí CBR. Jak vidíte v legendě vpravo, průměrný datový tok je 4936 kbps, zatímco vrchol je 5557 kbps. Vlnitá Světle modrá čára je plovoucí datová rychlost, která se v průběhu trvání souboru mění minimálně. Jednotlivé sloupce jsou velikost každé kódované skupiny obrázků v souboru, s klíčovým snímkem každé tři sekundy v tomto souboru 29.97 fps.
obrázek 3. Soubor kódovaný CBR v prohlížeči Bitrate.
Všimněte si, že CBR není nikdy úplná rovná čára; variabilita asi 5-10% je normální.
• Variable bitrate encoding (VBR), kde je splněna stejná celková cílová rychlost přenosu dat, ale rychlost přenosu dat se mění v průběhu trvání souboru tak, aby odpovídala složitosti scény. Pomocí VBR nastavíte cíl a Maximum (Obrázek 2) a v některých aplikacích také minimum. Když nastavíte maximum, kódování VBR je považováno za omezené a VBR je často popisováno procentem omezení. Na obrázku 2 je maximální datový tok 2,4 Mbps nebo 200% cílového datového toku 1,2 Mbps. Tato technika by se nazývala 200% omezená VBR.
obrázek 4 ukazuje stejný soubor jako obrázek 3 kódovaný pomocí 200% omezeného VBR na stejný cílový datový tok 5000 kbps. Průměrný datový tok je přibližně stejný (4988 kbps vs. 4936 kbps), ale maximální přenosová rychlost je 9301 kbps, ne tak docela, 200%, ale v ballpark. Vlnitá modrá čára rychlosti přenosu dat se liší mnohem významněji než na obrázku 3, s nízkými rychlostmi na začátku, a vrcholy v celém textu.
obrázek 4. Stejný soubor kódovaný pomocí 200% omezené VBR.
* mnoho výrobců výchozí CBR pro některé nebo všechny jejich kódování. V prvních dnech streamování byla připojení tak omezená, že CBR bylo doporučeno, aby se zabránilo špičkám rychlosti přenosu dat, které by mohly zastavit plynulé přehrávání. V Apple Technote TN2224 Apple uvádí “ variabilita bitové rychlosti-by neměla překročit 10% cílového datového toku.“Více zlověstně, Apple Media Stream Validator, nástroj používaný k testování proudů HLS, vytvoří varování, pokud se datový tok segmentu toku liší od cílového datového toku o více než 10%. Není divu, že v nedávném průzkumu streamingového Vzdělávacího centra 11 ze 16 respondentů uvedlo, že pro některé ze svých streamů stále používají kódování CBR (obrázek 5). Je pravda, že počet respondentů je příliš malý na to, aby byl statisticky významný, i když odpovědi jsou platné pro informační účely.
obrázek 5. Jedenáct z 16 respondenti stále používali CBR na některých svých proudech, stejně jako jiné techniky.
jak vidíte na obrázku 5, existují další techniky řízení datového toku, včetně faktoru konstantní rychlosti (CRF) a omezeného CRF. Protože se však nejlépe používají ve velmi omezených případech (většinou syntetický obsah, jako jsou screencams a PowerPoint videa se zvukem), nejsou do této diskuse zahrnuty.
Segment 2. CBR Přináší Celkové Nižší Kvality, než VBR
Tabulka 1 ukazuje výsledky jednoho nastavení kvality srovnání kandidovat Jan Ozer nadcházející kniha, Kódování podle Čísel, které má vyjít v létě 2016. Tyto testy zahrnovaly soubory kódované do rozlišení 720p při 2 Mbps pomocí FFmpeg, s skóre VQM měřeným nástrojem pro měření kvality videa na Moskevské univerzitě (Vqmt). S VQM jsou nižší skóre lepší a v tabulce jsou skóre v červené barvě nejhorší, skóre v zelené nejlepší.
Tabulka 1. Porovnání kvality PSNR pro různé techniky řízení datového toku.
poznamenejte si sloupce kvality delta v tabulce 1. První ukazuje celkový rozdíl kvality mezi souborem nejnižší a nejvyšší kvality ve skupině. Druhý ukazuje rozdíl v kvalitě mezi klipy kódovanými pomocí 110% a 200% omezených VBR. Jak uvidíte, výrobci se mohou vyhnout přechodným problémům s kvalitou a zůstat v souladu s doporučeními Apple pomocí 110% omezené VBR. Výrobci, kteří hledají soubor nejvyšší možné kvality a kteří nejsou v souladu s doporučeními společnosti Apple, by však měli používat 200% omezený VBR.
ve všech testovacích případech 2 Pass CBR dodal nejhorší kvalitu a v pěti ze šesti 200% omezených VBR dodalo nejvyšší kvalitu. Jedinou výjimkou byla klip talking head, kde 1 pass CBR dodával nejvyšší kvalitu. Tento výsledek se jeví jako anomálie; v podobných testech prováděných na klipech se třemi nízkými pohyby, mluvící hlavou, výsledky byly v souladu se všemi ostatními soubory v tabulce 1. Nejvyšší variabilita byla vidět v Big Buck Bunny klip, který ukázal 14.54% kvalita rozdíl mezi nejnižší a nejvyšší kvalita spony (Total Quality Delta sloupec).
celkový rozdíl kvality je jinak relativně malý ve většině ostatních klipů. Ve skutečnosti to pravděpodobně není ani pozorovatelné během normálního přehrávání. V některých případech však mohou soubory CBR vykazovat závažnější problém; přechodné poklesy kvality znázorněné na obrázku 1.
Segment 3: CBR je Přechodné Problémy s Kvalitou Jsou Mnohem Víc O
Když jste kódování náročné klipy agresivní parametry, CBR kódování může způsobit vážné, přechodné problémy s kvalitou, jako jsou uvedeny na Obrázku 1. Obrázek 6 je obrazovka vizualizace výsledků z nástroje Moskevské univerzity Vqmt, která ukazuje skóre VQM (nižší skóre lepší) pro dva soubory. Soubor v červené barvě byl kódován pomocí 110% omezené VBR, zatímco soubor v modré barvě je CBR. Kruhové datové hroty ukazují rámce nebo skupiny rámců, kde kvalita souboru CBR dramaticky utrpěla ve srovnání se 110% omezeným souborem VBR. Nejhorší z těchto diferenciálů je znázorněno na obrázku 1.
obrázek 6. Hroty rychlosti přenosu dat na spodním obrázku ukazují rámce nebo skupiny rámců, kde kvalita CBR je dramaticky horší než 110% omezená.
zajímavé je, že maximální přenosová rychlost souboru CBR ve skutečnosti převyšuje rychlost souboru VBR. Můžete to vidět na obrázku 7, který ukazuje Bitrate Viewer analyzující soubor CBR (nahoře) a soubor VBR. Příborníky vpravo ukazují průměrné a špičkové přenosové rychlosti pro oba soubory. Průměr je téměř totožný, zatímco maximální rychlost pro soubor CBR je 2623 kbps ve srovnání s 2539 kbps pro 110% omezený soubor VBR (Ale viz poznámka 5 níže). Ať váš zájem je streaming účinnosti, dbát Apple 110% variability doporučení, nebo oba, omezený VBR dosahuje vynikající výsledek, zatímco také přináší celkově vyšší kvalitu a vyhnout přechodné klesá kvalita vidět v CBR souboru.
Obrázek 7. Bitrate Viewer analyzuje soubor CBR nahoru a 110% omezený soubor VBR na dně.
můžete sledovat krátké video ilustrující a vysvětlující tyto problémy bezprostředně níže.
toto video ilustruje přechodné problémy s kvalitou, které se někdy vyskytují u videa CBR. Nejlépe zobrazeno na celé obrazovce (klikněte na ikonu vpravo dole v okně přehrávání).
Možná, že není divu, že naše výsledky průzkumu vyplynulo, že nejčastější procentní omezení použít respondentů byl 110% cíle, i když je pravda, jak s výsledky průzkumu obecně platí, že počet respondentů je příliš malý, aby mohl být statisticky významný.
Obrázek 8. 110% cíle bylo nejčastějším omezením.
Segment 4: Mnoho Výrobců Ignorovat Apple 110% Variability Doporučení
Obrázek 9 ukazuje některé zajímavější výsledky průzkumu. To znamená, že z těch, kteří vyrábějí soubory HLS, většina výrobců zcela ignoruje doporučení společnosti Apple. Zajímavé je, že jednou demografickou otázkou položenou v průzkumu byl počet video souborů vyrobených každý týden. Deset respondentů uvedlo, že produkují více než 100 souborů týdně; z této skupiny pět následovalo doporučení společnosti Apple nábožensky, pět to zcela ignorovalo.
obrázek 9. Většina výrobců doporučení Applu ignoruje.
zajímavou následnou otázkou by bylo, zda respondenti, kteří ignorovali omezení, distribuovali do zařízení iOS prostřednictvím aplikace. Bohužel, jsme neměli ptát, odcházející otevřít obavy, že Apple bude odmítat aplikace, když video hraje aplikace nesplňuje 110% variability požadavek.
Segment 5: závěry
1. Ve všech testech CBR dodala nejnižší celkovou kvalitu všech alternativ bitrate.
2. Ve všech testech kromě jednoho dodávala omezená VBR nejvyšší kvalitu
3. S náročnými záběry a agresivními parametry kódování může Video kódované CBR vykazovat přechodné poklesy kvality, někdy dramatické.
4. Vyrábí pomocí 110% omezeny VBR zdá, aby se zabránilo tyto otázky kvality bez zavedení významná data rate variability.
5. Ve většině případů poskytuje kódování s 200% omezeným VBR maximální kvalitu.
6. Mnoho výrobců ignoruje doporučení společnosti Apple vyrábět soubory HLS s maximální variabilitou proudu 110%.
Segment 6: doporučení
1. Výrobci, kteří v současné době používají CBR pro některé nebo všechny jejich kódy, by měli zvážit přechod na omezený VBR.
• 110% omezený VBR by se měl vyhnout přechodným problémům s kvalitou.
• 200% omezený VBR bude poskytovat absolutně nejlepší kvalitu.
2. Výrobci distribuující video HLS prostřednictvím aplikace by si pravděpodobně měli vybrat 110% omezené VBR, aby se vyhnuli problémům se schválením App Store při počátečním odesílání nebo při odesílání aktualizací. Ti, kteří odesílají pro stolní a mobilní přehrávání založené na prohlížeči (např. žádná aplikace), by měli zvážit 200% omezené VBR.
3. Tyto výsledky se budou lišit podle kodeku a kódovacího nástroje. Jak je popsáno níže, všechny soubory pro tyto testy jsme vytvořili ve FFmpeg pomocí kodeku x264. Pozorovali jsme přechodné problémy s kvalitou CBR souborů v jiných x264 na bázi kódovacích nástrojů, ale nemusí se objevit ve všech kódovacích nástrojů.
4. Jakékoli zásadní změny kódování, jako jsou doporučené v tomto dokumentu, by neměly být implementovány bez testování, aby byla zajištěna kvalita a hratelnost.
Dodatek I: jak jsme testovali
zde je stručný popis postupů použitých pro tyto testy.
1. Všechny soubory jsme vyrobili pomocí FFmpeg na pracovní stanici HP Z840 se systémem Windows 7 Professional s 64 GB RAM.
2. Obecné parametry Kódování byly klíčové snímky každé 3 sekundy a předvolba veryslow.
3. Vytvořili jsme CBR soubory pomocí stejného cílového datového toku, max bitrate a nastavení vyrovnávací paměti jedné sekundy videa. Pro 4 mbps cíle, řetězec je:
-b:v 4000k
-maxrate 4000k
-bufsize 4000k
4. Vytvořili jsme omezené soubory VBR úpravou nastavení maximální rychlosti a použitím hodnoty vyrovnávací paměti 1 sekunda. Pro 4 mbps cíl s 110% omezeny CBR, řetězec je:
-b:v 4000k
-maxrate 4400k
-bufsize 4000k
Pro oba CBR a VBR, kódování s větší vyrovnávací paměť lepší kvalita streamu, ale také se zvýšil proud variabilita.
5. Vytvořili jsme CBR soubory analyzované na obrázcích 6 a 7 a ve videu pomocí 1-pass CBR, což zvýšilo kvalitu souboru ve srovnání s 2-pass (viz tabulka 1), ale také zvýšilo variabilitu souborů. Kódování s 1-pass CBR také produkoval soubory hluboko pod cíl, takže jsme museli kódovat více krát na stále vyšší sazby, aby vyhovovaly cílové přenosové rychlosti. Použití 2-pass CBR kódování přináší mírně nižší kvalitu souborů, ale také větší přesnost datové rychlosti a sníženou variabilitu proudu.
6. Ověřili jsme, že cílová rychlost dat všech souborů byla v rozmezí 5% cíle.
7. Vyrobili jsme všechny výsledky kvality uvedené výše pomocí nástroje pro měření kvality videa na Moskevské univerzitě.