概要(MPD)
多くのストリーミングプロデューサーは、配信のための最も効率的なストリームを作成するため、またはhttpライブストリーミング(Hls)の認識されているAppleの要件に準拠するために、ビットレート制御技術としてconstant bitrate encoding(CBR)を使用しています。 しかし、CBRはすべてのビットレート制御技術の中で最も低い全体的な品質を提供し、図1に示すような劇的な過渡的な品質問題の可能性をもたらします。
図1. CBRとVBRエンコーディングの比較(フルサイズ表示のための画像をクリックしてください)。
最近の調査では、多くの生産者が可変ビットレートエンコーディング(VBR)に切り替えており、前述のAppleの推奨事項を無視していることが示されています。 テストでは、110%制約されたVBRがCBRエンコードによって引き起こされる一時的な品質問題を回避することが明らかになりました。 まだCBRを使用しているプロデューサーは、これらの一時的な品質の問題を回避し、全体的なビデオ品質を向上させるために制約されたVBRに切り替
セグメント1:ビットレート制御は、各圧縮ファイルに対して選択された最も基本的なエンコードオプションの一つです
ストリーミング配信用 これは、Adobe Media Encoderの図2に示されています。
図2。 Adobe Media Encoderで使用可能なビットレート制御技術。
最も一般的な二つのテクニックは次のとおりです:シーンの複雑さに関係なく、ファイル全体に同じビットレートが適用されます。
•Constant bitrate encoding(CBR)。 CBRでは、ターゲットビットレートを設定しますが(図2)、最大値は設定しません。これは、ビットレートが大きく変化することは想定されていませんが、図3に示すように、通常はある程度制限されているためです。
図3は、CBRを使用してエンコードされたファイルを示しています。 右側の凡例でわかるように、平均ビットレートは4936kbpsであり、ピークは5557kbpsです。 波状の水色の線は、ファイルの期間にわたって最小限に変化する浮動データレートです。 個々の列は、この29.97fpsファイルで3秒ごとにキーフレームを持つ、ファイル内の各エンコードされた画像グループのサイズです。
図3. ビットレートビューアでCBRエンコードされたファイル。CBRは決して完全な平坦線ではないことに注意してください。約5-10%の変動は正常です。
•可変ビットレートエンコーディング(VBR)、同じ全体的なターゲットデータレートが満たされますが、データレートはシーンの複雑さに一致するようにファイルの VBRを使用すると、ターゲットと最大値(図2)を設定し、一部のアプリケーションでは最小値も設定します。 最大値を設定すると、VBRエンコーディングは制約付きと見なされ、VBRは多くの場合、制約の割合で記述されます。 図2では、最大ビットレートは2.4Mbps、つまりターゲットビットレートの1.2Mbpsの200%です。 この手法は、200%制約付きVBRと呼ばれます。
図4は、図3と同じファイルを200%制約付きVBRを使用して5000kbpsの同じターゲットビットレートにエンコードしたものを示しています。 平均ビットレートはほぼ同じです(4988kbps対4936kbps)が、ピークビットレートは9301kbpsであり、200%ではありませんが、球場ではありません。 波状の青色のデータレートラインは、図3よりもはるかに大きく変化し、開始時のレートが低く、全体にピークがあります。
図4。 同じファイルは200%制約されたVBRを使用してエンコードされます。
•多くのプロデューサは、エンコードの一部またはすべてに対してCBRをデフォルトにします。 ストリーミングの初期には、接続が非常に制約されていたため、スムーズな再生を停止する可能性のあるデータレートのスパイクを避けるためにCBRが推奨 Apple Technote TN2224では、Appleは”ビットレートの変動–目標ビットレートの10%を超えてはならない。”さらに厄介なことに、Hlsストリームをテストするために使用されるツールであるAppleのMedia Stream Validatorは、ストリームセグメントビットレートがターゲットビットレートから10% 驚くことではないが、Streaming Learning Centerによる最近の調査では、16人中11人の回答者が、一部のストリームにCBRエンコードを使用していることを示しています(図5)。 確かに、回答者の数は統計的に有意であるには小さすぎますが、回答は情報提供目的で有効です。
図5。 16人中、11人の方が、”このレビューが参考になった”と投票しています。
図5に示すように、一定レート係数(CRF)やキャップされたCRFなど、他のビットレート制御手法が存在します。 しかし、彼らは最高の非常に限られたインスタンス(オーディオとスクリーンカムやPowerPointのビデオのような主に合成コンテンツ)で使用されているので、彼ら
セグメント2。 CBRはVBRよりも全体的に低い品質を提供します
表1は、Jan Ozerの今後の本”Encoding by The Numbers”のために実行された一連の品質比較の結果を示しています。 これらのテストでは、FFmpegを使用して720Pの解像度で2Mbpsにエンコードされたファイルが含まれ、Vqmスコアはモスクワ大学のビデオ品質測定ツール(VQMT)によ VQMでは、低いスコアが優れており、表では、赤のスコアが最悪であり、緑のスコアが最高です。p>
表1. 異なるビットレート制御技術のためのPSNR品質比較。
表1の品質デルタ列に注意してください。 最初のものは、グループ内の最低品質ファイルと最高品質ファイルの合計品質差を示しています。 第二は、110%と200%の制約付きVBRを使用してエンコードされたクリップの品質差を示しています。 ご覧のように、生産者は110%制約されたVBRを使用することで、一時的な品質問題を回避し、Appleの推奨事項の範囲内にとどまることができます。 しかし、生産者は可能な限り最高品質のファイルを求めており、Appleの推奨事項に無関心で、200%制約されたVBRを使用する必要があります。
すべてのテストケースで、2パスCBRは最悪の品質を提供し、6のうち5では、200%の制約付きVBRが最高の品質を提供しました。 唯一の例外は、1パスCBRが最高品質を提供したトーキングヘッドクリップでした。 この結果は異常であるように思われ、三つの低運動、トーキングヘッドクリップで行われた同様のテストでは、結果は表1の他のすべてのファイルと一致していた。 最高の変動は、最低と最高品質のクリップ(総品質デルタ列)の間に14.54%の品質差を示したビッグバックバニークリップで見られました。
全体的な品質の差は、他のほとんどのクリップでは比較的マイナーです。 実際には、それはおそらく通常の再生中にさえ観察できません。 しかし、場合によっては、CBRファイルがより深刻な問題を示す可能性があります。
セグメント3:CBRの過渡的な品質の問題は、はるかに関連しています
チャレンジングなクリップを積極的なパラメータにエンコードすると、CBRエンコーディングは図1に示すような深刻な過渡的な品質の問題を引き起こす可能性があります。 図6は、モスクワ大学のVQMTツールの結果の可視化画面で、2つのファイルのVQMスコア(スコアが低い方が良い)を示しています。 赤のファイルは110%制約されたVBRを使用してエンコードされ、青のファイルはCBRです。 丸で囲まれたデータスパイクは、CBRファイルの品質が110%制約されたVBRファイルと比較して劇的に苦しんだフレーム、またはフレームのグループを示しています。 これらの差のうち最悪のものを図1に示します。
図6. 下の図のデータレートのスパイクは、CBR品質が110%の制約よりも劇的に悪いフレーム、またはフレームのグループを示しています。興味深いのは、CBRファイルのピークビットレートが実際にVBRファイルのピークビットレートを超えていることです。 これは、CBRファイル(上)とVBRファイルを分析するBitrate Viewerを図7に示しています。 右側のサイドボードには、両方のファイルの平均ビットレートとピークビットレートが表示されます。 平均はほぼ同じですが、CBRファイルのピークレートは2623kbpsで、110%の制約付きVBRファイルの2539kbpsと比較しています(ただし、以下の注5を参照)。 ストリーミング効率、Appleの110%の変動性の推奨事項、またはその両方に注意することが懸念されるかどうかにかかわらず、constrained VBRは優れた結果を達成し、全体的に高品質を提供し、CBRファイルに見られる一時的な品質低下を回避します。
図7。 ビットレートビューアは、CBRファイルを上に、110%制約されたVBRファイルを下に分析します。あなたはすぐ下にこれらの問題を説明し、説明する短いビデオを見ることができます。
あなたはすぐにこれらの問題を説明し、説明します。
このビデオは、CBRビデオで時々見られる一時的な品質の問題を示しています。 最高のフルスクリーンで表示(再生ウィンドウ内の右下のアイコンをクリックしてください)。
おそらく驚くことではないが、私たちの調査結果は、回答者が使用する最も一般的な割合の制約が目標の110%であることを明らかにしたが、確かに、一般的な調査結果と同様に、回答者の数は統計的に有意であるには小さすぎる。
図8. 目標の110%が最も一般的な制約でした。
セグメント4: 多くの生産者は、Appleの110%の変動勧告を無視します
図9は、調査のより興味深い結果のいくつかを示しています。 つまり、HLSファイルを作成している人のうち、大部分の生産者はAppleの推奨を完全に無視しています。 興味深いことに、調査で尋ねられた1つの人口統計学的質問は、毎週生成されるビデオファイルの数でした。 このグループのうち、5人はappleの勧告に宗教的に従っており、5人はそれを完全に無視していました。
図9。 ほとんどの生産者はAppleの勧告を無視しています。興味深いフォローアップの質問は、制限を無視した回答者がアプリを介してiOSデバイスに配布していたかどうかでした。
興味深い質問は、制限を無視した回答者がiOSデバイスに配布していたかどうかでした。 残念ながら、私たちはその質問をしませんでしたが、アプリで再生されたビデオが110%の変動要件を満たしていない場合、Appleがアプリを拒否するという懸念を開いたままにしています。
セグメント5:結論
1. すべてのテストで、CBRはすべてのビットレートの選択肢の中で最も低い全体的な品質を提供しました。
2. 1つを除くすべてのテストで、constrained VBRは最高品質を提供しました
3。 挑戦的な映像と積極的なエンコーディングパラメータでは、CBRエンコードされたビデオは一時的な品質低下を示すことがあります。
4. 110%制約されたVBRを使用して生産することは、重要なデータレートの変動を導入することなく、これらの品質の問題を回避するように思われます。
5. ほとんどの場合、200%制約されたVBRを使用したエンコードは、最大の品質を提供します。
6. 多くの生産者は、最大110%のストリーム変動性を持つHlsファイルを生成するために、Appleの勧告を無視しています。
セグメント6:推奨事項
1. 現在、一部またはすべてのエンコードにCBRを使用しているプロデューサーは、制約付きVBRへの切り替えを検討する必要があります。
•110%制約されたVBRは、一時的な品質の問題を避ける必要があります。200%制約されたVBRは絶対的な最高の品質を提供します。
2. アプリを介してHLSビデオを配信するプロデューサーは、最初に提出するときや更新を提出するときにApp Storeの承認の問題を避けるために、おそらく110%制約されたVBRを選択する必要があります。 ブラウザベースのデスクトップおよびモバイル再生(アプリなしなど)の場合は、200%制限されたVBRを考慮する必要があります。
3. これらの結果は、コーデックとエンコーディングツールによって異なります。 以下で説明するように、これらのテスト用のすべてのファイルをFFmpegでx264コーデックを使用して作成しました。 私たちは、他のx264ベースのエンコーディングツールでCBRファイルとの一時的な品質の問題を観察してきましたが、彼らはすべてのエンコーディングツール
4. ここで推奨されるような大きなエンコーディングの変更は、品質とプレイアビリティを確保するためにテストせずに実装すべきではありません。
付録I:テスト方法
ここでは、これらのテストに使用される手順の簡単な説明です。
1. 私たちは、64GBのRAMを搭載したWINDOWS7Professionalを実行しているHP Z840ワークステーションでFFmpegを使用してすべてのファイルを作成しました。
2. 一般的なエンコードパラメータは、3秒ごとにキーフレームとveryslowプリセットでした。
3. 同じターゲットビットレート、最大ビットレート、およびビデオの一秒のバッファ設定を使用してCBRファイルを生成しました。 4mbpsターゲットの場合、文字列は次のとおりです。
-b:v4000k
-maxrate4000k
-bufsize4000k
4。 Max rateの設定を調整し、1秒のバッファ値を使用して制約付きVBRファイルを作成しました。 110%制約されたCBRを持つ4mbpsターゲットの場合、文字列は次のとおりです。
-b:v4000k
-maxrate4400k
-bufsize4000k
CBRとBUFSIZE4000k
CBRとbufsize4000k
vbrは、より大きなバッファでエンコードすると、ストリーム品質が向上しましたが、ストリームの変動性も増加しました。
5. 図6と図7、およびビデオで分析したCBRファイルを1パスCBRを使用して作成しました。これにより、2パス(表1参照)と比較してファイルの品質が向上しましたが、ファイルの変動性も向上しました。 1パスCBRを使用したエンコードでは、ターゲットよりもはるかに低いファイルが生成されるため、ターゲットのデータレートを満たすために、より高いレートで複数回エンコードする必要がありました。 2パスCBRエンコーディングを使用すると、わずかに低い品質のファイルだけでなく、データレートの精度が向上し、ストリームの変動が減少します。
6. すべてのファイルの目標データレートが目標の5%以内であることを確認しました。
7. モスクワ大学のビデオ品質測定ツールを使用して、上記に含まれるすべての品質スコアを作成しました。