キャプション[動画]

音声付きの動画にはキャプションを提供して、動画の音声が伝えている情報を再生中の画面にテキストで表示できるようになっているか。

解説

動画の音声が伝えている情報は、動画の音声を聴くことができないユーザーには伝わらないことがあります。そのため、動画にはキャプションを提供して、ユーザーが音声を聴くことができなくても、動画のコンテンツを理解できるようにしましょう。

動画の音声を聴くことができないケースとしては、次のような例が挙げられます。

  • 聴覚障害があるため、音声を聴くことができない、または聴き取りづらい。
  • 周囲が静かで音声を出すことができない場所にいる(例:オフィス、図書館)。
  • 周囲に人がいるため音声を出すことができない(例:電車やバスの車内、エレベーターの中、病院の待合室)
  • 周囲が騒がしくて音声が聴きとれない(例:スポーツバーや居酒屋の店内)
  • 赤ちゃんや子どもを寝かしつけたばかりで、音声を出せない。

キャプションは、動画の登場人物の発話内容だけでなく、動画のコンテンツを理解するのに必要な音声を全て文字にします。

  • 登場人物の発話内容
  • BGMなどの音楽
  • 拍手、歓声
  • 環境音(電話の呼出音、ドアが開閉する音、チャイム、雷鳴など)

動画にキャプションを提供するのは困難だと考えられてきました。しかし、近年はYouTubeの自動字幕起こし機能を使うと自動音声認識技術によって文字起こしできるので、不正確な箇所を修正して仕上げることができるなど、難易度や工数の負担は格段に下がってきています。

例えば、BGMが流れていることをどのようにキャプションの文字で表記するかなど、キャプションの文字の表記ルールは、これまで特に定められたものがありませんでした。テレビ番組で提供されているキャプションにおいても、テレビ局ごとに個別のガイドラインで運用しているのが現状のようです。

ただ、2018年になって「ISO/IEC 20071-23:2018」(規格の名称は、”Information technology – User interface component accessibility – Part 23: Visual presentation of audio information (including captions and subtitles)”)という国際規格が新たに制定されたので、今後はその内容が基本になっていくかもしれません。

事例 1. キャプション

悪い例 1.

画面イメージ:キャプションのない動画

動画にキャプションが提供されていないため、音声を聴くことができないユーザーは動画の音声だけが伝えているコンテンツを理解することができない。

良い例 1.

画面イメージ:キャプションが表示されている動画

YouTubeで動画を公開してキャプションも提供しているので、ユーザーは必要に応じてキャプションを表示して、音声が伝えている情報を読み取ることができる。

WCAG 2.0の達成基準

1.2.2 キャプション(収録済)(レベル A)
同期したメディアに含まれているすべての収録済の音声コンテンツに対して、キャプションが提供されている。ただし、その同期したメディアがメディアによるテキストの代替であって、メディアによる代替であることが明確にラベル付けされている場合は除く。

WCAG 2.0「1.2 時間依存メディア」