日立製作所は17日、映像のテロップの文字を90%以上の精度で読み取れる技術を発表した。 同技術は、複数行のテロップや黒文字と白文字が同一行で使用されているような複雑なテロップなど、テロップの形やデザインにかかわらず文字抽出を行い、抽出後に文字データへの変換を行うというもの。テロップをもとに膨大な映像コンテンツの中から見たいシーンをキーワードですばやく見つけ出すという次世代映像検索の基本技術となる。 複数行で構成されるテロップでは、映像からテロップ出現時刻とテロップ領域を検出し、テロップ領域から文字部分だけを抽出した上で文字列部分から各文字映像を抽出する。また、明暗反転文字が混在したテロップでは、そこが文字なのか背景なのかを判別する新アルゴリズムを開発し、文字を正しく抽出することを可能としている。