富士通研究開発中心有限公司と富士通研究所は10日、オーバーヘッド型スキャナで、厚みのある冊子の見開きを撮影した際に生じる書面の歪みを、フラットに補正し読みやすい画像を生成する技術を開発したことを発表した。 従来、冊子の見開きなどの歪みを補正するには、特殊な模様を書面に投影してその模様の変化から歪みを推定したり、カメラを2台使うことで書面の歪みを推定し、補正処理を行っていた。1台のカメラのみで補正を行う方式もあるが、ページの谷間の文字が縦長になりやすいなど、歪みの正確な補正が困難だった。 今回、ページの輪郭線を正確に検出し、その結果から書面の高さを推定することで画像の歪みをフラットに補正する技術を開発した。まず低解像度の画像を用いてページの輪郭線を大まかに高速検出。次に、高解像度の画像を用いて先に求めた輪郭線をもとに微調整を行うことで、正確な輪郭線を検出する。このように2段階に分けて処理することで、高速かつ高精度な検出を可能にした。 また、輪郭線の形状をもとに隣接する場所との高さの差を推定し、差が大きい(湾曲が大きい)と判断した場合は大きな補正をかけることで、正しく補正するようにした。さらに、ページを押さえる指領域の自動検出・除去も併せて行う。 これらの技術によりA4サイズの見開きページを解像度300dpi相当で読み取る場合、約90%の精度で歪み補正を行い、約1.3秒での高速処理を実現したという。これにより、冊子を裁断することなく読み取り電子化することを可能とした。
なぜラジオのイベントが東京ドームを満員にできたのか? オールナイトニッポンPが初の著書『今、ラジオ全盛期。静かな熱狂を生むコンテンツ戦略』! 2025年1月1日 オールナイトニッポンの冨山雄一氏がラジオ業界の20年の変遷を…