このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。
2007年7月24日
数百万件の画像データベースから
1秒以内で類似した画像・映像を検索できる技術を開発
検索に用いる画像特徴量データの保存方法を工夫し、
大規模データベースの高速検索を可能に
株式会社日立製作所(執行役社長:古川 一夫/以下、日立)は、このたび、数百万件の大規模な画像・映像データの中から、指定した画像と類似した画像を1秒以内で高速検索できる類似画像検索技術を開発しました。類似画像検索技術は「見た目が似ている」画像を検索する技術で、画像間の類似性の評価は、画像の色の分布や形状等、画像自体が持つ情報を自動的に抽出し、高次元の数値情報として表現した「画像特徴量」に基づいて行われます。類似画像検索技術自体は、すでに実用化されていますが、検索時の処理量が大きく、これまで大規模なデータを扱うことは困難でした。
今回、日立は、画像データを保存する時に、類似したデータ同士をまとめる「クラスタリング処理」と、画像特徴量のデータをハードディスクドライブ(以下、HDD)に保存する際の記録場所の最適化を行うことにより、高速かつメモリ消費量を抑えた検索ができる技術を開発しました。これにより、
PCを用いて数百万件規模の画像データの中から類似した画像を検索した場合、1秒以内で検索することが可能となります。本技術は映像検索にも適用可能で、例えば、10,000時間分の映像の中から、好きな芸能人が出ているシーンを瞬時に検索する、といった画像・映像検索アプリケーションを実現できます。
通信のブロードバンド化やHDD等の記憶装置の大容量化、デジタルカメラ等の各種撮像機器の普及によりに、PCで大量の画像・映像を扱うことができる時代となっています。今後、さらに取り扱うデータ量が増加することが見込まれることから、大規模な画像・映像データを有効に利用するため、目的の画像を高速に検索できる技術が求められています。
画像検索技術としては、画像自体が持つ視覚情報(色分布、質感、構図等)に基づいて検索を行う「類似画像検索技術」と呼ばれる技術が、すでに実用化されています。類似画像検索では、検索の対象となる画像から、視覚的な情報を数100次元の数値列データ(画像特徴量)で示し、データ間の「似ている度合い(類似度)」を、この画像特徴量の違い(画像特徴量ベクトル間の距離)で評価します。類似画像検索を行う場合は、この数100次元の画像特徴量の違いを計算する必要があるため、検索対象が数百万件規模になると、その演算量は膨大なものとなります。このように、大規模なデータベースの類似画像検索の実現には、検索時間の高速化が課題となっていました。
今回日立は、PCを使って、数百万件規模の画像・映像データから、1秒以内(数100ミリ秒)で目的の画像と類似した画像の検索が可能な、高速かつ低コストの類似画像検索技術を開発しました。本技術は、画像データを登録する際の画像特徴量データの保存方法を工夫したもので、値の近い画像特徴量データを一つのグループにまとめる「クラスタリング処理」と、平均画像特徴量の類似したクラスタ同士を近くに配置する最適化処理を特長としています。本技術によって、例えば、10,000時間分の映像の中から、好きな芸能人が出ているシーンを瞬時に検索する、といったアプリケーションが実現できます。また、個人が撮影した画像・映像の管理にも効果的な技術であると考えています。
技術の詳細
(1) クラスタリングを用いた2段階検索技術による高速類似画像検索
高速検索を実現するため、PCのメモリとHDDを用いた2段階の検索技術を開発しました。本技術では、画像データ登録を行う際に、クラスタリング処理によって、類似した画像の特徴量データをクラスタという単位に分割しながら保存していきます。各クラスタは、それに含まれる画像特徴量データの平均値で表され、この値がメモリ上に書き込まれます。検索では、まず、クラスタに対する類似検索を行い、入力画像と類似した平均値を持つクラスタを複数個取得し、次に、選定されたクラスタ中の画像について、類似検索を実行します。効率的な検索を行うことで、大規模なデータに対しても検索を高速化することが可能となります。また、クラスタの代表特徴量のみをメモリ上に書き込むため、省メモリ化を実現しました。
(2) HDD上データ配置の最適化による読み出しの高速化
高速検索を行うには、HDD上に保存されている画像特徴量の読み出しを高速化する必要があります。本技術では、画像特徴量の記録をクラスタ単位で行うことにより、同一クラスタ内のデータの画像特徴量が、HDD上で連続的に配置されるようにします。また、クラスタの配置についても、類似したクラスタがHDD上で近接して配置されように最適化処理を行います。これらの処理によって、検索におけるHDD上での読み出し位置の移動が、なるべく小さくなるように工夫しています。
本技術は、業務用や個人のPCに大規模な画像や映像データを保存するブロードバンド時代における高速類似画像検索法として、期待できる技術です。
本研究には、経済産業省の国家プロジェクト「技術研究組合新情報処理開発機構」(RWCプロジェクト)に参画して得られた成果が利用されています。
なお、本技術は、日立が7月25日(水)、26日(木)に東京国際フォーラムにて開催する「日立uVALUEコンベンション2007」に出展します。
関連情報
お問い合わせ先
株式会社日立製作所 中央研究所 企画室 [担当:花輪、木下、河合]
〒185-8601 東京都国分寺市東恋ヶ窪一丁目280番地
TEL : 042-327-7777 (直通)
以上
PDF形式のファイルをご覧になるには、Adobe Systems Incorporated(アドビシステムズ社)のAdobe(R) Reader(TM)が必要です。